TRONコード関係

想定仕様


・基本は準TADとする
・需要があれば正規のTADにも対応する
・優先出力先を、CCSとして指定できるようにする
  第一面、GT、大漢和、Big5、GB 18030 など。
  〓〓〓〓〓への対応も内部的には準備だけはしてある。
・第一面は更に、CJKで優先度を決められる。また0212と0213の優先度も決められる

・画像はもちろん、色だとかの情報は一切無視する。文字しか処理しない。
・但し、半角/全角の付箋だけは処理する。


現状


とりあえず、出力だけを簡単に書いてみた。

DLLは、ビルド時点で、CJKの各DLLで使っている変換表や、その変換表を参照する関数をスタティックリンクしているため、各言語処理と同様の変換が可能。

一応、動作中のモードは次の通り。
・日本語優先モード (TAD/JCK)
・日本語の補助漢字優先モード (TAD/JHCK)
これから作る予定のモード
・簡体字優先モード (TAD/CJK)
・簡体字優先モード補助漢字使用 (TAD/CJHK)


第一面で日本語(JIS X 0208/0213/0212)で出す分には、概ね問題なく出来ている。簡体字や朝鮮語も出ている。
一旦Unicodeを介してCJKを出力する処理も概ね出来ている。
0213の第四水準も、区とTRONコードの上位8バイトとの変換表を作ったので、問題なく出力できている。

仕様上は正しく出ていると思われ、他のTRONコードを吐き出す実装と同様の出力になっているとは思います。



半角全角


ASCII相当の文字はどうするか考えました。

日本語が優先されれば、第一面のJIS X 0208相当の文字に変換されるわけですが、JIS X 0208のいわゆる全角英数と区別が付かなくなる。
双方向変換性は可能ならば維持したいところ。

そこで、ASCII相当や、JIS X 0201カナ相当の前には、付箋を付ける機能を用意した。

良いのか分かりませんが、次のような仕様にした。

半角へ
0xa2 0xff 0x06 0x00 0x00 0x03 0x00 0x00 0x02 0x01
戻す
0xa2 0xff 0x06 0x00 0x00 0x03 0x00 0x00 0x00 0x00

リトルエンディアンだと分かりにくいけど、まぁ、こんな感じで。

2009/02/03(火)21:43 |Comments(0) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

DLL一覧機能 ホーム 諸橋大漢和とUnicodeの変換表 試案
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

04 | 2017/05 | 06
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR