TRONコードへの対応について

はじめに


当実装は、32ビットのバンク番号に、32ビットの文字番号、合わせて64ビットで一文字を管理しています。
この構成は、元々はTRONコードとUCS-4を丸呑みするために設計されたことに端を発します。

ということで、近く、開発中の実装のβバージョンの公開を計画しているわけですが、その前に、本当にTRONコードでの入出力が実現可能なのかどうかを検討しています。今さらですが。


内部バンク


内部では、TRONコードの「言語面」互換として、バンクが存在します。
64ビット長の文字コードの上位32ビットと思えばよいでしょう。

JIS X 0208、JIS X 0213、JIS X 0212、GB 2312、KS X 1001といった符号で読み込んだ場合は、原則として第1面の符号位置が与えられるように作られています。
このまま吐き出せば、TRONコードとして使える。
これが、古いiTecの頃からの実装の特徴でした。

しかし今回は、DLLが別れており、他のDLLには原則として関与しないことになっています。
この条件で、果たしてTRONコードの入出力は、どうやって処理すれば良いのでしょうか。


専用DLLにするか


TRONコードの処理は巨大化しそうな上に、複数の言語処理が混ざるため、専用DLLにしようと考えています。

そこで問題となるのは、JIS X 0208、JIS X 0213、JIS X 0212、GB 2312、KS X 1001などの変換表の扱いでしょうか。

特に問題なのは出力です。

例えば、UTF-8で入力してTRONのTADで出力する、といった処理を想定すると、これは「出力の時点」でUnicode→JIS/GB/KSの何れかへの変換、という方法を取る必要があります。

つまり、TRONコード処理にも、UnicodeからJIS X 0208、JIS X 0213、JIS X 0212、GB 2312、KS X 1001へ変換する変換表が必要になります。

また、入力時にも、アプリ・DLL間で使う構造体には、Unicodeも同時格納する必要があるため、各符号からUnicodeに変換する表も同時に必要になります。

CJKの各DLL用の変換表を、リンク時にちょいと拝借する必要がありそうです。
同じ変換表が複数のDLLに分散されるのはどうかとも思いますが、仕方有りませんね。



大漢和辞典とGT書体の文字


これは別項目にします。

2009/01/30(金)19:29 |Comments(0) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

諸橋大漢和辞典などとUnicodeの変換表 ホーム ARIB STD-B24 入出力
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR