94×94文字集合

仕様について


94×94文字集合とは、ISO/IEC 2022で、94文字集合を2バイト使って表わすものです。

ESC 2/4 ※ <F>

というエスケープシーケンス(但し、※は2/8、2/9、2/10、2/11のいずれか)で、<F>の範囲が4/0から5/15の範囲内のものをいいます。

今のところまだ空きがあり、5/2から5/15は未使用ですが、JIS X 0213などが改正され文字が増えたりすると、また終端文字が使われる可能性はあります。
その時は、やっぱり 2/1 を挟むのかな。可能性としては ESC 2/4 ※ 2/1 <F> とかになるだろうか。


実装の現状、今後予定など


次は、94×94の網羅を進めていきたい。

よく使うものは既に実装済みなので、実用充分とは思いますが、今後新規に対応を要するものは、次の通り。

・ISO-IR-165 CCITT支那語漢字
・ISO-IR-169 Blissymbol 図形文字集合
・ISO-IR-183 台湾 正字体漢字(CNS 11643-3)
・ISO-IR-184 台湾 正字体漢字(CNS 11643-4)
・ISO-IR-185 台湾 正字体漢字(CNS 11643-5)
・ISO-IR-186 台湾 正字体漢字(CNS 11643-6)
・ISO-IR-187 台湾 正字体漢字(CNS 11643-7)
・ISO-IR-202 北朝鮮 情報交換用 標準朝鮮語図形文字集合

ISO-IRのPDFには、確かに文字集合表が書かれている。
書かれているけど、こんな途方もない数を、手作業でやるのは想像を絶する。
そもそも、Unicodeにあるかどうかも分からず、仮にあったとしても両方の文字集合表から探す作業はどんだけ時間掛かるだろうな。

需要があれば対応するけど、きっとEBCDICよりも後回しになるだろう。

対費用効果的に。

2009/01/05(月)19:37 |Comments(0) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

DOCS概要 ホーム 96文字集合おわり
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR