ISO-2022-CN

今日は、ISO-2022-CNを実装した。

まだ途中だが、基本的な処理は出来ている。

G0 ASCII
G1 GB 2312
G1 CNS 11643-1
G2 CNS 11643-2

先日はISO-2022-KRで感心したが、こちらも同じような実装だった。G0しか使わないというISO-2022-JPが、むしろ「異常」だったのだ。
必要な符号を呼び出した後は、SI/SOで切り替えて使う。
G2にあるものはSS2で呼び出す。

さて、こうして、台湾の公的符号であるCNS11643の、CNS11643-1とCNS11643-2にまで対応した。
しかし、公的な資料が入手できなかった。無料で公開しているところが見付からない。
仕方がないので、今回は下の資料を使った。

http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/OTHER/CNS11643.TXT

unicode.orgの古い資料は露骨に間違っており、ある人によると、この資料にも幾つか間違いがあるそうな。

もし、よい資料をお持ちの方がいたら、連絡を下さい。よろしくお願いします。

2008/12/17(水)00:17 |Comments(3) |Trackback(0)

文字 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

No title

ISO-2022-JPがG0しか使わないのは、古いISO/IEC 2022ではマルチバイト文字集合をG0にしか呼び出せなかったからですね。指示シーケンスESC 2/4 4/2が指示先のバッファを指定するバイト(2/8)を含んでいないのも同じ理由です。
2008/12/19(金)22:47 |えむけい | URL |編集
▲ページトップ

No title

ありがとうございます
言われてみれば、G2/G3が追加されたのは第二版からでしたね。
2008/12/20(土)00:33 |miraicorp | URL |編集
▲ページトップ

CNS 11643の資料

http://www.cnsonline.com.tw/
で、規格票の閲覧ができます。
http://www.bsmi.gov.tw/
(台湾政府ドメインのサイト)からリンクしているので、たぶん公式だと思います。
規格票の499ページによると、
http://www.cnscode.org.tw/
でUnicodeとのマッピングテーブルを配っていることになっているのですが、そのままアクセスしてもDNSエラーで接続できません。hostsに60.250.4.149を登録する必要がありました。
http://www.cns11643.gov.tw/
のCNS検索でもUnicodeとの対応を調べられます。
2009/01/10(土)00:11 |えむけい | URL |編集
▲ページトップ

コメントの投稿

年の瀬も近付いてきました ホーム アラビア語などに対応
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

04 | 2017/05 | 06
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR