IBM拡張文字とUnicode

IBM拡張文字の中には360字の漢字が含まれています。
その文字とUnicodeとのマッピングを改めてチェックしてみました。

幾つかの文字はCJK互換漢字の領域にマッピングされ、後にそのうちの12字はCJK互換漢字の領域にありながらCJK統合漢字へと変更をされています。

さて、CJK互換漢字は基本的にラウンドトリップ用なので、それぞれの文字と対応づけられる文字集合が決まっており、汎用的に使うことは避けられるべきものとされています。

IBM拡張文字や、NEC選定IBM拡張文字は日本語用の集合ですから、基本的に日本語用のCJK互換漢字集合になるだろうと考えられます。
しかし、これに当てはまらない文字が2文字ありました。

日本語用のCJK互換漢字は、U+FA0EからU+FA2Dの範囲内ですが、次の2字が、日本語以外のCJK互換漢字にマッピングされている文字です。

朗 (U+F929)
隆 (U+F9DC)

この2文字は、U+F900からU+FA0Bにある、KS X 1001に対応するCJK互換漢字です。

KS X 1001は重複する漢字が268字もあって、その対策として用意されていた文字なわけですが、たまたま同じ字形だった互換漢字にマッピングされたようです。

2010/01/06(水)21:14 |Comments(0) |Trackback(0)

文字 | 言語学 | 学問・文化・芸術 | [編集]

▲ページトップ

コメント

コメントの投稿

事務所を移転します ホーム もじかん1.00a 公開のお知らせ
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

04 | 2017/05 | 06
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR