Unicodeの各バージョンに対応開始

文字の対応バージョン


Unicodeの各文字が、どのバージョンから追加されたかの表を作っています。
今日の目標は U+0000からU+0FFF まででしたが、U+139Fまで作った。しかし、かなり難儀しました。

案外、抜けてる所(予約領域)が多くあるため、その部分は飛ばすようにしないといけない。
空き領域には文字がない以上、CCSとしてUnicodeバージョンを指定された時は、その空き領域は無効としてはじかなければならないからです。

そんなわけで、色々と苦戦。

変換表は、こんな感じでずらずらと手書きをしています。


// GREEK
{ 0x00370, 0x00373, CCS_UNICODE51 },
{ 0x00374, 0x00375, CCS_UNICODE11 },
{ 0x00376, 0x00377, CCS_UNICODE51 },
// { 0x00378, 0x00379, CCS_UNICODE }, // Not used
{ 0x0037a, 0x0037a, CCS_UNICODE11 },
{ 0x0037b, 0x0037d, CCS_UNICODE50 },
{ 0x0037e, 0x0037e, CCS_UNICODE11 },
// { 0x0037f, 0x00383, CCS_UNICODE }, // Not used


始まり、終わり、対応するバージョン、という3項目の構造体の配列です。


各バージョンのリストファイルを照合すれば機械的にもできそうだけど、なんか処理書くのが面倒そうなんで、同じくらい面倒そうな手作業でやっています。
実にローテクです。


フリーフォント入手


一つの項目に色々書くより、細かく分けた方が情報としてよさそうなので、今後はそうします。

実際に文字があるのか?を確かめるためには表示させるのが手っ取り早い。

Windows XP+IE7環境で存在しないフォントは、フリーで入手してきました。

ラオス語のフリーフォント
シンハラ語のフリーフォント
タミール語のフリーフォント
チベット語のフリーフォント
古代エチオピア語のフリーフォント
チェロキー語のフリーフォント


ビルマ語(ミャンマー語)は、どれをダウンロードしても、IE7が正常に認識しなかった。

2009/01/06(火)17:58 |Comments(0) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

続・Unicodeのバージョン ホーム チェロキー語のフリーフォント
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR