スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

--/--/--(--)--:--

スポンサー広告 | | | [編集]

▲ページトップ

続・Unicodeのバージョン

Unicodeのバージョン」の続きです。

実際に、実装をしてみました。

今回対応した、文字集合として見た場合の、Unicodeのバージョン一覧です

Unicode 1.0
Unicode 1.1
Unicode 2.0
Unicode 2.1
Unicode 3.0
Unicode 3.1
Unicode 3.2
Unicode 4.0
Unicode 4.1
Unicode 5.0
Unicode 5.1
Unicode 5.2 (ドラフト2仕様)


実際の構造体の形式は「Unicodeの各バージョンに対応開始」にある通りで、始まり、終わり、対応するバージョン、という3項目の構造体の配列です。

各範囲ごとに、上にあるいずれかのバージョン情報を書き連ねています。

unicode.orgにある1.1以降のUnicodeData*.txtファイルを11個同時に開いて、丁寧に違いを見ながらリストを作るという超ローテク作業です。
まる二日で完成しましたが、思ったより早く済んで良かったです。


1.0の仕様書がないので1.1との明確な差が分かりませんでしたが、ネット上の他の情報をかいつまんでおきました。



さて、このUnicode側の文字番号は2.0以降の仕様準拠ですが、1.0/1.1と2.0以降はハングルの仕様に差があるため、これは先日作った入れ換え処理を用いました。概ね期待通りの動作をしているようです。


実際の指定方法ですが、コマンドラインツールの場合は、「UTF-16/UNICODE1.1」とか「UTF-8/UNICODE 4.1」のように、CES/CCSの形式で指定するのが標準的な書式となります。
charset名にあるような「unicode-2-0-utf-8」といったCESとCCSが融合したような書式も、いずれ対応します。

2009/01/07(水)21:48 |Comments(0) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

Unicode 1.0とUnicode 1.1の仕様について ホーム Unicodeの各バージョンに対応開始
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

01 | 2018/02 | 03
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。