タイ語

タイ語の実装について再調査してみました。

既に実装されているもののほか、新たに見付けた集合の対応と対応準備などをしています。

iconv では
> ISO-IR-166 TIS-620 TIS620 TIS620-0 TIS620.2529-1 TIS620.2533-0 TIS620.2533-1
でひとまとめにしていますが、問題があると思います。
これと別に
> ISO-8859-11 ISO8859-11 ISO_8859-11
もあるようです。意味が良く分かりません。


タイ語の文字コードは、確認した範囲内では次のように分類できます。

・ISO-8859-11、ISO-IR-166
・TIS 620-2533 1990、TIS-620、TIS620-0
・WINDOWS-874、CP874、IBM-1162、TIS620-1
・TIS620-2
・MACTHAI、CP10021

ISO-8859-11とTIS-620は、似ていますが、異なる文字集合です。
TIS 620には、2/0(0xa0)にNBSPがありませんが、8859-11にはあります。その違いです。

Windowsの文字集合はコードページ874ですが、同じものがIBMではコードページ1162となっています。更にIBMのコードページ874は別の文字集合が定義されているようです。注意が必要です。

TIS620-2は詳細は良く分かりません。どこかの国から拾ってきた情報では、8859-11/TIS-620とほぼ同等ながら、0x80‐0x9fと0xfc以降にも文字の定義があります。どういう訳か、空き番号はU+F700から、つまり外字が連番で振られているようです。


タイ語は詳しくありませんが、「STANDARD FOR THAI CHARACTER CODES FOR COMPUTERS」(注:タイ語です)によれば、TIS 620-2529 は破棄された、とされています。
今のところ、TIS 620-2529の詳細な仕様は良く分かっていません。
いわんやTIS620.2529-1などと枝番が付いている理由も定かではありません。

また、iconvが「TIS620.2533-0」「TIS620.2533-1」として枝番を付けている点も、理由は良く分かっていません。

判明次第、更新をしたいと考えておりますが、情報をお持ちの方がいらしたら、よろしくお願いします。

2009/09/17(木)19:33 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

iconvの変換 ホーム 符号対応状況
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

03 | 2017/04 | 05
- - - - - - 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 - - - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR