続・Macの符号

Macの符号への対応が概ね終わりました。

Windows-10000 (MacRoman互換)
Windows-10001 (MacJapanese互換、SJIS系)
Windows-10002 (MacChineseTrad互換、Big5系)
Windows-10003 (MacKorean互換、EUC-KR系)
Windows-10004 (MacArabic互換)
Windows-10005 (MacHebrew互換)
Windows-10006 (MacGreek互換)
Windows-10007 (MacCyrillic互換)
Windows-10008 (MacChineseSimp互換)
Windows-10010 (MacRomanian互換)
Windows-10017 (MacUkrainian互換)
Windows-10021 (MacThai)
Windows-10029 (MacCentralEurope)
Windows-10079 (MacIcelandic互換)
Windows-10081 (MacTurkish互換)
Windows-10082 (MacCroatian互換)

以上は、Windowsのコードページと、Macの文字集合で、別々の動作を定義しています。


一部については、バリエーションの表現に外字を用いておりますが、unicode.orgの変換表にある変換に対応しています。
Macの符号→Unicodeで、Appleの定義した外字を出力します。外字出力OFFにはできません。
Unicodeからの入力は、Macの符号を出力する場合に限り、外字を機能文字として認識して元の文字を復元します。従って、外字を併用することで往復変換(ラウンドトリップ)が実現されています。

今日は、朝鮮語のMacKoreanを念入りに作り込みました。
MacKoreanからの入力と、Unicodeからの入力では、出力側の処理が若干違うわけですが、MacKoreanからの入力をUnicodeベースで処理するのは非常に難しかったので、素直に専用のバンクを用意して、そのまま出力(スルー)するようにして解決しました。
Unicodeからの入力なら、unicode.orgにある変換表の符号を全て問題なく入力し、MacKoreanとして出力できます。
MacJapaneseその他で同じ外字を使っているものからの変換はどうしたものかは、目下検討中です。


Windows-10049 (MacFarsi)

Macペルシャ語については、古い実装から持ってきたものと推定されるものの、他に資料がないため未検証です。
なお、Windows XPは10049というコードページに対応していません。


2009/10/20(火)20:45 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

コードページ20001 ホーム Macの符号
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

04 | 2017/05 | 06
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR