CP954とCP33722

日本語EUCの、CP954とCP33722に新規対応しました。
いずれもEUC準拠であり、特殊な拡張はありません。

CP954(IBM-954)のオリジナルの実装は定かではありませんが、IBMのOSのなにがしかで使われていたと見られます。
次のような配置になっています。
G0 JIS X 0201ローマ字
G1 JIS X 0208+外字
G2 JIS X 0201カタカナ+3文字拡張
G3 JIS X 0212+外字

また、954の派生?として、954に0x8000を足したCP33722(IBM-33722)があります。
こちらも、オリジナルの実装は定かではありませんが、Javaでは「日本語 (5050 のスーパーセット)」と説明されています。
次のような配置になっています。
G0 US-ASCII
G1 JIS X 0208+外字
G2 JIS X 0201カタカナ+5文字拡張
G3 JIS X 0212のサブセット+外字

外字については、eucJP-open に準拠しており(どちらが初出かは調べていませんが)、G1とG3の末尾に外字領域が存在し、Windowsと同様に1,880字の外字が利用できます。

G2は0xe0から3字または5字の拡張が見られます。

G3は、CP954はJIS X 0212の全文字があるようですが、CP33722はJIS X 0212からの抜粋が実装されているようです。



2009/10/06(火)20:58 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

Googleのロゴがバーコードに ホーム 簡体中文
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

03 | 2017/04 | 05
- - - - - - 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 - - - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR