簡体中文

簡体中文の対応を強化しました。

従来の変換表では、GBK→Unicodeやその逆の変換表にWindows外字が含まれていました。
今回は、Windows以外の類似符号にも対応するため、変換表を作り直しました。

今回、新規対応または仕様変更した符号

純粋なEUC系
 IBM-5478
 CP1333 (AIX)

若干拡張された元EUC
 CP1381 (OS/2)
 CP10008 (Mac OS) = CP20936 (Windows) (同じ)

GBK系
 GBK (外字なし)
 CP936 (Windows 2000)
 CP936 (Windows XP)
 CP936 (JDK)
 IBM-1386

SHIFTGB


GBKには、外字とUnicodeのマッピング仕様の異なる複数の符号があります。
そこで従来のGBKは仕様変更し、外字なしの純粋なGBK、Windows、Java、IBM-1386に分けました。


あと、GB 2312をシフトJISで符号化するSHIFTGBなる意味不明な符号があるようなので、試しに実装してみました。
詳しいことは分かりませんので、文字集合は純粋なGB 2312としています。

2009/10/05(月)20:57 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

CP954とCP33722 ホーム 北朝鮮 國規 9566 (KPS 9566)
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR