中文関係

GB


GB 2312、GBK/GB18030の入出力の作り直しが終わりました。
色々問題があった処理も、これで綺麗になったと思われます。


ISO-IR-165


ISO-IR-165の入出力にも対応しました。

素で入出力するものと、ISO-2022-CN-EXTとしてエスケープシーケンスで入力する方法があります。
ISO/IEC 2022での出力には現在未対応です。需要があれば対応を検討します。

この符号の需要および使用例等が不明なのですが、GBのようにEUCおよびその拡張符号系で使うような実装は無いのでしょうか。PCで使うにはその方が便利だと思われるのですが。
そもそも、この符号はどこで使われているのでしょうか。


BIG5-HKSCS:2004


BIG5-HKSCS:2004の変換表を追加し、入出力に対応しました。
BIG5-HKSCS:1999とBIG5-HKSCS:2001は既に対応しているので、これにパッチする形で実装しています。
これに伴い、BIG5-HKSCS とだけ指定した場合、自動的に2004が指定されるようになりました。


CNS 11643-3


unicode.orgに置かれているUnihan.txtからCNS 11643-3を抜き出して変換表を作りました。
これに伴い、CNSは、CNS 11643-1、CNS 11643-2、CNS 11643-3 までに対応しています。

ISO-2022-CNまたはISO-2022-CN-EXTではエスケープシーケンス付きで入出力可能です(-3は-EXTのみ)。
また、EUC-TWでも、CNS 11643-3の入出力に対応しました。

第四字面以降については、手軽に入手できる変換表がないことから、手作業で作る必要があります。
もしボランティアでご協力頂ける方がいたら、ご連絡下さい。
作業としては、unicode.orgにあるようなタブ区切りの対応表を作るもので、フリーソフトとして頒布することになります。

ちなみにFirefox 3.5で表示確認しましたところ、ISO-2022-CNではCNS 11643-3のエスケープシーケンスに未対応(つまりFx3はISO-2022-CN-EXTに対応していない)でしたが、EUC-TWとした場合は第三字面までは表示できました。やはり、第四字面以降には対応できていないようです。

この変換表が完成すれば、このようなフリーソフトウェアでも有意義に利用でき、利便が高まるのではないかと考えております。

2009/09/30(水)11:09 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

Unicodeドラフトへのコメント ホーム 簡体中文関係
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR