UTF-8とUTF-16読み込みも対応してみた

UTF-8とUTF-16の入力(Encode)に対応してみた。
JIS X 0208の範囲内なら、出力をシフトJISにして、正常に動作しているようだ。

BOMの検出もしている。UTF-16の場合、BOMによってビッグエンディアンとリトルエンディアンが切り替わるようにもなっている。

最初は、UTF-16は2バイト単位でDLLと交信するように、符号単位長なんかも管理しようと考えていた。その方が楽かなと思っていたのだが、余計難しいのでやめた。
アプリとDLLは、やはり1バイト単位の交信となる。


なお、文字集合(CCS)としてのUnicodeには次の版があるのだが、それぞれに対応する計画である。
何も指定しない場合は、最新版が自動選択されるものとする。

Unicode 1.0
Unicode 1.1
Unicode 2.0
Unicode 3.0
Unicode 3.1
Unicode 3.2.0
Unicode 4.0.0
Unicode 4.0.1
Unicode 4.1.0
Unicode 5.0.0
Unicode 5.1.0
Unicode 5.2.0

2008/11/18(火)01:13 |Comments(0) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

Unicodeまわり ホーム シフトJISの入出力
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR