スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

--/--/--(--)--:--

スポンサー広告 | | | [編集]

▲ページトップ

UTF-32

折角なので、UTF-32とUCS-4の入出力も付けてみた。

変な加工がないので、入力(Encode)も出力(Decode)も楽でした。

なお、将来的には「Unicodeの正規化」にも対応する予定ですが、これは大変そうですね。


一応、次の種類を用意した。

■UCS-4 (全領域、BOMあり、ビッグエンディアン)

以下、Unicode文字領域(U+0~U+10FFFF)のみ

■UTF-32 (BOMあり、ビッグエンディアン)
■UTF-32-BOMLE (BOMあり、リトルエンディアン)
■UTF-32BE (BOMなし、ビッグエンディアン)
■UTF-32LE (BOMなし、リトルエンディアン)

ミドルエンディアンとか変な物も、対応する用意だけはあるけど、当面しないだろう。


さて、恒例のブラウザ対応です。


・Internet Explorer 7

 全て未対応。それどころか、読ませるとOSの具合がおかしくなりそう。

・Mozilla Firefox 3.0.4

 BOMがあれば自動認識で対応。なければ手動設定が必要。
 ただ、BOMつまりU+FEFFが、通常の空白文字と同じ幅で表示されていて違和感がある。
 これは、いわゆるバグとして認識されるべきだろう。

・Opera 9.5.2

 BOMの有無に拘わらず自動認識している様子。

・Google Chrome 0.4.154.25

 BOMがあれば、普通に表示されるようだ。が、UTF-16と表示されている。
 U+0000を無視することで普通に表示されているのかもしれないが、定かではない。

 BOMがないと表示できない。



ちなみに、今のDLL仕様だとUTF-7出力は大変難しいため、当面は実装しない方向。
需要もないだろうし、入力にも対応しない方向。

まぁ、販売開始後、需要があれば、といったところか。

2008/12/02(火)15:01 |Comments(1) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

No title

BOM付きのUTF-32にはFirefox 3.1から対応予定です。
https://bugzilla.mozilla.org/show_bug.cgi?id=335531
今のところ、BOMがない場合の自動認識に対応する予定はありません。
2008/12/19(金)22:46 |えむけい | URL |編集
▲ページトップ

コメントの投稿

ISO-8859 ホーム C++なのに、Cに毛が生えただけの「C~」を書いてないか?
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。