スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

--/--/--(--)--:--

スポンサー広告 | | | [編集]

▲ページトップ

日本語処理でUTF-8の選択

かなり間が開いてしまいました。

暫くデスマーチが続くと思うのですが、社運を賭けたシステム開発のさなかでありまして、この成功如何で日本や世界の情勢までも変わってくる、なかなかダイナミックかつアグレッシヴなプロジェクトであります。


データベースシステムなのですが、当面は日本での運用のみを想定しています。

さて、その場合、文字の符号をどれにするか、を考える必要が出て来るわけですが、個人的にはUTF-8が気に入っているので、UTF-8一択で設計し、鋭意開発中であります。


これから新規開発するシステムでは、シフトJISやらEUC-JPやら、より正確にはJIS X 0208を選択する利点が無いように思いますね。
モバイル環境でのアクセスを想定するにしても、サーバ側で逐次変換してあげれば良いわけで、内部はもうUTF-8ないしUnicode系CES/CCS以外を選択する必然性が無いようにも思えます。
それほど、最近のUnicodeは実用的になってきました。


世界で最も普及しているUnicodeのCESは、実はUTF-16なのですが(なぜなら、WindowsのWide APIはUTF-16を要求するため)、UTF-16、というかwchar_tは処理が面倒すぎて嫌い。
可変長という難点はありますが、何だかんだで、UTF-8は完成度が高いし、unsigned charで扱えるため処理もしやすいので、安心して使えますね。

2009/04/06(月)22:22 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

大漢和辭典 変換表 4月9日 報告 ホーム gTef 0.02 beta 公開のお知らせ
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。