絵文字: ドコモ、EM、ウィルコム

ドコモ、イーモバイル、ウィルコムの絵文字の相互変換機能が実装されました。
シフトJISと、UTF-8から外字が入出力可能です。

なお、シフトJISの場合は文字集合はJIS X 0208となりますが、UTF-8の場合の文字集合は全Unicode文字になります。当然、表示できそうにない文字(例えばアラビア文字など)も、UTF-8として出力可能となっています。

絵文字


ドコモ、イーモバイル、ウィルコムは互いにドコモ絵文字と互換のある実装がされています。
但しウィルコムの場合は昔からある独自の実装があり、この読み込みにも対応しています。
よって、ウィルコム独自→ドコモまたはイーモバイルという、今後どんどん実装されるであろう一方向変換が初めて稼働し始めました。

また、他のキャリアからウィルコム独自の絵文字への変換は行なわない方針(ドコモ絵文字で事足りるはず)としておきます。

変換先の違い


ウィルコムのドコモ互換絵文字はまだ未確認ですが、ドコモ→au/SBMと、イーモバイル→au/SBMでは、変換先が違う例が幾つか見られました。
ドコモの資料は、SBMがまだボーダフォンの頃の資料になっているので、今でも同じなのかは定かではありませんが、この資料通りに実装します。

原則として独自の判断は一切含めず、メーカーの意思を尊重した変換をまずは実装したいと考えており、このため現時点で、ドコモとイーモバイルは変換表が完全に分離されました。


実装


シフトJISの場合は日本語DLLで処理しますが、UTF-8の場合はUnicode DLLで処理されます。
両方とも、同じケータイ絵文字変換表をスタティックリンクしており、UTF-8で読んだ場合でも内部コードとして、シフトJISで読んだ場合と同等になるように加工しています。

出力もシフトJISの場合とUTF-8の場合で大差なく、必要に応じて変換を掛けてから、シフトJISかUTF-8かで出力するような流れとなっています。

次はauとSBMですが、ユーザー数から考えてauの方が需要があると思われるので、auの変換表を作り始めようと考えています。まだ、適当な文字集合名を決めていませんが。
auの変換が出来たあたりで一度β版を公開したく考えています。

2009/11/05(木)19:12 |Comments(0) |Trackback(0) |製造開発 | [編集]

ソフトウェア開発 | コンピュータ

▲ページトップ

ウィルコム絵文字の特徴

ウィルコム絵文字の変換表(→Unicode、ドコモ、au、SBM)を作ってみて、気付いた点。

どの文字に変換するかはウィルコムが独自に考えたためと考えられますが、必ずしも他キャリアの変換例と一致しない。
ドコモとどこかは他と同じだけど、もう一つが違っている、というような変換実装が目立つ。
ここから、色々と興味深いところが見えてくる。


カップ


例えばウィルコムの「カップ」という絵文字は、au、SBMはドコモ系絵文字と同様の変換をしながら、ドコモ宛には「湯飲み」になってしまう。
これはウィルコムに「コーヒー」という絵文字があり、ドコモ宛には「カップ」に変換するためのようです。au、SBM宛も同様にカップ。

ここから、ドコモとは可能な限りのラウンドトリップが実現できるような変換方法が考慮されたものと見ることができます。


ペン


WILLCOM絵文字一覧表を参照すると分かりますが、WILLCOM独自の方の絵文字で「ペン」があります。
が、どうみても「鉛筆」です。

60×60(5倍拡大)


ドコモ、au、SBM宛への変換では、ちゃんと鉛筆になるようにしているようです。
Webの一覧表の書き間違いなのでしょうか。謎です。

2009/11/05(木)18:24 |Comments(0) |Trackback(0) |技術情報 | [編集]

コンピュータ関連 | コンピュータ

▲ページトップ

ケータイ絵文字 実装中

ケータイ絵文字の実装をしております。

まずは、ドコモの絵文字を、シフトJISで入出力可能になりました。
また、UTF-8の外字領域での入出力も可能で、シフトJISとの変換ができます。

使用例
gtef infile outfile -i:sjis/docomo -o:utf-8/docomo

内部的には、Unicode文字はUnicode 6.0から採用されるであろうドラフト仕様FPDAM8の符号位置を第一候補、外字領域を第二候補としてあります。
単にutf-8で出力させると、第一候補である通常の文字(例えば太陽の絵文字であればU+2600 ☀)が出ます。まだマッピングが決まっていないSMP領域も出てしまいますが、仕様ということで。
utf-8/docomoで出力する場合は特別に第二候補を引っ張り出して出力するような処理に改造しました。なので、utf-16やutf-32では、今のところ第二候補で入出力できません。対応は可能ですが、需要はどうなのでしょうか。

U+2600を入力させ、SJISで0xf89f あるいは外字のU+e63eを出力させる処理も、作る予定ではありますが、まだ実装されていません。
連結文字の処理が面倒そうなので、この処理よりも、まずは三大キャリア間の相互変換が先かなと考えているところです。Unicode 6.0はまだ先でしょうし。


なお、参考資料として、最も出来が良かったイーモバイルの資料を使って実装したため勢いでイーモバイル独自絵文字にも対応しています。
折角だから、auやSBMをやるまえに、WILLCOM絵文字にも対応させておくべきだろうか。
イーモバイルはiモード互換ですが「iモード」などの絵文字は削られています。
ウィルコムは、独自の絵文字の他にiモード互換の絵文字を持ちますが、そのうえ「iモード」などの絵文字も削らず全て収録しています。
ウィルコムの懐の深さを感じたり致しました。

2009/11/05(木)10:30 |Comments(0) |Trackback(0) |製造開発 | [編集]

ソフトウェア開発 | コンピュータ

▲ページトップ

wg2

最近の文書で興味深いものをリストアップ
ファイルのタイムスタンプ10月26日から11月2日の分

n3589 Mro文字(Introductionによると、インドの稀少なチベット・ビルマ系言語で、文字は80年代に造られた) (更新)
n3726 Emoji Ad-Hoc Meeting Report
n3727 国旗絵文字は組み合わせ(例: F+R)が良いのではないか案
n3728 Unicode→ドコモ/au/SB絵文字SJISの変換表
n3731 カシミール語デヴァナガリ追加の合意(n3480,n3710関係)


n3726については後日小形さんの方から報告があると思うのですが、流して読んだ範囲内では、「FPDAM8に適切な変更を加えるよう努めることが勧められた」とあるので、今後、絵文字回りについては何らかの仕様変更があるのでしょう。

n3727は、従来案ではU+E02xxあたりに256文字分の領域を確保して登録になっていたが、そうではなく、U+1F1E6からU+1F1FFに「REGIONAL INDICATOR SYMBOL LETTER A」から「同Z」までを追加して、組み合わせる案が提案されている。
すごく面倒くさそうです。U+E02xxという符号位置も何だか嫌だけども、この案も。

2009/11/02(月)16:19 |Comments(3) |Trackback(0) |文字 | [編集]

コンピュータ関連ニュース | コンピュータ

▲ページトップ

ISO/IEC 10646:2003/Amd.6:2009

平成21年10月13日付けで、ISO/IEC 10646:2003/Amd.6:2009が発行されていることを確認しました。

ISO/IEC 10646:2003/Amd 6:2009
Bamum, Javanese, Lisu, Meetei Mayek, Samaritan, and other characters


ドラフト段階では Amd.6:2008 でしたが、やっぱり2009に変更されたようです。
Amd.7以降も2009になってますが、これも2010になるのでしょうか。

なお、お値段は CHF 98,00 とのことです。
9000円でおつりが来る程度の価格のようです。
売られている傍ら、Amd.5までのPDFはフリーで配布されていたりしますが、これもそのうち配布されるようになるのでしょうか。

2009/11/02(月)15:15 |Comments(0) |Trackback(0) |文字 | [編集]

コンピュータ関連ニュース | コンピュータ

▲ページトップ

カレンダー

10 | 2009/11 | 12
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 - - - - -

プロフィール

Author:miraicorp
未来情報産業(株) 社長

主として「文字」「文字コード」「開発中の文字エンコード変換ソフトgTef」、時々C++などについて記述しています。

ついったーはじめました。たまにつぶやきます。

管理用

このブログをリンクに追加する

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

月別アーカイブ

カテゴリ

メール

メールはこちら

RSSリンクの表示

リンク

QRコード

QR