新常用漢字表問題の解決私案

文字コード業界(?)で話題騒然(?)の旬な問題が、新常用漢字表です。


字形を変える、と言い出して、その後撤回するか譲歩するような方々が仕様を策定しているのかどうか、私には分かりません。

字形を変更する目的自体よく分からないのですが、字形を変更する前提で、「シフトJISで表現」する方法を、あくまで私案ですが、簡単に考えてみました。


前提

  1. シフトJIS、EUC-JP、ISO/IEC 2022で符号化さえ出来れば、CCSがJIS X 0208である必要はない

手法

  1. シフトJIS、EUC-JP、ISO/IEC 2022で符号化できるよう、文字集合を変更する
  2. その際、Unicodeとのラウンドトリップを維持する

そこで、次のような方法を考えてみました。

  1. JIS X 0208を【廃止】
  2. JIS X 0213の、頬、填、剥、叱と新常用漢字表の字形との符号位置を入れ換える(JIS78→JIS83の時のように)
  3. Unicodeとの対応も、入れ換えに対応するように変更 (ラウンドトリップの維持)
  4. JIS X 0213に、JIS X 0208相当の文字集合(但し(2)を採用した後のもの)をサブセット集合として定義
  5. ISO-2022-JPのJIS X 0208用終端文字は、このサブセット集合に割り当てる

ISO/IEC 2022では、終端文字まわりの変更が必要になるでしょう。

終端文字を変えず、更新シーケンス(IDENTIFY REVISED REGISTRATION)の付加だけで済ませるのが最も理想的かと思います。

そうであれば、ISO-2022-JPを定義するRFC 1468の記述通り、通常は更新シーケンスを略すので、従来通りに使うことができます。


JIS78→JIS83の時や、XP→Vista(0208→0213)の時と同じような騒動が起こりますが、仕方がないでしょう。

1から既に難易度が高いと思われますが、そろそろ我々は、この決断を下すべき時が来たのではないでしょうか。

2009/12/22(火)12:05 |Comments(4) |Trackback(0)

文字 | 言語学 | 学問・文化・芸術 | [編集]

▲ページトップ

コメント

> 前提
Shift_JIS-2004, EUC-JP-2004, ISO-2022-JP-2004 じゃダメなんですか。

加えて、EUC-JP で表せる時点で ISO/IEC 2022 で表せているように思います。
そこは ISO-2022-JP 亜種などと書いておくべきでしょう。

> 1. JIS X 0208を【廃止】
なぜ 0208 と 0213 の改訂ではいけないのですか。

> 5. ISO-2022-JPのJIS X 0208用終端文字は、このサブセット集合に割り当てる
終端文字の意味を決めるのは各 ISO/IEC 2022 系の各仕様ではなく、ISO-IR です。
http://www.itscj.ipsj.or.jp/ISO-IR/
で、ここの定義を JIS X 0208 から差し替えるのは流石に難しいと思われるので、
やはり 0208 改訂の方が無難でしょう。

まぁ、ここまでやるなら RFC1468 もいろいろ直した方がいいと思いますけれど。

> JIS78→JIS83の時や、XP→Vista(0208→0213)の時と同じような騒動が起こりますが、仕方がないでしょう。
「既存のデータは新常用漢字での字形を表したかったものとみなす」
とか書いておくと互換性問題を黙殺できるようになります。

> 1から既に難易度が高いと思われますが、そろそろ我々は、この決断を下すべき時が来たのではないでしょうか。
えぇ、レガシーエンコーディングを捨てる決断を下すべき時が来たのでしょう。
2009/12/22(火)13:29 |naruse | URL |編集
▲ページトップ

>Shift_JIS-2004, EUC-JP-2004, ISO-2022-JP-2004 じゃダメなんですか。
個人的には、それでも良いのではないかとは思うのですが、
人気が無く、そのあたりの話題が全く出ていないところを見るに、ダメなのかも知れません。

0208相当の文字集合で何とかしようというのが、どうやら課題のようです。


>なぜ 0208 と 0213 の改訂ではいけないのですか。
最初はそれも考えたのですが、0208と0213を同時に更新するのは、倍のコストが掛かり、面倒で、メリットも無く、つまり現実性が無いだろうと判断したものです。

あとは、ただの辻褄合わせですね。


>レガシーエンコーディングを捨てる決断を下すべき時が来たのでしょう。
実はわたくしもそう思ってはいるのですが、SJISに愛着ある方も少なくないようなので。
ネット関係でも、例えばWeb掲示板などは今でもSJISで実装されているものが多いので、これは今後の課題でしょうか。

ちなみに、ここfc2 blogも日本語版はEUC-JPで実装されていますが、他の言語はUTF-8になっているようです。日本語版もUTF-8にして欲しいと思っております。
2009/12/22(火)13:53 |miraicorp | URL |編集
▲ページトップ

(新)常用漢字と携帯電話

一年ほど前、私なりにJIS X 0208の廃止も視野に入れて考えてみたのですが、無理というのが私個人の結論でした。↓の「URL」から当時の『(新)常用漢字と携帯電話』をリンクしておきますので、よければ当該ページの「コメント」も含めてごらん下さい。
2009/12/23(水)22:54 |安岡孝一 | URL |編集
▲ページトップ

コメントありがとうございます。

JIS X 0208の廃止はともかく改訂すら出来ない状況というのであれば、文字集合をJIS X 0213、符号は(SIPにも対応した)UTF-8に、それぞれ移行するよう業界を促してゆくしかないのかもしれませんね。

UTF-8自体は主流5キャリア(ドコモ、au、ソフトバンク、イー・モバイル、ウィルコム)全てで対応しているので、あとは文字集合をどうにかするだけでしょうか。
2009/12/24(木)09:49 |miraicorp | URL |編集
▲ページトップ

コメントの投稿

78/83/90/97JISの IVS対応 変換表完成 ホーム 78/90JIS IVS対応 変換表
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR