CJK統合漢字とURO

Unicodeにおける漢字表「CJK統合漢字」
まぁ、最近はVとかUとか混じっているので、CJKUV統合漢字(?)とかいうのかもしれませんが、その漢字表です。

拡張やら互換やら色々ありますが、最初からあった漢字表は何と呼べば良いのか、前から疑問に思っていました。

グリフウィキを眺めていると「URO」という記述が出てきました。
たぶん、元々の漢字集合はUROというのだと思います。

検索してみてもWikipediaくらいしかヒットせず、情報源としては信頼性に欠ける上に、思考がGPL汚染されると気分悪いので、他の資料も色々探してみました。

JIS X 0221もWebで軽く眺めてみましたが、UROといったような表現は見つかりませんでした。


Han Unification History A


英語でもいいやと思って検索してみたところ、unicode.orgに英語で良さそうな文書を見つけました。

http://unicode.org/book/appA.pdf

コピー禁止になってるんで、必要箇所だけ手入力で引用しておく。
面倒だな。
unicode.orgは、ぐだぐだな漢字統合についての歴史的事実を、本とかではなく公式サイト内で公開する義務があると思うんですけども。


Han Unification History A
(中略)

意味が良く分からぬまま超適当に直訳してるんで分かりにくいと思いますが。

The formal review of GB 13000 began immediately.

GB 13000の正式な調査が直ちに始まった。


Subsequent meetings were held in Beijing and Hong Kong.

引き続く会合が北京と香港で開かれた。

On March 27, 1992, the CJK-JRG completed the Unified Repertoire and Ordering (URO), Version 2.0.

平成4年3月27日、CJK-JRGは統合されたレパートリーとオーダリング(URO)、バージョン2.0を完了させた。

This repertoire was subsequently published both by the Unicode Consortium in The Unicode Standard, Version 1.0, Volume 2 and by ISO in ISO/IEC 10646-1:1993.

このレパートリーはその後、Unicode協会の「The Unicode Standard, Version 1.0」と、ISOの「ISO/IEC 10646-1:1993」によって公開された。

In October 1993, the CJK-JRG became a formal subgroup of ISO/IEC JTC1/SC2/WG2 and was renamed the Ideographic Rapporteur Group(IRG).

平成5年10月、CJK-JRGはISO/IEC JTC1/SC2/WG2の正式なサブグループとなり、漢字Rapporteurグループ(IRG)と改名した。

The IRG now has the formal responsibility of developing extensions to the URO 2.0 to expand the encoded repertoire of unified CJK ideographs.

IRGは現在、統合されたCJK表意文字の符号化されたレパートリーを拡張するURO 2.0への拡張を開発する正式な責任を持っています。

The Unicode Consortium participates in this group as a liaison member of ISO.

Unicode協会はISOの連絡メンバーとしてのこのグループに参加する。

In its second meeting in Hanoi in February 1994, the IRG agreed to include Vietnamese Chữ Nôm ideographs in a future version of the URO and to add a fifth reference dictionary to the ordering scheme.

平成6年2月のハノイのその2番目の会合で、IRGはベトナムのチュノム表意文字をUROの正式版に含んで、5冊目の参照辞書のオーダリングスキームに加えることに同意した。

In 1998, the IRG completed work on the first ideographic supplement to the URO, the CJK Unified Ideographs Extension A.

平成10年に、IRGはUROへのCJK統合漢字拡張Aの最初の漢字追加の作業を完了した。

This set of 6,582 characters in culled form national and industrial standards and historical literature and is encoded in The Unicode Standard, Version 3.0.

間引かれた字形と国ないし工業規格と歴史的な文献の6,582文字のこの集合は、Unicode Version 3.0で符号化された。

The CJK Unified Ideographs Extension A represents the final set of CJK ideographs that will be encoded without the use of surrogates.

CJK統合漢字拡張Aは、サロゲートを使用しないで符号化されるCJK統合漢字の最終集合を代表する。

At the present time(summer 1999), the IRG is considering additional CJKV ideographs submitted by China, Taiwan, Hong Kong, Japan, Korea, Singapore, and Vietnam as further extensions to the ideographic character repertoire in this standard.

現在(平成11年夏)、IRGは追加のCJKVを支那、台湾、香港、日本、朝鮮、シンガポール、及びこの標準の表意文字レパートリーへの将来的な拡張として、ベトナムによって提出された表意文字を検討している。

(後略)


URO


何だか良く分かりませんが、UROという表現が、必ずしも最初の集合を意味するわけでは無さそうです。
ただ、Version 1.0 Volume 2に収録された最初の集合が「URO 2.0」だとしており、Ext-Aはそれに対する拡張だ、としているので、「狭義でのURO」(という表現が適切なのかは不明ですが)は、最初に追加されたCJK統合漢字の集合を指す、と判断して良いのでしょう。

つまり、CJK統合漢字は、次のように分類されると、期待したい。

・URO
・互換
・Ext-A
・Ext-B
・Ext-C
・Ext-D (策定中)

これならすっきり。

2009/03/08(日)13:52 |Comments(1) |Trackback(0)

文字 | 雑記 | コンピュータ | [編集]

▲ページトップ

コメント

互換漢字はCJK統合漢字に含まれません。Annex.Sの統合規則も適用されないそうです。中国の割り当ててる字形を見ているととてもそうは思えないのですが、GBKやGB18030は名目上あくまでも国内規格なので問題ないのでしょう。たぶん。
2009/03/10(火)00:04 |えむけい | URL |編集
▲ページトップ

コメントの投稿

大漢和辭典 変換表 3月10日 報告 ホーム 大漢和辭典 変換表 3月7日 報告
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

04 | 2017/05 | 06
- 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31 - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR