大漢和辭典 変換表 2月10日 報告

こちらも少し進めて、8-2745まで、検字番号で00600-0まで終わらせました。

あと、9面について、チェックを始めました。
とりあえず 9-2A27 までチェックしました。


違うかもしれない字


(1) 9-244D U+2A1DE 48381-0

  9-244D は、[鼓]+[鳥]
  U+2A1DE は、[皷]+[鳥]

  でした。

  U+2A1C0 に 9-244D と同じ字形の文字を発見したので、以下のように修正しておきました。

9-244D U+2A1C0 48381-0


(2) 9-274D U+2A609 48663-0

  9-274D は、[齒朶]
  U+2A609 は、[齒]+[几]+[木]

  でした。

  しかし、同じ字形の文字をUnicodeに見つけることが出来なかったので、Unicode番号欄は空欄にして、次のようにしました。

9-274D 48663-0 #⿰齒朶 類似字形U+2A609


(3) 9-2947 U+9F9C 48847-0
9-2948 U+9F9C 48848-0

  9-2947は字形が一致してますが、9-2948 は微妙に違う
  これを包括するのは無理がありそうな…

  9-2948は、Unicodeに見つけられなかったので、次のようにすることを提案しますが、いかがでしょうか?

9-2947 U+9F9C 48847-0
9-2948 48848-0 #Unicodeに発見できず 類似字形U+9F9C



複数の候補のある字


(1) 9-2330 U+9EFE U+2FA18 48258-0

  第二候補の方が字形的には合致しますね。
  入れ換えるのはどうでしょうか。


(2) 9-236E U+2A503 U+2FA1A 48320-0

  こちらも第二候補の方が字形的には合致しますね。
  入れ換えるのはどうでしょうか。


(3) 9-242E U+2FA1B 48350-0

  これは何の問題もありませんが、たまたま似た字形の字を見つけたので、第二候補への追加提案


9-242E U+2FA1B U+9F16 48350-0

  U+2FA1B は、上から順に [十][艹][鼓]
  U+9F16 は、上から順に [十][艹][鼓]

  草冠の3画、4画の差です。



新たに見つけた文字


(1) 9-2361 U+ 48307-0

 この字は多分 U+2A4FB になると思うんですが、微妙に字形が違いますねぇ…

 仕方がないので、次のようにしておきました

  9-2361 48307-0 #Unicodeに発見できず 類似字形U+2A4FB


(2) 9-2566 U+ 48499-0

  U+22342 に見つけたので、以下のようにしておきました。

9-2566 U+22342 48499-0


(3) 9-2646 U+ 48562-0

  U+21F49 に見つけたので、以下のようにしておきました。

9-2646 U+21F49 48562-0 #「⿱丶一」ではなく亠


(4) 9-2650 U+ 48572-0

  U+222FF に見つけたので、以下のようにしておきました。

9-2650 U+222FF 48572-0 #「⿱丶一」ではなく亠 但し、示は丿|に接触する


(5) 9-2A27 U+ 48910-0

  U+20B61 に見つけたので、以下のようにしておきました。

9-2A27 U+20B61 48910-0



成果物


本日の版です。

最新版のTSVファイル
ver H21/02/10

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/02/10(火)23:50 |Comments(3) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

Unicodeでは9-2947と9-2948は統合されています。ISO/IEC 10646の規格票でU+9F9Cをご覧ください。そこまでしなくてもフォントをSimSunに切り替えるだけでもわかりますが。
U+2A4FBは、T-sourceでは9-2361と同じ字形です。9-2361にマップして問題ないと思います。
http://www.cns11643.gov.tw/AIDB/query_general_view.do?page=5&code=797b
他の点はとりあえず異議ありません。
2009/02/11(水)09:26 |えむけい | URL |編集
▲ページトップ

追加です。[朶]と[几]+[木]も、附属書S.1.4.3に統合例として載せられていました。従って9-274DもU+2A609でいいと思います。
2009/02/11(水)11:53 |えむけい | URL |編集
▲ページトップ

大変申し訳ありません。附属書Sをよく読み直してみたら、S.1.4.3は抽象字形が異なる(つまり統合できない)例でした。また9-274DはExt.Dの追加提案に含まれていました(↓の10454)。
http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg31/IRGN1549_DV50_M_301-352.pdf
したがってU+2A609では9-274Dを符号化できないようです。
2009/02/20(金)22:12 |えむけい | URL |編集
▲ページトップ

コメントの投稿

大漢和辭典 変換表 2月11日 報告 ホーム 諸橋大漢和とUnicodeの変換表
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR