大漢和辭典 変換表 2月13日 報告

前回更新部分の再更新


大漢和辭典 変換表 2月12日 報告に関する件
記録を残すため、コメントではなく本文に書いておきますね。


9-2B71


> 9-2B71 U+222FBは右下が攵です。欠ではありません。

 U+22303に戻して、メモを書き加えておきました。

9-2B71 U+22303 49078-0 #「⿸广⿰僉欠」、广は全体に掛かる


9-2C5F


U+232AEに包括可能のようなので、次のようにしました。


9-2C5F U+232AE 49154-0 #「⿱⿰坴丮日」、但し丮は縦棒ではなく丿 U+232AE U+E01xx(現在定義なし)


9-2A6D


> 9-2A6D U+55C2をMingLiUで表示してみるとどうして分離したのかわかると思います。

MingLiUだと、U+55C2 は [口]+([炙]-[火])+[缶] でした。
ここまで字形違っても包括の範囲内なんですねぇ


この文字は、Unicode(UniHanから吐き出した結果)での重複を確認しました。

U+55C2 04037-0

暫定的に、台湾側に合わせるために 9-2A6D の候補を入れ換えました。

U+55C2 04037-0
9-2A6D U+2F84A U+55C2 48980-0

 04037-0のTRONコード番号判明次第、追加で何か手を加えるかも知れません。


9-2B64


9-2B64 U+21FEB U+5DDF 49065-0 #字形が違う 左がはみ出さない
> 9-2B64 U+5DDFのK欄がそのものずばりの字形なので、U+5DDFを第一候補にしたほうがいいと思います。

この文字も、Unicode(UniHanから吐き出した結果)での重複を確認しました。

U+5DDF 08679-0

 重複文字扱いにするか、さもなくばそれぞれに U+5DDF と U+21FEB を割り当てるしか無さそうですが、どうしましょう?


9-2C74


> 9-2C74 9-2A6Dと同じです。MingLiUで表示してみてください。

 U+69A3 日本 が [木]+[爫]+[缶]
 U+69A3 台湾 が [木]+([炙]-[火])+[缶]

 以下のようにしてあります。

9-2C74 U+2F8E9 U+69A3 49175-0


9-2D6D


>> 9-2D6D 49262-0 #Unicodeに発見できず、類似字形U+222F1
> 9-2D6D 包摂可能です。

戻しておきました。異体字セレクタで識別可能になることを期待してメモも付加。

9-2D6D U+222F1 49262-0 #U+222F1 U+E01xx(現在定義なし)


9-2D77


> U+2F920は19648-0に対しては使えても、9-2D77に対して使うのは無理だと思います。

では、次のようにしてみました。重複扱いも消しておきました。


U+2F920 U+7228 19648-0 #冠の中央が「同」
9-2D77 U+7228 49272-0 #冠の中央が「冂の中に〒」


9-3138


> 9-3138 U+26D32は全然違う字です。U+26BCFの間違いでしょうか?

どこかで番号のコピペに失敗したようで
U+26BCF でマップしておきました。

9-3138 U+26BCF 49586-0 #「⿱⺿⿰女⿺尢女」


9-2B39


>> 9-2B39 U+219B3 U+219B4 49022-0
>> この二つより、更によく似た字を U+219AD に見つけました。
> 9-2B39 U+2F98CがU+8204のCompatibility variantなので、包摂可能だと思います。

第一候補、第二候補双方を削除して、以下に書き換えました。

9-2B39 U+219AD 49022-0


9-2C4C


> 9-2C4C U+22D47 49135-0

とりあえず対処が無いので、両方を候補に入れておきました。
どちらが優先されるべきなのかは、良く分かりませんが

9-2C4C U+22D47 U+22D4E 49135-0 #「⿰扌⿱⿱⻀⿻二永」


9-3027


> 9-3027 U+26065 49474-0

一応これも、もう一つを第二候補に入れておきますね。
やっぱり、どちらが優先されるべきなのか、良く分かりません

9-3027 U+26065 U+260B2 49474-0 #[糸]+[㡀の上に横棒]





違うかもしれない字など



以降は、本日の作業

9-3275


9-3275 U+8D0F 49740-0 #凡丮

 そのものずばりの字を U+268BC に見つけました。

9-3275 U+268BC 49740-0


微妙に字形が違うやつとか


9-3225


9-3225 U+26FD4 49660-0
たぶん包括の範囲内と思うけれど、字形が違うのでメモ

 9-3225 は、4画草冠+[㡀]+[攵]+[ナ十](脚が分離)
 U+26FD4は、[㡀]の上が[`´]、脚が[廾]

9-3225 U+26FD4 49660-0 #字形が違う「⿳⺿⿰㡀攵⿰ナ十」


9-3356


9-3356 U+22A12 49802-0
これも包括の範囲内と思うけれど、字形が違うのでメモ

 𢦏と、[立]+[戈]の差

9-3356 U+22A12 49802-0 #字形が違う「⿹U+2298F里」


9-3357


9-3357 U+28940 49803-0

 左の人のノがホの上に掛かってるのが微妙に思ったので調べてみました。
 U+2028D に、更に似た字を見つけましたが、どうしましょう。

 今回見つけた奴を第一候補に入れておきます。

9-3357 U+2028D U+28940 49803-0


9-337A


9-337A U+95B7 49838-0

 木とホの差が気になったので、調べてみました。
 台湾の互換漢字で U+2F9F0 を見つけました。

 また、U+95B7は 41407-0 と重複しているようです。

 とりあえず、次のようにしてみました。

U+95B7 41407-0
9-337A U+2F9F0 U+95B7 49838-0


9-3527


9-3527 U+2A296 49945-0

 厂と广の差が気になりますね。メモを付けておきます。

9-3527 U+2A296 49945-0 #字形が違う [鹿]-[广]+[厂]+[勿]


9-3530


9-3530 U+2A415 49954-0 #日甘

 微妙に違うかと思って別の字を探してみたら、U+24BD2 を発見
 違いが微妙すぎて困惑

 甘の上の[氺]の大きさから、U+24BD2 を第一候補にしてみました。

9-3530 U+24BD2 U+2A415 49954-0 #日甘


9-3648


9-3648 U+21508 50108-0

 もう少し似た字がないかなと思って探したら、U+22030 を見つけました。
 TRONの方は丸みがあってU+22030は角張ってますが、U+22030 の方が適切そうなので、変更しておきます。


9-3648 U+22030 50108-0


見つからない字など



9-324F


9-324F U+ 49702-0 #〾衆

見つからなかったので

9-324F 49702-0 #Unicodeに発見できず、衆の「ノノ」が「く」


9-337E


9-337E U+ 49842-0 #⿵門⿺⻌⿱大⿱⻀干

 見つかりませんでした。
 コメントで、門の二つ後がU+2ECCの二点之繞になってますが、TRONでは三点だったので、その点を変更しておきました。

9-337E 49842-0 #⿵門⿺⻍⿱大⿱⻀干


9-3455


9-3455 U+ 49896-0 #⿰飠工

 偏は食よりは、古い形かなと思ったので。
 丶と横棒の形も気になったので、の⻞(U+2EDE)ではなく、U+2967Fを偏に

9-3455 49896-0 #「⿰U+2967F 工」 偏は食/⻞の異体


9-3522


9-3522 U+ 49940-0 #⿰鳥

 これは凄い字ですね。見つからなかったけど。

9-3522 49940-0 #⿰⿹弓⿳⿲人人人⿲人人人⿲鳥


9-3657


9-3657 U+ 50123-0

 9-3657 は、束欠女

 束攵女の U+2183C を見つけましたが、包括できませんよね。

9-3657 50123-0 #⿱⿰束欠女


9-367A


9-367A U+ 50158-0

 9-367A は、[刃]+[工]

 [´]+[刀]+[土] を U+21254 に見つけましたが、無理ありますよね。

9-367A 50158-0 #⿳刃工


9-326C


9-326C U+ 49731-0 #⿰豕眉

見つかりませんでしたが、よく似た字を U+27C78 に見つけました。惜しい。

9-326C 49731-0 #Unicodeに発見できず「⿰豕眉」


9-3354


9-3354 U+ 49800-0

よく似た字を U+21374 に見つけました。縦棒が繋がってるかどうかの差のようです。
包括の可能性はどうでしょうか。

9-3354 49800-0 #Unicodeに発見できず「⿻重八」


その他


以下は、見つからず、特にコメントも無いので、Unicode欄を空欄にして、メモを書き足しました

9-3250 49703-0 #⿻衣廾
9-3329 49757-1 #⿰車⿷匚⿱屮王
9-3348 49788-0 #⿱酋⿱一八
9-3425 49847-0 #⿰⻕夅
9-345C 49904-0
9-3460 49908-0 #⿰馬竄
9-3467 49915-0
9-3543 50009-0 #⿱U+201A2テ
9-3576 50060-0 #⿸厂尚
9-357E 50068-0 #⿰号乕
9-3654 50120-0 #⿰女長
9-365A 50126-0
9-365E 50130-0 #⿳宀⺍木
9-3662 50134-0 #⿱宀竒
9-3663 50135-0 #⿱宀⿰爿合
9-3678 50156-0 #⿱山⿰
9-3739 50187-0 #⿱⿰牙攵心
9-373F 50193-0 #⿱⿰心


今回、手を触れてない検討課題


9-3353


9-3353 U+ 49799-0 #⿱釆祭

 祭の左上が「タ」になった字を U+27C0C に見つけました。
 包括の可能性などはどうでしょうか。


9-343E


9-343E U+24BDD 49872-0 #⿱生円

 は青と包括可能のようなので、同様にこれも問題ないと思うんですが、1つ次の U+24BDE も字形が似てますね。

 生+丹


9-3749


9-3749 U+2F8B8 50203-0

 U+2F8B8 の下が 又 になってるのが気になったので、他を探してみました。
 微妙に字形が違う U+22B0C を発見しましたが、これも 又 だった。
 どちらが適切なのでしょう。
 一番上が払ってある U+2F8B8 の方がまだ近いのだろうか。





成果物


本日の版です。

最新版のTSVファイル
ver H21/02/13

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/02/13(金)16:25 |Comments(1) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

9-3356 メモの中ですが、𢦏じゃないように見えます。左上は土ではなく立で、戈とつながっていないところだけが違います。U+6220の各国字形などを見る限り、この違いはやはり包摂されているようです。
9-367A [刃]と[´]+[刀]は包摂されています。刃をSimSunか規格票のG欄/K欄で見てください。附属書S.1.5 j)にも明記されています。
9-3353 「タ」の点が1つか2つかは、けっこういい加減なようです。
http://homepage3.nifty.com/shikeda/moro.html
U+27C0Cをマップできるのではないでしょうか。
9-3749 又の横棒の有無は包摂されています。U+72AEをSimSunか規格票で見てください。
2009/02/13(金)23:25 |えむけい | URL |編集
▲ページトップ

コメントの投稿

大漢和辭典 変換表 2月14日 報告 ホーム TAD入出力 言語指定
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR