大漢和辭典 変換表 2月14日 報告

一応、簡単に眺めた範囲で9面のチェックは終わりました。
BMP内とExt-Bを見てます。
包括についても、きちんと仕様書に目を通すようにしました。


以下、気付いたところなど。

前回更新部分の再更新


大漢和辭典 変換表 2月13日 報告に関する件

9-3356


すみません。「𢦏」は、ちょっと見間違えたようです。
包括の範囲内とのことなので、そのようにメモに残しておきます。

9-3356 U+22A12 49802-0 #字形が違う 立戈の横棒が繋がっている


9-367A


[刃]+[工] と [´]+[刀]+[土] は包括の範囲内だったので、見つけた文字を追加しておきます。

9-367A U+21254 50158-0 #⿳刃工


9-367A


タの点の数と、又の横棒も了解しました。見つけた字を追加しておきます。

9-3353 U+27C0C 49799-0 #⿱釆祭
9-3749 U+22B0C U+2F8B8 50203-0 #字形が違う 又の横棒無し



違うかもしれない字など


9-3875


9-3875 U+2498F 50341-0

 U+2498Fには丶がありません。丶の付いた字を U+249DA に見つけました。

9-3875 U+249DA 50341-0


9-3B6E


9-3B6E U+9116 50616-0

 9-3B6E で、[厶]+[貝]+[阝]
 U+9116 で、[口]+[貝]+[阝]

 10646のCJKの一覧を確認しましたが、全て口でした。SimSunでもU+9116は口でした。
 厶と口が包括できるのか定かではありませんでしたので、一応消しておきます。

9-3B6E 50616-0 #⿰⿱厶貝阝


9-3B7C、9-3B7D


9-3B7C U+91FC 50630-0
9-3B7D U+91FC 50631-0

 確かに双方とも包括の範囲内ですが、どうやら原規格分離されたと思われる U+91F0 を見つけました。
 こんな割り当て方でどうでしょう?

9-3B7C U+91FC 50630-0
9-3B7D U+91F0 50631-0


9-3C75


9-3C75 U+9937 50717-0

 9-3C75 は、[食](U+2967F)+[木]+[且]
 U+9937 は、[飠]+[木]+[旦]

 仕様書では、県のような「且」と「目の下に∟」は包括対象のようですが、旦は明記がありませんでした。SimSunでもU+9937は旦でした。
 一応、外してみます。

9-3C75 50717-0 #「⿰U+2967F⿱木且」類似字形U+9937




微妙に字形が違うやつとか



二と亠


9-3764 U+23140 50230-0

 9-3764 は [二]+[日]
 U+23140は [丶]+[一]+[日]

 この字(9-3764)は「ふつか」ではなく、上の二が「亠」の変型、という考えで良いのでしょうか?

9-3764 U+23140 50230-0 #⿱二日


灬と火


脚の灬と火は、包括の範囲にあるのでしょうか。仕様書では明言がありませんでした。
メモだけ追加します。

9-3A23 U+25A24 50447-0 #字形が違う「⿱穴⿳⿻大丷日灬」
9-3C78 U+993B 50720-0 #字形が違う「⿰U+2967F⿱U+2634C火」


9-3B71


字形自体は問題ないのですが、Unicodeで重複が確認されました。

9-3B71 U+9111 50619-0
U+9111 39561-0

台湾の互換漢字を探したら、U+2F9E4 を見つけましたので、手を加えておきました。

U+9111 39561-0
9-3B71 U+2F9E4 U+9111 50619-0


その他


その他、微妙に字形が違うもの。
気になるので一応ここに書いておきます。
コメントにも残しておきます。

9-375F U+22FBF 50225-0 #⿰⿳一口⿵冂⿱䒑十攴
9-3C3C U+28B7B 50660-0 #字形が違う「⿱⿰金⿱𠂉王金」
9-3973 U+2589F 50433-0 #字形が違う「⿰禾⿳亠口⺸」
9-3A2E U+25B9F 50458-0 #字形が違う「⿱⺮⿷匚⿱山土」
9-3A53 U+2632F 50495-0 #字形が違う「⿱罒⿰中馬」
9-3C59 U+28FCA 50689-0 #字形が違う「⿰⿱マ⿻刁十隹」



見つけた字


9-3A43


9-3A43 U+ 50479-0

 似たような字 U+42F2 を見つけたのですが、字形が少し違う

 9-3A43 は、[糸]+[口]+[甩]
 U+42F2 は、糸の形が違い、甩の上が出て口に接続している

 包括範囲内なのか、CJKVの一覧を見ても答えが出ませんでしたが、一応追加しておきますね

9-3A43 U+42F2 50479-0 #字形が違う「⿰糸⿱口甩」



見つからない字など


9-3A5D


9-3A5D U+ 50505-0

 字形が微妙に異なる U+2665C を見つけたのですが、どうでしょう?
 己と巳は包括対象のようですが、この形はどうなのだろう。

9-3A5D 50505-0 #類似字形U+2665C


その他


見つからなかった字で、今回コメントを付けた残り全部

9-3750 50210-0 #⿰扌貟
9-3757 50217-0 #⿰扌㐮
9-3759 50219-0 #⿰扌攵
9-3765 50231-0 #⿰日下
9-3822 50258-0 #⿰木赤
9-3827 50263-0 #⿰木祀
9-382E 50270-0 #⿰木⿱⺳⿻犬丷
9-383F 50287-0 #⿰毄欠
9-3842 50290-0 #⿰歺孚
9-384D 50301-0 #⿰⺡⿸尸工
9-3852 50306-0 #⿰⺡⿱穴力
9-3859 50313-0 #⿰⺡⿳⺈田大
9-386F 50335-0 #⿰兽犬
9-3921 50351-0 #⿱田町
9-3925 50355-0 #⿱男⿰男男
9-392F 50365-0 #⿰白丁
9-3972 50432-0 #⿰禾⿳正彐心
9-3979 50439-0 #⿱穴⿱丿犮
9-397E 50444-0 #⿱穴倉
9-3A37 50467-0
9-3A38 50468-0 #⿱⺮賦
9-3A3E 50474-0 #⿰米⿱口耳
9-3A47 50483-0 #⿰糸⿱米女
9-3A4D 50489-0 #⿰糸箏
9-3A54 50496-0 #⿱𦍌⿰夂厶
9-3A77 50531-0
9-3A7B 50535-0 #⿱⺿⿰⿳⺈田大禾
9-3B2D 50551-0 #⿲彳⿱⿱力一吊亍
9-3B2E 50552-0 #⿱中衣
9-3B3C 50566-0 #⿰言
9-3B53 50589-0 #⿰身
9-3B7B 50629-0 #⿰里⿱亠巾
9-3C43 50667-0 #⿲金鬲戈
9-3C44 50668-0 #⿰金盡
9-3C46 50670-0 #⿰镸⿱夂⿻生一
9-3C47 50671-0 #⿰镸⿱兓貝
9-3C55 50685-0 #⿰阝⿱⿻合⿰人人
9-3C5C 50692-0
9-3C63 50699-0 #⿰
9-3C68 50704-0 #革U+215D7示
9-3D23 50729-0 #⿰馬竒
9-3D31 50743-0 #⿰魚引
9-3D34 50746-0 #⿰魚⿱又友
9-3D36 50748-0 #⿰魚行
9-3D3F 50757-0 #⿰魚咨
9-3D40 50758-0 #⿰魚針
9-3D42 50760-0 #⿰魚常
9-3D43 50761-0 #⿰魚細
9-3D54 50778-0 #⿱沙鳥
9-3D56 50780-0 #⿰頁鳥
9-3D5A 50784-0 #⿱斑鳥
9-3D5B 50785-0 #⿲⿱屮㠯辛鳥
9-3D5C 50786-0 #⿰鳥



成果物


本日の版です。

最新版のTSVファイル
ver H21/02/14

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/02/14(土)13:01 |Comments(4) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

9-3B6E [厶]+[貝]と[口]+[貝]は包摂可能ですが(たとえばU+570EとU+5713は原規格分離だしU+FAA9はU+774Aのcompatibility variant)、同源の場合に限ります(たとえばU+24814があるにもかかわらずU+2AEC5が追加された)。つまり大漢和が50616-0を39572-0の異体字と説明しているかどうかまで確認しないと結論が出せません。
9-3C75 明記はありませんが、U+67E5とU+67FBは原規格分離でU+2F9AAはU+8516のcompatibility variantなので包摂可能と思われます。Annex.Sは包摂可能な例をすべて網羅しているわけではないのが面倒です。
2009/02/15(日)10:03 |えむけい | URL |編集
▲ページトップ

まずはここから始めてみては?
http://kanji-database.sourceforge.net/dict/daikanwa/index.html
2009/02/16(月)03:42 | | URL |編集
▲ページトップ

そちらはライセンスがGPLになり、自由に使えないため、新規に作ることになったのです。
2009/02/16(月)10:21 |miraicorp | URL |編集
▲ページトップ

変換表がそもそも著作物でなければGPLは適用されないはずなのですが、単なる番号を著作物だと言い張る〓〓〓〓〓のせいでこんなことになっているのです。
もしかしたら「もしあなたが変換表を著作物だと主張するなら、あなたも著作権を尊重してGPLに従ってください」という意味なのかもしれません。漢字データベース計画も〓〓〓〓〓の被害者なので。
http://kanji-database.cvs.sourceforge.net/viewvc/kanji-database/kanji-database/www/index.html?r1=1.22&r2=1.23
http://kanji-database.cvs.sourceforge.net/viewvc/kanji-database/kanji-database/www/index.html?r1=1.23&r2=1.24
まあ念のため、これ以上車輪の再発明を繰り返さなくて済むようなライセンスで変換表を一から作っておきたいわけです。
2009/02/21(土)07:47 |えむけい | URL |編集
▲ページトップ

コメントの投稿

大漢和辭典 変換表 2月16日 報告 ホーム 大漢和辭典 変換表 2月13日 報告
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

03 | 2017/04 | 05
- - - - - - 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 - - - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR