スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

--/--/--(--)--:--

スポンサー広告 | | | [編集]

▲ページトップ

大漢和辭典 変換表 12月7日 報告

久々に作業のまとめを上げておきます。

gTefでの実装に必要な重複の対策は終わりました。まだ全体的なチェックが行き届いておらず、ミスがある可能性ありますが、一人でチェックするのは無理があるので、お手伝い頂ける方を求めております。

重複している字


重複していると判断したペア。
どちらを主とおくかは、Unicodeの符号位置から判断いたしました。

8-243B U+7AD2 U+E0100 00310-0 25736-0
8-4AB5 U+7AD2 U+E0100 25736-0

8-642F U+439F 06274-0 28876-0
8-63AE U+439F 28876-0

8-3C9E U+4836 23974-0 38069-0
8-ADF4 U+4836 38069-0

8-6EE5 U+8F9E 30307-0 38638-0
8-B2BC U+8F9E 38638-0

8-B248 U+8FAC 13483-0 38667-0
8-B2D9 U+8FAC 38667-0

8-A29F U+4AC9 36601-0 43516-0
8-D9E1 U+4AC9 43516-0

8-EE55 U+9ED2 U+E0100 19098-0 48040-0
8-FDEE U+9ED2 U+E0100 48040-0

8-5B5B U+58AD 05474-0
9-363F U+58AD 50099-0 05474-0

8-F6AC U+9D96 U+E0100 47094-0
9-3D55 U+9D96 U+E0100 50779-0 47094-0

8-5359 U+2314D 04731-0 13767-0
8-B549 U+2314D 13767-0

8-B625 U+6B25 13825-0 16017-0
8-CD56 U+6B25 16017-0

8-BE29 U+2628B 14570-0 28229-0 #類似字形U+233F7
8-5E9C U+2628B 28229-0 #類似字形U+233F7

8-339D U+43E2 22838-0 29383-0
8-67B5 U+43E2 29383-0

8-BC25 U+440B 14379-0 29639-0 #月偏
8-69BC U+440B 29639-0

8-B8A0 U+90AA 39319-0
8-B8C7 U+90AA 39357-1 39319-0

8-C96B U+6A92 15662-0
8-DCD5 U+6A92 43880-0 15662-0

8-89FC U+4CCB 33568-0 46837-0
8-F4A6 U+4CCB 46837-0

8-62E0 U+7FF5 28800-0
8-F4C6 U+7FF5 46869-0 28800-0

8-70CF U+9D43 U+E0100 30535-0 46892-0
8-F4DD U+9D43 U+E0100 46892-0

8-5E25 U+9EA6 U+E0100 05700-1 47718-0
8-FBA6 U+9EA6 U+E0100 47718-0


IVS化


一部省略しているものもあります。

8-2394 U+7387 U+E0101 20817-0
8-2395 U+7387 U+E0100 20817-1

8-25F7 U+7471 U+E0100 21167-0 #⿰王眞
8-25F8 U+7471 21168-0 #⿰王真
下はIVS化できなかった

8-34C4 U+76DB U+E0100 23001-1
8-34C8 U+76DB U+E0101 23005-0

8-47F8 U+7A81 U+E0100 U+2592E 25424-0 #⿱穴大
8-4889 U+7A81 U+E0101 25439-0 #⿱穴犬

8-51BA U+7C3F U+E0101 26623-0 #甫 点は竹冠の足の下
8-51BB U+7C3F U+E0100 26623-1 #⿺⿻一由丶 点は竹冠の足の右側(外側)

8-53A6 U+7C7E 26853-0 #⿰米⿹刀丿
8-53A9 U+7C7E U+E0101 26857-0 #⿰米刄
上はIVS化できなかった

8-59BC U+7DF4 U+E0101 27631-1 #⿰糸東
8-59F7 U+7DF4 U+E0100 27689-0 #⿰糸柬

8-5AF1 U+7E2B U+E0100 27805-1 #⿰糸⿺辶夆 夂は払いではなく止め
8-5AF5 U+7E2B U+E0101 27809-0 #⿰糸⿺辶夆

8-5AED U+7E41 U+E0100 27803-1 #⿱⿰毎攵糸
8-5B9F U+7E41 U+E0101 27849-0 #⿱⿰每攵糸

8-61B6 U+7FC1 U+E0102 28635-0 #⿱公
8-61B7 U+7FC1 U+E0101 28635-1

8-61CD U+7FCC U+E0101 28657-0 #⿱立
8-61CE U+7FCC U+E0100 28657-1

8-61DD U+7FD2 U+E0101 28672-0 #⿱白
8-61DE U+7FD2 U+E0100 28672-1

8-62E2 U+7FFC U+E0100 28801-1
8-62F3 U+7FFC 28818-0 #U+E0102に似るが共の上の線は接触しない
下はIVS化するか悩んだけどやめておいた

8-63CD U+8015 U+E0101 28907-0 #⿰⿻丿未井
8-63CE U+8015 U+E0100 28907-1 #⿰⿻一未井

8-63D0 U+8017 U+E0101 28909-0 #⿰⿻丿未毛
8-63D1 U+8017 U+E0100 28909-1 #⿰⿻一未毛

8-66C8 U+809E U+E0100 29276-0
8-678E U+809E 29344-0 #⿰月㕚
下はIVS化できなかった

8-67C2 U+80DE U+E0101 29396-0 #⿰月⿻勹巳
8-67C3 U+80DE U+E0100 29396-1 #⿰月⿻勹己

8-66FC U+80BA U+E0101 29328-0
8-67DF U+80BA U+E0100 29422-1

8-6890 U+8108 U+E0102 29469-0 #㇙
8-6891 U+8108 U+E0101 29470-0 #㇑

8-6AEA U+819C U+E0100 29808-1
8-6B85 U+819C 29834-0
下はIVS化できなかった

8-75E6 U+83D3 U+E0101 31168-0 #⿱⺿果
8-75E7 U+83D3 U+E0100 31168-1 #⿱⺾果

8-73F7 U+8346 U+E0100 30940-0
8-7786 U+8346 31322-0 #⿰⿱⺿幵⺉
下はIVS化できなかった

8-7D92 U+8584 32083-0 #⿱⺿溥 U+E0101に似るが草冠は四画
8-7D93 U+8584 U+E0100 32083-1 #⿱⺾溥
上はIVS化するか悩んだけどやめておいた

8-809C U+85E4 U+E0101 32340-0 #⿱⺿⿸⿰⺼氺
8-809D U+85E4 U+E0100 32340-1 #⿱⺾⿸⿰月龹氺

8-82F3 U+8650 U+E0101 32678-0
8-82F4 U+8650 U+E0100 32678-1

8-8396 U+865C U+E0100 32710-0 #⿸虍男毌力
8-83A1 U+865C U+E0101 32720-1 #⿸虍男田力

8-83A4 U+865E U+E0101 32723-0 #⿸虍吳
8-83A5 U+865E U+E0100 32723-1 #⿸虍呉

8-84D9 U+86A9 U+E0100 U+2F9B7 32902-0
8-85A1 U+86A9 32972-0 #⿸⿳屮一虫丿
下はIVS化できなかった

8-84DF U+86AB 32908-0 #KX1079.090
8-85AD U+86AB U+E0100 32984-0
上はIVS化できなかった

8-8DE2 U+8853 U+E0101 34046-0 #⿴行朮
8-8DE3 U+8853 U+E0100 34046-1 #⿴行术

8-93C3 U+8981 U+E0101 34768-0 #⿱襾女
8-93C4 U+8981 U+E0100 34768-1 #⿱覀女

8-93D9 U+8986 U+E0101 34789-0 #⿱襾復
8-93DA U+8986 U+E0100 34789-1 #⿱覀復

8-99B2 U+8A8D U+E0101 35502-0 #⿹刀丿
8-99B3 U+8A8D U+E0100 35502-1 #⿻刀丶

8-99AD U+8AA0 U+E0100 35497-1
8-99D6 U+8AA0 U+E0101 U+2F9CF 35537-0

8-99DF U+8AA4 U+E0101 35546-0 #⿰言吳
8-99E0 U+8AA4 U+E0100 35546-1 #⿰言呉

8-99C1 U+8A95 U+E0102 35516-0
8-9AFB U+8A95 U+E0101 35692-1

8-9BD8 U+8B04 U+E0101 35780-0 #ハ
8-9BD9 U+8B04 U+E0100 35780-1 #ソ

8-9C84 U+8B19 U+E0101 35821-0 #ノノ
8-9C85 U+8B19 U+E0100 35821-1 #ソ

8-9DB0 U+8B66 U+E0100 35989-0 #⿱⿰⿱⺾句攵言
8-9DC5 U+8B66 36009-0 #⿱⿰⿱⻀句攵言
下はIVS化できなかった

8-9DE4 U+8B77 U+E0100 36038-1 #⿰言⿱⺾隻
8-9DEE U+8B77 36048-0 #⿰言⿱⻀隻
下はIVS化できなかった

8-A4E3 U+8D08 U+E0100 36920-1 #⿰貝曽
8-A4EC U+8D08 U+E0101 36929-0 #⿰貝曾

8-AD81 U+8E8D U+E0101 37955-0
8-AD82 U+8E8D U+E0100 37955-1 #⿰⻊⿱⿰彐彐隹

8-B0EC U+8F38 U+E0101 38438-0 #⿰車兪
8-B0ED U+8F38 U+E0100 38438-1 #⿰車俞

8-B19B U+8F44 U+E0102 38482-0 #⿰車⿳宀丯口
8-B19C U+8F44 U+E0100 38482-1 #⿰車⿳宀丰口

8-B389 U+8FBC U+E0101 38712-0 #⿺⻍入
8-B38A U+8FBC U+E0100 38712-1 #⿺⻌入

8-B681 U+9060 U+E0101 39047-0 #⿺⻍袁
8-B682 U+9060 U+E0100 39047-1 #⿺⻌袁

8-B687 U+9063 U+E0101 39052-0 #⿺⻍
8-B688 U+9063 U+E0100 39052-1 #⿺⻌

8-B5DE U+9055 U+E0102 39013-0 #⿺⻍韋
8-B698 U+9055 U+E0101 39067-1 #⿺⻌韋

8-B6A1 U+9069 39076-0 #⿺⻍啇
8-B6A2 U+9069 U+E0100 39076-1 #⿺⻌啇
上はIVS化できなかった

8-B6A8 U+906D U+E0101 39082-0 #⿺⻍曹
8-B6A9 U+906D U+E0100 39082-1 #⿺⻌曹

8-B6CE U+9075 U+E0102 39118-0 #⿺⻍⿱⿱八酉寸
8-B6CF U+9075 U+E0100 39118-1 #⿺⻌⿱⿱丷酉寸

8-B6D4 U+9077 U+E0101 39123-0 #⿺⻍⿳⻃大巳
8-B6D5 U+9077 U+E0100 39123-1 #⿺⻌⿳⻃大己

8-B6D9 U+9078 U+E0101 39127-0 #⿺⻍⿱⿰巳巳共
8-B6DA U+9078 U+E0100 39127-1 #⿺⻌⿱⿰己己共

8-B6E1 U+907A U+E0101 39134-0 #⿺⻍貴
8-B6E2 U+907A U+E0100 39134-1 #⿺⻌貴

8-B780 U+907F U+E0101 39163-0 #⿺⻍辟
8-B781 U+907F U+E0100 39163-1 #⿺⻌辟

8-B78C U+9084 U+E0101 39174-0 #⿺⻍睘
8-B78D U+9084 U+E0100 39174-1 #⿺⻌睘

8-BCD3 U+9177 U+E0101 39870-0 #⿰酉⿱牛口
8-BCD4 U+9177 U+E0100 39870-1 #⿰酉⿱⺧口

8-C3AE U+9396 U+E0101 40708-0 #⿰金⿱小貝
8-C3AF U+9396 U+E0100 40708-1 #⿰金⿱⺌貝

8-CCAE U+96A0 41836-0 #⿰⻖⿳⺥彐心
8-CCAF U+96A0 U+E0100 41836-1 #⿰⻖⿳⺤彐心

8-7C3C U+5DB2 U+E0101 08532-0
8-CE9F U+5DB2 U+E0100 42071-0

8-CFB3 U+96EA U+E0101 42216-0 #彐の右が突き出る
8-CFB4 U+96EA U+E0100 42216-1 #彐の右が突き出ない

8-FCE7 U+9EBF U+E0101 47909-0 #U+233B3
8-FCE8 U+9EBF U+E0100 47909-1 #木

8-7057 U+5C06 U+E0100 U+2F873 07437-0
8-7058 U+5C06 U+E0101 07437-1

8-7073 U+5C0E U+E0100 07463-1 #⿱⿺⻌首寸
8-7075 U+5C0E U+E0101 07465-0 #⿱⿺⻍首寸

8-7873 U+5D29 U+E0101 08212-0 #⿱山⿰⿵⺆⺀⿵⺆⺀
8-7874 U+5D29 U+E0100 08212-1

8-DB96 U+9867 U+E0101 43689-0 #⿰⿸戶隹頁
8-DB97 U+9867 U+E0100 43689-1 #⿰⿸戸隹頁

8-DDE6 U+98E2 U+E0101 44023-0 #⿰⻞几
8-DDE7 U+98E2 U+E0100 44023-1 #⿰⻟几

8-DEC3 U+98FD U+E0101 44109-0 #⿰⻞⿻勹巳
8-DEC4 U+98FD U+E0100 44109-1 #⿰⻟⿻勹己

8-DEC6 U+98FE U+E0101 44111-0 #⿰⻞⿱巾
8-DEC7 U+98FE U+E0100 44111-1 #⿰⻟⿱巾

8-DF82 U+9913 U+E0101 44168-0 #⿰⻞我
8-DF83 U+9913 U+E0100 44168-1 #⿰⻟我

8-DFC8 U+9928 U+E0101 44237-0 #⿰⻞官
8-DFC9 U+9928 U+E0100 44237-1 #⿰⻟官

8-E085 U+9942 44295-0 #⿰⻞昷
8-E0B1 U+9942 U+E0100 44339-0 #⿰⻞

8-E4FD U+9A30 U+E0101 44915-0 #⿰⺼⿱馬
8-E580 U+9A30 U+E0100 44915-1 #⿰月⿱龹馬

8-ECF2 U+9B54 U+E0101 45906-0 #⿸⿇鬼
8-ECF3 U+9B54 U+E0100 45906-1 #⿸麻鬼

8-EFB9 U+9BDB U+E0101 46226-0 #⿰魚
8-EFBA U+9BDB U+E0100 46226-1 #⿰魚周



草冠関係
片方しかIVS化できなかったもの

8-6F8B U+821E 30342-0
8-6F8C U+821E U+E0100 30342-1 #ヰ

8-729F U+82B3 30736-0 #⿱艹方
8-72A0 U+82B3 U+E0100 30736-1 #⿱艹方

8-72A5 U+82B8 30741-0 #⿱艹云
8-72A6 U+82B8 U+E0100 30741-1

8-72CE U+82D7 30781-0 #⿱艹田
8-72CF U+82D7 U+E0100 30781-1

8-72EC U+82F1 30808-0 #⿱艹央
8-72ED U+82F1 U+E0100 30808-1

8-7388 U+8302 30833-0 #⿱艹戊
8-7389 U+8302 U+E0100 30833-1

8-73DD U+8336 30915-0 #⿳艹人朩
8-73DE U+8336 U+E0100 30915-1 #⿳艹人朩

8-73FC U+8349 30945-0 #⿱⺿早
8-73FD U+8349 U+E0100 30945-1 #⿱⺾早

8-7487 U+8352 30953-0 #⿱⺿巟
8-7488 U+8352 U+E0100 30953-1 #⿱⺾巟

8-74B7 U+8377 31000-0 #⿱⺿何
8-74B8 U+8377 U+E0100 31000-1 #⿱⺾何

8-77AE U+843D 31362-0 #⿱⺿洛
8-77AF U+843D U+E0100 31362-1 #⿱⺾洛

8-77C8 U+8449 31387-0 #⿱⺿枼
8-77C9 U+8449 U+E0100 31387-1 #⿱⺾枼

8-7888 U+846C 31448-0 #⿳⺿死廾
8-7889 U+846C U+E0100 31448-1 #⿳⺾死廾

8-79B5 U+84B8 31618-0 #⿱⺿烝
8-79B6 U+84B8 U+E0100 31618-1 #⿱⺾烝

8-79CE U+84C4 31642-0 #⿱⺿畜
8-79CF U+84C4 U+E0100 31642-1 #⿱⺾畜

8-7B8C U+8526 31828-0 #⿱⺿鳥
8-7B8D U+8526 U+E0100 31828-1 #⿱⺾鳥

8-7DCF U+85A6 32143-0 #⿱⺿廌
8-7DD0 U+85A6 U+E0100 32143-1 #⿱⺾廌

8-7DD5 U+85AA 32149-0 #⿱⺿新
8-7DD6 U+85AA U+E0101 32149-1 #⿱⺾新

8-7DFD U+85AC 32188-0 #⿱䒑楽
8-7E80 U+85AC U+E0100 32188-1 #⿱⺾楽

8-80A3 U+85E9 32346-0 #⿱⺿潘
8-80A4 U+85E9 U+E0100 32346-1 #⿱⺾潘

8-81A9 U+862D U+E0100 32477-2 #⿱⺾⿵門東
8-81D3 U+862D 32519-0 #⿱⺿闌


気付いた点


U+43E2


8-339D U+43E2 22838-0
8-67B5 U+43E2 29383-0

8-339Dは、
8-67B5は、

同じ字にしか見えないが微妙にグリフが違う。
上が皮部、下が肉月部になっているようだが、それ以上に違いがあるようには思えない

こうしておいた。
8-339D U+43E2 22838-0 29383-0
8-67B5 U+43E2 29383-0



U+440B


8-BC25 U+440B 14379-0 #月偏
8-69BC U+440B 29639-0

これも同様

8-339Dは、
8-67B5は、

こうしておいた。
8-BC25 U+440B 14379-0 29639-0 #月偏
8-69BC U+440B 29639-0


U+90AA


8-B8A0 U+90AA 39319-0
8-B8C7 U+90AA 39357-1

これも同様

8-339Dは、
8-67B5は、

こうした。
8-B8A0 U+90AA 39319-0
8-B8C7 U+90AA 39357-1 39319-0


U+24454


8-F33E U+24454 19542-0 #⿱蓻火 Ext.Dで追加提案から落とされた
9-317E U+24454 49655-0 #丸の丿に付く横棒は二本

8-F33Eは、
9-317Eは、

両者の包括は無理がありすぎるのではないかと思ったので、8-F33Eの方を変更しました。

8-F33E 19542-0 #⿱蓻火 Ext.Dで追加提案から落とされた
9-317E U+24454 49655-0 #丸の丿に付く横棒は二本



成果物


本日の版です。

最新版のTSVファイル
ver H21/12/07

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/12/08(火)00:12 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

諸橋大漢和辭典の変換処理 ホーム gTef 0.18 beta 公開のお知らせ
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。