大漢和辭典 変換表 4月29日 報告

ISV作業は殆ど進んでいませんが、gTefにためしに導入するために、必要な作業を始めることにしました。


TSVのチェック


重複関係



重複が300件ほど発生しているようだったので、一箇所にまとめる方向で作業を始めました。
どちらを優先するかは、これといった基準がないので、暫定的にUnicodeの符号位置から判断しています。

不適切と思われれば、ご指摘下さい。


8-2165 U+20061 00069-0 02775-0
8-2533 U+36A2 00395-0 06040-0
8-6A5B U+2A508 06879-0 48326-0
8-3E72 U+2194B 02795-0 06958-0
8-2433 U+21C40 00302-0 07665-0 #「⿱丶一」ではなく亠
8-225E U+21D18 00157-0 07853-0
8-3379 U+221BB 01775-0 09200-0
8-215C U+2233D 00060-0 09608-0
8-5E79 U+68A6 05784-0 14871-0
9-2646 U+21F49 48562-0 08571-0 #「⿱丶一」ではなく亠
9-2A5E U+24510 48965-0 19682-0
9-2E51 U+24C00 49328-0 21701-0
8-345D U+25390 01841-0 23906-0
8-2769 U+77E6 00634-0 23937-0
8-47CD U+9F9D U+E0100 25381-0 48869-0
8-2A69 U+48CF 00916-0 39489-0
9-342C U+28FF3 49854-0 42081-0


気付いた点



下の二文字は同じ文字だと思いますが、TRONだと別にグリフを作ってしまったようで、微妙に書体が違ってますね。

8-CEA9 U+28FF3 42081-0
9-342C U+28FF3 49854-0 42081-0

8-CEA9は、
9-342Cは、

それとも、実際に異なる字だったりするのでしょうか。


ISV


ISVを付けて重複を回避できるものは、そのようにしました。

判明しているもの全部ではありませんが、今後は重複箇所を優先的に作業していこうかと。


8-B3AF U+8FCE U+E0101 38748-0 #⿺⻍卬
8-B3B0 U+8FCE U+E0100 38748-1 #⿺⻌卬

8-B3B4 U+8FD1 U+E0101 38752-0 #⿺⻍斤
8-B3B5 U+8FD1 U+E0100 38752-1 #⿺⻌斤

8-B3BB U+8FD4 U+E0101 38758-0 #⿺⻍反
8-B3BC U+8FD4 U+E0100 38758-1 #⿺⻌反

8-B3E3 U+8FEB U+E0101 38797-0 #⿺⻍白
8-B3E4 U+8FEB U+E0100 38797-1 #⿺⻌白

8-B3E7 U+8FED U+E0101 38800-0 #⿺⻍失
8-B3E8 U+8FED U+E0100 38800-1 #⿺⻌失

8-B3EB U+8FF0 U+E0101 38803-0 #⿺⻍朮
8-B3EC U+8FF0 U+E0100 38803-1 #⿺⻌术

8-B484 U+8FF7 U+E0101 38825-0 #⿺⻍米
8-B485 U+8FF7 U+E0100 38825-1 #⿺⻌米

8-B490 U+8FFD U+E0101 38836-0 #⿺⻍
8-B491 U+8FFD U+E0100 38836-1 #⿺⻌

8-B494 U+9000 U+E0101 38839-0 #⿺⻍艮
8-B495 U+9000 U+E0100 38839-1 #⿺⻌艮

8-B498 U+9001 U+E0101 38842-0 #⿺⻍⿱八天
8-B499 U+9001 U+E0100 38842-1 #⿺⻌⿱丷天

8-B49C U+9003 U+E0102 38845-0 #⿺⻍兆
8-B49D U+9003 U+E0100 38845-1 #⿺⻌兆

8-B4A1 U+9006 U+E0101 38849-0 #⿺⻍屰
8-B4A2 U+9006 U+E0100 38849-1 #⿺⻌屰

8-B399 U+8FC5 U+E0101 38727-0 #⿺⻍卂
8-B39A U+8FC5 U+E0100 38727-1 #⿺⻌卂

8-B4BD U+900F U+E0101 38876-0 #⿺⻍秀
8-B4BE U+900F U+E0100 38876-1 #⿺⻌秀

8-B4BF U+9010 U+E0101 38877-0 #⿺⻍豕
8-B4C0 U+9010 U+E0100 38877-1 #⿺⻌豕

8-B4C4 U+9013 38881-0 #⿺⻍
8-B4C5 U+9013 U+E0100 38881-1 #⿺⻌
二点にはIVSがありませんでした。

8-B4C6 U+9014 U+E0101 38882-0 #⿺⻍余
8-B4C7 U+9014 U+E0100 38882-1 #⿺⻌余

8-B4D1 U+901A U+E0101 38892-0 #⿺⻍甬
8-B4D2 U+901A U+E0100 38892-1 #⿺⻌甬

8-B4D7 U+901F U+E0101 38897-0 #⿺⻍束
8-B4D8 U+901F U+E0100 38897-1 #⿺⻌束

8-B4D9 U+9020 U+E0101 38898-0 #⿺⻍告
8-B4DA U+9020 U+E0100 38898-1 #⿺⻌告

8-B4DE U+9023 U+E0101 38902-0 #⿺⻍車
8-B4DF U+9023 U+E0100 38902-1 #⿺⻌車

8-B4FC U+902E U+E0101 38931-0 #⿺⻍隶
8-B4FD U+902E U+E0100 38931-1 #⿺⻌隶

8-B585 U+9031 U+E0101 38937-0 #⿺⻍周
8-B586 U+9031 U+E0100 38937-1 #⿺⻌周

8-B58C U+9032 U+E0101 38943-0 #⿺⻍隹
8-B58D U+9032 U+E0100 38943-1 #⿺⻌隹

8-B595 U+9038 U+E0101 U+FA67 38951-0
8-B596 U+9038 U+E0100 38951-1
互換漢字は第二候補に移動しました。

8-B5B9 U+9042 38985-0 #⿺⻍⿱八豕
8-B5BA U+9042 U+E0101 38985-1 #⿺⻌⿱丷豕
二点のIVSには適切なグリフがありませんでした。

8-B5BE U+9045 38989-0 #⿺⻍
8-B5BF U+9045 U+E0100 38989-1 #⿺⻌
二点にはIVSがありませんでした。

8-B5C1 U+9047 U+E0101 38991-0 #⿺⻍禺
8-B5C2 U+9047 U+E0100 38991-1 #⿺⻌禺

8-B5C5 U+904A U+E0101 38994-0 #⿺⻍斿
8-B5C6 U+904A U+E0100 38994-1 #⿺⻌斿

8-B5CA U+904B U+E0101 38998-0 #⿺⻍軍
8-B5CB U+904B U+E0100 38998-1 #⿺⻌軍

8-B5CE U+904D U+E0101 39001-0 #⿺⻍⿸戶
8-B5CF U+904D U+E0100 39001-1 #⿺⻌⿸戸

8-B5D0 U+904E U+E0101 39002-0 #⿺⻍咼
8-B5D1 U+904E U+E0100 39002-1 #⿺⻌咼

8-B5D9 U+9053 U+E0101 39010-0 #⿺⻍首
8-B5DA U+9053 U+E0100 39010-1 #⿺⻌首

8-B5DB U+9054 U+E0101 39011-0 #⿺⻍
8-B5DC U+9054 U+E0100 39011-1 #⿺⻌


8-B471



8-B471が、8-DBB9と重複とメモられていたので、対応しました

Unicodeの符号位置から、43723-0を主と置きました。

8-B471 U+29572 13713-0 43723-0 #8-DBB9と重複
8-DBB9 U+29572 43723-0



成果物


本日の版です。

最新版のTSVファイル
ver H21/04/29

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/04/29(水)16:37 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

Emoji Ad-Hoc Meeting Report ホーム Unicodeの音楽記号
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR