スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

--/--/--(--)--:--

スポンサー広告 | | | [編集]

▲ページトップ

大漢和辭典 変換表 6月1日 報告

TSVのチェック作業です


対応を変更した字


8-81A0/8-81DB



8-81A0 U+270E4 32469-0
8-81DB U+270E4 32527-0


8-81A0 U+270B0 32469-0
8-81DB U+270E4 32527-0

ヨの下の横棒が一本か二本かの違いですが、8-81A0と同じ字形の字がUnicodeにあったので、変更しておきました。


8-81A0/8-81DB



8-7BF1 U+273CA 31926-0 #⿱⺿䖵
8-8986 U+273CA 33450-0 #⿱⻀䖵


8-7BF1 U+2F9AB U+273CA 31926-0 #⿱⺿䖵
8-8986 U+273CA 33450-0 #⿱⻀䖵

互換文字があったので、入れておきました。



重複している字



重複していると判断したペア。
どちらを主とおくかは、Unicodeの符号位置から判断いたしました。


8-7478 U+21D0B 07842-0 16728-0
8-D531 U+21D0B 16728-0

8-BD7E U+233E0 14561-0
8-F547 U+233E0 19740-0 14561-0

8-6625 U+24562 06450-0 19745-0
8-F54C U+24562 19745-0

8-746E U+24BD3 07832-0 21671-0
8-29F6 U+24BD3 21671-0

8-376B U+2078F 02135-0
8-2A8F U+2078F 21693-0 02135-0

8-2C53 U+20362 01080-0
8-3BBD U+20362 23878-0 01080-0

8-5F37 U+257FF 05812-0 25153-0
8-45E1 U+257FF 25153-0

8-3373 U+20648 01769-0
8-5DA6 U+20648 28111-0 01769-0

8-7034 U+21B18 07403-0
8-638C U+21B18 28841-0 07403-0

8-5C44 U+21489 05544-0
8-6D87 U+21489 30089-0 05544-0

8-827D U+269E0 09063-0 30311-0
8-6EE9 U+269E0 30311-0

8-4230 U+20B02 03104-0
8-6F89 U+20B02 30340-0 03104-0

8-E651 U+23F68 18344-0
8-70CD U+23F68 30533-0 18344-0




似ている字



似ているけど、今回は重複扱いを見送ったペア。

8-3E39 U+24C1E 02739-0
8-2AC4 U+24C1E 21745-0 #KX0759.130

8-BE29 U+2628B 14570-0 #類似字形U+233F7
8-5E9C U+2628B 28229-0

8-8860 U+26B20 09598-0 #⺾
8-72B6 U+26B20 30757-0 #⺿




微妙なもの


U+2F8D7


8-BB5C U+2F8D7 14344-0 #月偏
8-66F5 U+2F8D7 29321-0

微妙にグリフが違うけど、別の字には見えない。
あと、U+2F8D7 の他に、U+43D9 があるようです。

8-BB5Cは、
8-66F5は、

U+43D9 kIRG_TSource 4-2765
U+2F8D7 kCompatibilityVariant U+43D9
U+2F8D7 kIRG_TSource 5-264A
http://www.cns11643.gov.tw/AIDB/query_general_view.do?page=4&code=2765
http://www.cns11643.gov.tw/AIDB/query_general_view.do?page=5&code=264A
TSourceだと月の形が違うようだ。


Unicodeの例示字体は、月 の幅が若干広いのがU+43D9、若干狭いのが U+2F8D7 となっているようです。
TRONの字体だと、8-BB5Cが狭く、8-66F5が広い気がする。

ということで、ひとまずはこんな感じではないかという気がしました。

8-BB5C U+2F8D7 14344-0 #月偏
8-66F5 U+43D9 U+2F8D7 29321-0

一応、TSVも書き換えてあります。



U+2754F


8-829F U+2754F 32593-0 33876-0
8-8CB4 U+2754F 33876-0

TRONだと微妙にグリフが違うけど、別字に見えない。
大漢和だと字体が違ってたりするのかもしれませんが。

一応、重複という扱いにしておいた。

8-829Fは、
8-8CB4は、





気付いた点


U+26518


8-6493 U+26518 28973-0
8-649D U+26518 28983-0 #⿰耒尋

8-6493は、
8-649Dは、

U+26518

几と口は包括可能なんでしょうか。Annex Sには、当該の記述はありませんでした。


成果物


本日の版です。

最新版のTSVファイル
ver H21/06/01

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/06/01(月)18:49 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

絵文字とUnicode ホーム gTef 0.02b beta 公開のお知らせ
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。