大漢和辭典 変換表 3月19日 報告

こちらの作業はあまり進んでいませんが、融合したので、今の版を出しておきます。

グリフウィキのおかげで、字形の説明が楽になりました。ありがたいことです。代わりに、グリフ作りという難作業が増えましたが…。


TSVのチェック


8-4A80 から 8-528F まで終わりました。

チェック完了範囲
8-3CF6~8-528F

今後のチェック範囲
8-7277~8-3CF5
8-5290~8-FDFD ←現在作業中



気になったところ


8-4EB8 U+FA56 U+7BC0 26243-0

8-4EB8は、でした。

U+FA56は、でした。

IVSがありましたので第一候補にしました。第二候補に U+FA56 を残すべきでしょうか?

8-4EB8 U+7BC0 U+E0102 26243-0




Unihan関係


8-4FFB


8-4FFB U+25C83 26436-0 #攵 類似字形U+7C06

Unihanでは、以下の通りでした。
U+7C06 kMorohashi 26436

U+25C83とU+7C06の違いがさっぱり分からないのですが…
宀はともかく、攵の字形なんかも、例示体自体は両者同じですし…

U+7C06のC-G欄とK欄、とくにK欄が8-4FFBと一致している気がします。


プロパティで違ってそうな部分
U+7C06 kHanYu 53011.101
U+7C06 kIRGKangXi 0898.371
U+7C06 kIRG_GSource E-373A

U+25C83 kHanYu 53011.100
U+25C83 kIRGKangXi 0897.150
U+25C83 kIRG_GSource KX




IVSまわり


自信を持って同じだと言えるところでないと、やっぱり不安でIVSを書き足せないので、ちょっとでも違っていたらペンディングとしたいと思います。

8-51A3


8-51A3とU+7C36では、藷モの右下払いの「付け根」の位置が違う

8-51A3は、
U+7C36は、

康煕901ページ左上の方に該当字がありますが、微妙だ。
http://kangxizidian.com/kangxi/0901.gif

IVSは、とりあえず保留としておきます。

8-51A3 U+7C36 26600-0 #藷モ

8-51BA


この二つは実に惜しい

8-51BA U+7C3F 26623-0 #甫
8-51BB U+7C3F 26623-1 #⿺⿻一由丶

点の位置が違う。Adobe-Japan1側は、甫の丶が竹冠の足の右側、つまり外側にある。
一方、TRONの方は、甫の丶が竹冠の足の左側、つまり内側にある。


康煕902ページ右下の方に該当字がありますが、微妙すぎる。
http://kangxizidian.com/kangxi/0902.gif

IVSは、とりあえず保留としておきます。


8-51EC



8-51ECは、

U+7C4Aは、

U+7C4Aは、Adobe-Japan1の字形に出来るだけ近付くようにしておきました。


の字形が大いに異なるのですが、重視するべきはTRONでの字形よりも大漢和辭典の書体。
しかしいま手元に無いし図書館に確認に行く余裕もないので、康煕字典で確認。
右上のほう。
http://kangxizidian.com/kangxi/0903.gif

康煕は、U+7C4Aと同じような字形のようです。

8-51EC U+7C4A U+E0100 26671-0 # KX0903.040

一応IVSをつけておきます。


8-5287



8-5287は、

U+7C51は、

康煕字典で確認。左下の方。

http://kangxizidian.com/kangxi/0903.gif

良の右下が丶か払いかの違いですが、康煕では普通に払っていてUnicodeの例示字体に近い気がする。

8-5287 U+7C51 U+E0100 U+25D89 26697-0 #良 上は横棒、下は丶 KX0903.280

一応IVSをつけておきます。





成果物


本日の版です。

最新版のTSVファイル
ver H21/03/19

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/03/19(木)11:43 |Comments(2) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

・8-4EB8
追加した私が言うのもなんですが、落とすべきだと思います。互換漢字にAnnex.Sの規則は適用されないそうなので。
ただこの方針を厳密に適用すると、とくにCNS互換漢字(U+2F800~U+2FA1F)については辛いものがあります。以前申し上げた理由によりCNSは大漢和との「互換性」が高く、大漢和の統合されているっぽい字がちょうどCNS互換漢字に含まれているということが多々あります。CNS互換漢字はCNS11643との相互変換のためだけに使うべきで、そういう意味でもまずいのですが、漢字データベース計画の場合は大漢和←→CNS←→UCSのように、CNSを経由した変換表を作ることでこの問題を回避したようです。
とりあえずJIS X 0213互換漢字の範囲は字形を(IVS並みに)厳密に見ていいと思います。
・8-4FFB
U+7C06は、なぜかISOの規格票だとG欄の字形もU+25C83と同じなのですが、Unicode.orgのPDFではT欄と同じ字形になっており、SimSunの実装もこれに従っているようです。そこで中国が康煕字典と同じ字形を出すために、U+25C83を追加要求したようです。他国にとっては単なる重複かもしれません。
コメントを付けて候補を2つ並べておくのがよさそうだと思いました。
8-4FFB U+25C83 U+7C06 26436-0 #⿱⺮⿱宀⿺元攵 Unicode.orgのPDFおよびSimSunの実装ではU+7C06は⿱⺮⿱宀⿺元攴
2009/03/19(木)14:36 |えむけい | URL |編集
▲ページトップ

図書館で確認してきました。
・8-51A3
なんとどちらでもなく、右払いは接触していませんでした。カーブがきれいに描けないのですが、とりあえずグリフウィキに字を作ってみました。
http://glyphwiki.org/wiki/dkw-26600
・8-51BA
どちらでもなく、点は竹冠の足の下にあるように見えました。グリフウィキのu7c19みたいな感じです(もちろん十の部分はさんずいです)。
・8-51BB
点は竹冠の足の右側(外側)にありました。
・8-51EC
U+7C4A(のJ欄)同様の、接触していますが完全に接続されてもいない字形でした。
・8-5287
払わずに止めていました。

> とくにK欄が8-4FFBと一致している気がします。
TRONのフォントはソウルシステムズ制作だそうなので、デザインに韓国臭さが出るのかもしれません。
2009/03/28(土)00:20 |えむけい | URL |編集
▲ページトップ

コメントの投稿

ONESWING ホーム 続・したみずについて
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR