大漢和辭典 変換表 3月10日 報告

TSVのチェック


8-4480 から 8-48FD まで終わりました。


8-4496


8-4496 U+79D6 24955-0

8-4496は「⿰禾牙」ですが、U+79D6は「⿰禾氏」でした。
U+4130 が正しいと思われたので、そのように変更しました。

8-4496 U+4130 24955-0


異体字セレクタ


8-44D3、8-44D4


8-44D3 U+79F0 25016-0 #⿰禾尔
8-44D4 U+79F0 25016-1 #⿰禾尓

ダッシュ付きの方のみ、IVSがありました。

8-44D3 U+79F0 25016-0 #⿰禾尔
8-44D4 U+79F0 U+E0100 25016-1 #⿰禾尓


8-458C、8-458D


8-458C U+7A05 25070-0 #⿰禾兌
8-458D U+7A05 25070-1 #⿰禾兑

Unihanだと、次のようになっています。

U+7A05 kMorohashi 25070
U+7A0E kMorohashi 25070'

kMorohashiのほかに、kIRGDaiKanwaZiten なるプロパティが存在するのに気がついた。使い分けは定かではありませんが。

とりあえず、次のようにしておきました。

8-458C U+7A05 U+E0100 25070-0 #⿰禾兌
8-458D U+7A0E U+E0100 25070-1 #⿰禾兑


8-47C4


8-47C4 U+258F1 25372-0

Unihanだと、次のようになっています。

U+7A6F kMorohashi 25372

字形は間違いなく U+258F1 なのですが、U+7A6Fと包括できる要素があるのでしょうか。
Unihanを見る限りでは、規格や字典類で一致してそうな条件が見あたりません。
とりあえずは第二候補に入れておくべきでしょうか。



断念したもの


微妙に違うので、IVSを付けるのをあきらめたもの。


心の真ん中の点の位置が、右の点と比べて、上か、同じか、の違い。
線の長さや接触するかどうかの違いすら気になるお年頃ですと、点の高さともなれば、相当重要な要素なのではないかと勝手に想像。

以下は、Adobe-Japan1では心の中央の点が上にありますが、TRONの字形だと同じ高さだったもの。


8-45B3 U+7A14 25107-0 #心の点の位置
8-48C0 U+7A93 25494-0 #心の点の位置






その他IVS


単純な変換です

8-4598 U+7A0B 25081-0 #⿰禾⿱口⿱丿土
8-4599 U+7A0B 25081-1 #⿰禾⿱口王
         ↓
8-4598 U+7A0B U+E0101 25081-0 #⿰禾⿱口⿱丿土
8-4599 U+7A0B U+E0100 25081-1 #⿰禾⿱口王


8-4687 U+7A40 U+2F959 25188-1 #⿱⿱士冖禾殳
8-46A8 U+FA54 U+7A40 25221-0 #⿱⿳士冖一禾殳
         ↓
8-4687 U+7A40 U+E0101 U+2F959 25188-1 #⿰⿱士冖禾殳
8-46A8 U+7A40 U+E0100 U+FA54 25221-0 #⿰⿱士冖⿱一禾殳


成果物


本日の版です。

最新版のTSVファイル
ver H21/03/10

プロジェクトのページ
http://www.mirai-ii.co.jp/data/moro/

2009/03/10(火)18:02 |Comments(4) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

・8-4496
失礼、ミスでした。ご指摘の通りU+4130で正しいと思います。
・8-458C、8-458D
原規格分離に気付きませんでした。異議ありません。
・8-47C4
人人と左右の払いをくっつけて変形させれば口口に見えなくもないですが、相当無理があると思います。
「G-source」の「E-」で始まっているものは、UROのうちそれまで中国の規格になかったものをすべて収録するためにでっち上げられた規格なので、実質的にはTの単独ソースです。翻刻ミスか何かによるCNSの誤字形と考えて、単純削除でいいのではないでしょうか。
2009/03/11(水)14:02 |えむけい | URL |編集
▲ページトップ

いちおう8-AE49..8-3CF5が埋まりました。
http://charset.info/tron8-20090311.txt
8-3CF6以降も若干更新されています。とくにExt.D周りは参照していたドラフトが古いことが判明したので、かなり変わっています。
ご指摘いただいた点も修正されていますが、異体字セレクタは相変わらず付いていないので単純に上書きしてしまわないように注意してください。
いちおう前回との差分も上げておきます。
http://charset.info/tron8-20090304-20090311.diff
2009/03/11(水)21:01 |えむけい | URL |編集
▲ページトップ

お疲れ様です。
手元では融合を完了しました。
2009/03/12(木)13:11 |miraicorp | URL |編集
▲ページトップ

IVDのglyphic subsetは文字通り(文字が取り得るグリフの集合の)部分集合なので、一切のデザインの揺れが認められないという性質のものではありません。
Adobe-Japan1-0の範囲のグリフはJIS90の規格票字形を忠実に再現していることになっています。別記事にコメントしたとおりの理由もあり、小塚明朝と平成明朝の字形差はデザインの揺れと考えざるを得ないのではないかと思っています。
また接触するかしないかと、接触する場合の位置には非常にうるさいですが、接触しないものの位置関係は(この「心」の例みたいに)意外といい加減なようです。
2009/03/15(日)13:44 |えむけい | URL |編集
▲ページトップ

コメントの投稿

大漢和辭典 変換表 3月12日 報告 ホーム CJK統合漢字とURO
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR