EBCDIC+JEF

現在、以前いただいたJEFの仕様書、FACOM JEF 文字コード索引辞書 をパラパラと読んでおります。

これを頂いてから長い時間が経ちましたが、いよいよこれを完全実装しようと、そのように目論んでいるわけです。

漢字や非漢字の仕様は78と83で二種類あり、EBCDIC側は、EBCDIC(カナ)、EBCDIC(英子文字)、EBCDIC(ASCII)と三種類があるようです。
この辺をどうやって名前を付けて呼ぶべきかが難しいところですね。

KEIS78/KANA
KEIS78/SMALL
KEIS78/ASCII
KEIS83/KANA
KEIS83/SMALL
KEIS83/ASCII

あたりでしょうか。/ASCII だと、本当の意味のASCIIと勘違いしそうですかね。


漢字は原則としてEUC-JP相当ですが、漢字・非漢字含め、拡張文字が非常に多い。
旧JISの頃に作られたものの拡張のようなので、配列がカオス。

漢字モード中、
[0xa1-0xfe] [0xa1-0xfe] でJIS X 0208の文字
[0x41-0x7f] [0xa1-0xfe] で拡張文字
[0x80-0xa0] [0xa1-0xfe] で外字

となるようです。

外字は63×94で5922字分あるようです。BMPの外字領域(6400字)に収まりそうなので、外字はとりあえずUnicodeの当該領域に一対一でマッピングするとして、拡張文字については変換表作りに莫大な時間が掛かりそうな気がします。
大漢和辞典収録文字@TRONコード と、どちらの方が需要が高いのでありましょうか。

変体がなは、将来的にUnicodeでも表現可能になりそうですが、今はまだ不明。
問題なのは将来的にも対応しそうにないグラフ図形記号なるもの。これはどういう需要があって追加されたものなのだろうか。内部では専用に番号を振って管理するしかなさそう。


JEFが終わったら次はKEISですが、KEISは仕様書が手元に無いんですよね。
日本語がEUCでその範囲などはJEFと同じですが、拡張漢字のコードポイントはどうなんだろう。さすがに違うだろうか。

あと、仕様が良く分かりませんがNECにはJIPSEなるものがあるようだ。ACOS用の符号のようですが、ACOSは名前しか聞いたことがない。これは恐らく絶滅危惧種。

2009/08/30(日)17:36 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

メモリー間変換 ホーム gTef 0.06 beta 公開のお知らせ
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR