スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

--/--/--(--)--:--

スポンサー広告 | | | [編集]

▲ページトップ

KEIS/JEF

KEISとJEF


日本語処理のKEISとJEFの入出力に対応しました。

拡張漢字には未対応で、JIS C 6226-1978ないしJIS X 0208-1983に対応します。

JEF (旧JISのみ、12pt、9pt両対応)
  EBCDIC(英小文字)
  EBCDIC(カナ)
  EBCDIC(ASCII)

KEIS
 旧JIS
  EBCDIC
  EBCDIK
 新JIS
  EBCDIC
  EBCDIK


JEF


JEFは、FACOM JEF文字コード索引辞書という正式の仕様書を第一文献として実装しますので、きちんとした実装が可能です。
1バイトの部分は、仕様書にある3種類のEBCDICに対応しました。

2バイトの部分は、今回は暫定なので、JIS C 6226の範囲内のみ対応しています。
12ptと9ptがありますが、入力は両対応しptを区別せず、出力は指定したptで行ないます。


記号類はコード順の表が掲載されており、実装はそれほど難しくなさそうです。
一方、拡張漢字のコード順の表は無いので、いずれ総画数索引などに掲載された一覧から一つずつ拾って変換表を作ることになるかと思います。もちろんUnicode番号などは掲載されていないので、完全手作業のマッチング作業になります。

他の同様の製品を見ると、拡張漢字に未対応を謳うものばかりです。
大きな企業の製品としても、これは簡単には作れないもののようです。
仕様書によると、拡張漢字は4034文字、拡張非漢字1048文字あるそうです。
4034字を1字あたり3分で探すとすると、200時間くらい。1日8時間やったとして25日。
実際は半年はかかりそう。

ぱっとみた範囲内だと、漢数字の 八 C8AC の下に、全く同じグリフの八が 43E4拡 とか書かれている。どうしたら良いのだろう。


KEIS


KEISは、新旧JISがあるようなので、両方に対応するように作っておきました。

ベースがEBCDIKのほかにEBCDICがあるらしいのですが、仕様書が手元にないため、EBCDICの仕様が定かでありません。今回は、JEFの英小文字の変換表を暫定的に参照するように実装してあります。
EBCDIKも、資料により異動があり仕様が良く分かりませんので、今回は既知の EBCDIKに最も近い、IBMのCP01136で実装しておきました。

KEISは有名ですが、仕様が今ひとつ不明なところが多く、仕様書の入手方法も定かではありません。
仕様に詳しい方がいましたら、ぜひ開発にご協力頂ければと思います。
よろしくお願いします。


全角空白


全角空白については、入力は0x4040 0xa1a1両方に対応しますが、出力はいずれも0x4040に固定しています。
0xa1a1の出力が必要という需要は無いと思っていますが、もし必要があれば、その時に対応します。


2009/10/09(金)22:08 |Comments(0) |Trackback(0)

製造開発 | ソフトウェア開発 | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

wg2 ホーム 中文処理
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。