DOCS概要

仕様の概要


ISO/IEC 2022は、ISO/IEC 2022以外の符号に切り替えたり、戻ったりする機能があります。

エスケープシーケンスは ESC 2/5 (2/15) <F> です。

戻れる符号は ESC 2/5 <F>
戻らない符号は ESC 2/5 2/15 <F>

それぞれで、終端文字 <F> は別になります。


切り替えたあと、ESC 2/5 4/0で、再びISO/IEC 2022に戻れることになっています。
戻れる符号では、必ず戻る。戻れない符号は、良く分かりませんが、戻っても問題はないはず。


例えば、ESC 2/5 4/8 で UTF-8 に切り替えられますが、使った後で ESC 2/5 4/0 とすると、元の符号状態に戻ることができます。


現状の実装と予定


現在製造中の実装は、このような符号系にも対応可能なように設計されています。
しかしながら、ISO-IRのPDF資料には文字集合表が書かれていないから、どうしたものやら。
Unicode関係なら、何とかなりそうだけど。

NAPLSとかCCITT関係は、別途資料を取り寄せないと実装できそうにないですね。


しかしながらこの仕様、Unicodeの実装水準1から3が切り替え可能になっているわけですが、需要あるんだろうか。
今のところ、Unicodeまわりは、いわゆる実装水準3で処理が書かれているわけなので、実装水準の切り替えが必要とあれば、それなりの制限処理を書き加える必要があります。

2009/01/05(月)19:55 |Comments(3) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

> 戻れない符号は、良く分かりませんが、戻っても問題はないはず。
戻ってはいけません。戻ると、たとえばUCS-2に切り替えた後でU+001B U+2548が出現したときに誤動作します。
ESC 2/5 4/8では戻れませんが、切り替え先の符号に別途定める戻り方が定義されているかもしれません。「標準化された」戻りがないとはそういう意味です。
2009/01/06(火)12:05 |えむけい | URL |編集
▲ページトップ

> U+001B U+2548
> ESC 2/5 4/8
それぞれU+001B U+2540, ESC 2/5 4/0の間違いでした。論旨は変わりません。
2009/01/06(火)12:17 |えむけい | URL |編集
▲ページトップ

文章が分かりにくくてすみません。

この場合、そこまで明らかに違う符号系ではなく、例えばUTF-8などを想定していました。

ESC 2/5 4/7でUTF-8になり、戻ることもできます。
一方、ESC 2/5 2/15 4/7~4/9でもUTF-8ですが、こちらは戻れないことになってます。


仕様上は戻ることが保証されていなくても、処理系が戻れるように配慮することは悪くないかな、と思った次第です。
2009/01/07(水)22:12 |miraicorp | URL |編集
▲ページトップ

コメントの投稿

ラオス語のフリーフォント ホーム 94×94文字集合
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR