ARIB STD-B24の符号化方法(CES)

「8単位符号」

ARIB STD-B24の仕様書の143ページに、「付録規定E UCSと8単位符号、EUC-JP、シフトJISの変換ならびに、拡張文字・DRCSとの対応」という記述があるのを発見した。

ここから読み取れることは、「8単位符号」と「EUC-JP」は、どうやら別物、ということです。

前に書いた、G0が漢字だったりGRがG2だったりするのは、恐らく「8単位符号」なのだと思われます。

EUC-JPが「異常なこと」になってなくて良かったですね。

「8単位符号」とEUC-JP

両者の差異は、G0~G3の指示やGL/GRへの呼出状態の初期状態にあります。
この規格でいうEUC-JPは、EUC-JPとしての標準的な状態になっているものと思われます。
というか、なっていてくれないと困る。

さて、ARIB独自の拡張文字(90区から94区)があるわけです。この仕様にも差があるようです。

この付録規定によれば、EUC-JPはG1にそのまま存在すると読み取れる。

また、8単位符号の場合は漢字系(エスケープシーケンスはJIS X 0208)にはなく、使う場合は追加記号(ESC 2/4 2/8-11 3/11)を使用せねばならない、と読み取れる。

突っ込みどころ満載の規格ですが、一応既存の仕様には出来るだけ準拠したい(既存の文字集合を独自に拡張したくない)という思いは、何となく伝わっては来ます。

仕様策定メンバーの大半が文字コードの知識がなく、ごく数名、知識がある人が何とか頑張った、といった情景が思い浮かびます。

それでも、JIS X 0213相当のエスケープシーケンスがISO-IR準拠でない理由は、未だ定かではありませんが。

「8単位符号」とUCS

備忘録として、判明したところを書いておきます

  • 対応付けは、JIS X 0221-2001 付属書2に従う
  • 但し、JIS X 0213:2004の対応付けと異なるものは、JIS X 0213:2004を優先する
  • ARIB/JIS X 0201の0x7e(OVERLINE)は、UCSのU+007E(TILDE)に割り当てる
  • 特に記載がないが、ARIB/JIS X 0201の0x5c(\)は、UCSのU+00A5(YEN SIGN)と思われる
  • 漢字集合系のノンスペーシング文字は、後述する文字に対応づける(一般的な変換表と違う)
  • 追加符号をUCSにする場合、表7-19のみか、表7-19に表7-20を適用して使うこと
  • JIS X 0213:2004を使う場合は、追加符号は使えないらしい(理由不明)
  • DRCSは、EC区00点(U+EC00のことか?)から「順次用いる」らしい

ノンスペーシング文字の対応

  • 1-13 ACUTE ACCENT → U+0301 COMBINING ACCUTE ACCENT(Oxia)
  • 1-14 GRAVE ACCENT → U+0300 COMBINING GRAVE ACCENT(Varia)
  • 1-15 DIAERESIS → U+0308 COMBINING DIAERESIS(Dialytika)
  • 1-16 CIRCUMFLEX ACCENT → U+0302 COMBINING CIRCUMFLEX ACCENT
  • 1-17 OVERLINE → U+0305 COMBINING OVERLINE
  • 1-18 LOW LINE → U+0332 COMBINING LOW LINE
  • 2-94 LARGE CIRCLE → U+20DD COMBINING ENCLOSING CIRCLE

これらはいわゆる結合文字であり、その扱いはUnicodeやISO/IEC 10646のそれに準ずるようである。

とすると、ARIBの仕様に準じて放送機器を作る場合、1-13はCOMBINING ACCUTE ACCENT相当として処理しなければならないのであろうか。

A´ (0x41 + 1区13点)という符号列は、画面上は Á になるのですか?

やっぱり突っ込みどころ満載ですね。

2009/01/27(火)15:12 |Comments(0) |Trackback(0)

製造開発 | プログラミング | コンピュータ | [編集]

▲ページトップ

コメント

コメントの投稿

ARIB STD-B24の対応状況 ホーム ARIB STD-B24モザイク集合など
トラックバック

この記事にトラックバックする(FC2ブログユーザー)
▲ページトップ

カレンダー

09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -

プロフィール

miraicorp

Author:miraicorp
未来情報産業(株) 社長

主として「ICカードこれひとつ」や「文字、文字コード」処理、時々C++などについて記述しています。

twitterツイッター

管理用

検索フォーム

お知らせ

コメント等お気軽にどうぞ。

気に入ったら拍手して頂けると、今後の記事を書く際の参考や励みになります。

■お仕事を募集しております
ソフトウェア製造の仕事や、原稿執筆の仕事などを随時受け付けております。
お気軽にご相談下さい

■初めての方へ
こまごまと更新しているため、他にも関連する記事があるかもしれません。
「月別アーカイブ」「検索フォーム」「カテゴリ」などをお試し下さい。
トップページはこちら

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

広告枠

メール

メールはこちら

リンク

このブログをリンクに追加する

RSSリンクの表示

QRコード

QR