JISコード
JISとは、日本工業規格/Japanese Industrial Standardsのことで、昭和24年の工業標準化法に基づく国家規格です。
漢字コードに関するJIS規格は、規格番号「X」の情報処理部門(プログラム言語/図形・文書処理・文書交換/OSI・LAN・データ通信/出力機器・記録媒体)に分類されています。
JISコード
JISが制定した、日本語表記を想定した文字コード体系。JIS90までについていえば、日本語文字や記号(全角)は1文字を2バイトで、英数字、記号(半角)はアメリカ規格協会(ANSI)が定めたASCIIコードの1文字1バイトで構成されている。英数字と日本語(全角)文字の間は制御コード(エスケープシーケンス)を境界としている。区点コードは、JISコードの漢字(全角)部分のこと。
ASCIIとは American Standard Code for Information Interchange の略。
「テキストファイルとは何か」 第4章が非常に参考になりました。*1 |
「図解雑学 文字コード」 まさに図解。雑学を超えて理解できます。*2 |
JIS90
正式名称はJISX0208(7ビット及び8ビットの2バイト情報交換用符号化漢字集合)
1978/01/01制定。1990/09/01の第3次の規格改正からJIS90、または第4次1997/01/20の最終改正からJIS97と言われる。従来のフォントは基本的にこれに準拠している。
JIS2004
正式名称はJISX0213(7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合)
JIS X 0207:1997(1997年改正)を拡張した規格。
2000/01/20制定。JISX0208を拡張し、非漢字や、ローマ数字、単位記号などが追加されている。2004/02/20改正。JIS2004はこの改正後の規格のこと。168文字の字形変更を含む。
JIS漢字コード表の改正について 経済産業省報道発表
JIS2004で追加された304文字は、従来のJIS90対応フォントやそれに対応した漢字変換ソフトでは入力ができず空白表記になる。字形変更の文字については同じ文字でも利用者の環境(利用フォント等)によって字形が変わってしまうので、利用者の注意が必要。
また、従来は1文字を2バイトでサポートしていたが、この304文字は2バイトではなく、4バイト(UTF-8)やサロゲートペア(UTF-16)となるため、字形変更による混乱だけでなく、バイト数で文字数制御をしていたシステムやプログラムに対応が必要となっている。
参考:
インターネットバンキング
JIS2004フォントが一般的になるまでの各方面での時差