睡人亭

文字コード入門

JIS漢字コード:JIS補助漢字・第三・第四水準漢字

JIS X 0212-1990

1990年に公布された6,067字の文字表です。正式名称は「情報交換用漢字符号―補助漢字」になります。(日本規格協会の該当規格情報)。

JIS X 0208系を拡張する規格で、「JIS補助漢字」とも呼ばれます(JIS X 0212のみを単独で使用することはありません)。JIS X 0208に含まれていないものの、日常の国語の文章の表記に用いる文字として必要だと思われる文字を収録しています。

02~11区
非漢字266字
16~77区
漢字5,801字

JIS X 0208に収録される漢字と重なっている漢字はありません。

JIS漢字コードのエンコーディングシステムの一つであるShift_JISで補助漢字を利用することができなかったため、WindowsやMac OSのエンコーディングシステムがShift_JISだった頃は、実質的には規格倒れの文字コードとなりかけていたのですが、Unicode2.1にJIS X 0212-1990収録漢字が全て収録されたことが補助漢字再生の契機となります。最新オペレーティングシステムで利用される文字コードがUnicodeベースとなるに従い、結果的に補助漢字も利用可能となったのです。ここに補助漢字が奇跡的?によみがえることとなりました。

Unicodeが採用されているWindowsNT4.0、2000、XP、VISTA、7,8やMacOS X、多言語化されたUNIX like OS等で利用可能ですが、アプリケーションがUnicodeに正しく対応している必要があります。「Unicode対応!」を唱うアプリケーションソフトの中には、Unicodeといっても実際にはJIS X 0208収録文字にしか実は対応していないものも多いので注意してください。

補助漢字:第16区文字表
0 1 2 3 4 5 6 7 8 9
1600
1610
1620 乿
1630
1640 仿
1650
1660
1670
1680
1690          

文字一覧はこちら(京都大学人文科学研究所安岡孝一氏のWebサイト掲載のもの)

JIS X 0213:2000

2000年に公布された4,344字の文字表です。正式名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」になります(日本規格協会の該当規格情報)。

JIS X 0208系を拡張する規格で、漢字については「第三水準漢字」「第四水準漢字」の二つの領域が設定されています。

文字表は「面区点番号」で構成される二つの94×94の表を持ち、一つ目の表(第一面)にJIS X 0208:1997の収録文字全てと、その際に保留領域として文字が割り当てられていなかった表の空き領域に「非漢字(659字)」「第三水準漢字(1,249字)」が、二つ目の表(第二面)には「第四水準漢字(2,436字)」がそれぞれ収録されています。面が二つになりましたので、JIS X 0212で文字表番号を記述する際には、面‐区-点をそれぞれ記述する必要があります。

JIS X 0212に収録される文字との関係は、「両方の規格に収録される文字」と「それぞれの規格にのみ収録される文字」との二種類あります。そのため、この両者を同時に使用することはできません(一応、第二面への文字割り当てに際しては、JIS X 0212の句点番号を避けて割り当てていますが、正式に両者を混用する規格は定められていません。)。

JIS X 0213は、「現在日本で(主に行政面で)使われている文字をコンピュータで扱えるようにする」というコンセプトから制定された規格です。そのため、JIS X 0208に収録されていない人名用漢字や地名や、学術用記号・ローマ数字など、公的な場で使用する機会が多いと考えられる文字が優先的に収録されています。

第3水準:第1面-14区の文字表。
番号は縦が点番号下二桁目・横が点番号下一桁目
0 1 2 3 4 5 6 7 8 9
1400   𠀋
1410 仿
1420
1430
1440
1450
1460
1470
1480
1490          
第四水準:第2面-第1区の文字表(Unicode2.1未収録字は背景色を変えてある)。
番号は縦が点番号下二桁目・横が点番号下一桁目
0 1 2 3 4 5 6 7 8 9
00 𠂉
10 𠂢 𠂤
20 𠆢
30 𠈓
40
50 倀
60
70
80 𠌫 𠍱
90          

JIS X 0213の実装

現在の最新版であるJIS X 0213:2004の附属書では、以下の三種類の符号化方式が定義されています。

  • ISO-2022-JP-2004
  • Shift_JIS-2004
  • EUC-JIS-2004

但し、現状でこの符号化方式を標準実装しているオペレーティングシステムはありません。

そのため、現状ではUnicode標準に収録され、なおかつJIS X 0213にも収録されている文字をUnicodeの符号化方式の中で使う事になります。

Unicode標準でJIS X 0213収録文字を全て使用する場合、BMP領域(第0面)のみに対応するオペレーティングシステムやアプリケーションでは使用できません。漢字については、BMP領域に加え、第2面(CJK統合漢字拡張B領域が収録される)にまで0213相当の文字が収録されているため、UTF-16のサロゲートペアといった拡張領域の文字を扱えるような実装をする必要があります。

現状、最新のオペレーティングシステムの多くがUnicode標準に対応しており、このレベルであればUnicode標準の文字は使用可能です。但し、アプリケーションレベルでは未だ未対応のソフトウェアも多く(Unicodeに対応を唱うアプリケーションソフトであっても、BMP領域にしか対応していないものもあります)、扱いには注意が必要です。

参考:新JIS漢字時代の扉を開こう!(青空文庫)

JIS X 0213: 2004

2004年2月20日に改訂された、JISの最新規格になります。

今回の改訂で最も大きな変更点は、2000年12月に出された国語審議会答申の「表外漢字字体表」に関わる部分です。

「表外漢字」とは、簡単に言ってしまえば「常用漢字表に含まれない文字」のことです。JIS漢字コードが工業規格として制定された経緯もあり、これら表外漢字のデザインはこれまで明確に定義されてきませんでした。そのため特にいわゆる新JISの字体改訂などに代表される簡略化の方向にあったフォントのデザインと、これまで使われてきた活字の字体が異なるという状況になってしまい、「コンピュータで出力できない文字!」というのが問題になってきました。

そのため、学校教育などで「ワープロソフトで作成したプリントの字で書いたら間違い(誤字)だと指摘された」という状況さえ起こってきたのです。

コンピュータで出力される文字と従来の印刷字形との齟齬を解消するために行われた会議の結果、上記の「表外漢字字体表」についての答申が提出され、その中で、「印刷標準字体」(1022字)及び「簡易慣用字体」(22字)が制定されました。前者は活字や『康熙字典』『大漢和辞典』といった既存の漢字字典のデザインを元に印刷用の字体として制定されたもの、後者は社会的に定着している字体として印刷用に使用してもよいと認められたものです。

JIS漢字コードもこの答申を承けて、2004年の改訂時に規格表の文字のデザインの一部について改変の必要を認め、変更(168字)・文字を追加(10字)することにしました。

JIS2004の段階では、漢字は第一~第四で10,050字収録されています。

字形が変更になった文字
面区点番号変更後の字形変更前の字形
1-16-9
1-16-18
1-16-27
1-16-78
1-16-81
1-16-83
1-16-92
1-17-10
1-17-25
1-17-29
1-17-34
1-18-8
1-18-64
1-18-71
1-18-86
1-18-90
1-19-2
1-19-10
1-19-75
1-19-83
1-19-88
1-20-45
1-20-69
1-21-11
1-21-32
1-21-66
1-21-68
1-21-72
1-22-10
1-22-34
1-22-47
1-22-84
1-22-91
1-22-93
1-23-9
1-23-23
1-23-68
1-23-81
1-23-94
1-24-3
1-24-16
1-24-33
1-25-11
1-25-28
1-25-49
1-25-84
1-25-89
1-26-21
1-26-71
1-27-7
1-27-10
1-27-12
1-27-13
1-27-33
1-28-61
1-28-62
1-29-22
1-29-61
1-29-82
1-29-83
1-30-5
1-30-68
1-30-83
1-31-10
1-31-54
1-31-64
1-32-2
1-32-81
1-32-89
1-32-90
1-32-92穿穿
1-32-93
1-33-7
1-33-25
1-33-44
1-34-23
1-34-29
1-34-60
1-34-93
1-35-9辿辿
1-35-14
1-35-23
1-35-80
1-35-85
1-36-29
1-36-40
1-36-42
1-36-52
1-36-82
1-37-2
1-37-7
1-37-14
1-37-38
1-37-40
1-37-43
1-37-50
1-38-52
1-38-59
1-38-70
1-38-71
1-38-74
1-39-9
1-39-55
1-39-71
1-39-73
1-39-93
1-40-4
1-40-32
1-40-52
1-40-80
1-40-85
1-41-3
1-41-15
1-41-21
1-41-31
1-41-32
1-41-46
1-41-64
1-42-35
1-42-45
1-42-46
1-42-51
1-42-58
1-42-60
1-42-89
1-43-9
1-43-80
1-43-88
1-44-57
1-44-63
1-44-66
1-44-76
1-44-90
1-44-92
1-45-18
1-46-90
1-46-91
1-46-92
1-47-17
1-47-64
1-49-45
1-50-55
1-50-91
1-51-62
1-51-83
1-55-49
1-57-8
1-59-89
1-60-84
1-64-36
1-65-17
1-65-20
1-65-54
1-67-14
1-67-62
1-68-7
1-68-32
1-71-7
1-71-59
1-71-74
1-73-42
1-73-71
1-74-4
1-75-35
1-80-43
1-80-55
1-81-57
1-82-77
従来の文字
文字面区点番号Unicode番号
1-22-705036
1-39-775265
1-28-2453F1
1-38-615451
1-17-195618
1-53-11598D
1-54-25C4F
1-54-855E76
1-33-7375E9
1-23-507E4B
追加された文字
文字面区点番号Unicode番号
1-14-14FF1
1-15-94525D
𠮟1-47-5220B9F
1-47-94541E
1-84-75653
1-94-9059F8
1-94-915C5B
1-94-925E77
1-94-937626
1-94-947E6B

これを承けて、フォントベンダーやソフトウェアベンダーは、JIS X 0213:2004に対応したフォントを作成・公開しつつあります。

Windowsでは、2007年に発売されたVISTAでこの規格に則った字形を実装するメイリオフォントを画面表示用フォントとして提供しています。また、従来よりの標準フォントの地位を占めているMS明朝とMSゴシックについても、JIS X 0213:2004に対応した字形に変更されたバージョンが収録されています。そのため、Windows Xpなどの旧来のバージョンで提供されていたMS明朝やMSゴシックと、同じコードポイントでありながら字形が異なる場合が生じてきます。Microsoftでは、Xp対応のJIS X 0213:2004に対応したフォントを提供しています。

参考
国語審議会「表外漢字字体表」
新JCS委員会平成13年度成果報告書
Windows XPおよびWindows Server 2003向けJIS2004対応MSゴシック&MS明朝フォントパッケージについて

JIS X 0213: 2012

2010年11月30日に内閣告示第二号にて告示された常用漢字表の改訂(規格表PDF)に対応して、改訂常用漢字表に準拠した記述の変更が改正内容です(引用例及び附属書12として追加)。そのため、2004年版と比べて文字の変更はありません。