BIG5(大五碼)
1984年に資訊工業策進会が公布した13,461字の文字表です。当時の五大コンピュータ関連メーカーが調整して制定されたためにBIG5の名称で呼ばれます。公的な規格ではありませんが、台湾では実質的な標準規格として普及してきました。
文字表
文字表は、16進数4桁の番号が割り振られています。符号化に際しては、文字番号をそのまま2byteにエンコードして利用しています。
第一水準・第二水準とも、総画数(同一画数内は部首順)に並んでいます。
- A140~A3BF
- 非漢字408文字(単位用漢字9字を含む)が収録されています。
- A440~C67E
- 「第一水準」漢字5,401文字が収録されています。
- C940~F9D5
- 「第二水準」漢字7,652文字が収録されています。
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A440 | 一 | 乙 | 丁 | 七 | 乃 | 九 | 了 | 二 | 人 | 儿 | 入 | 八 | 几 | 刀 | 刁 | 力 |
A450 | 匕 | 十 | 卜 | 又 | 三 | 下 | 丈 | 上 | 丫 | 丸 | 凡 | 久 | 么 | 也 | 乞 | 于 |
A460 | 亡 | 兀 | 刃 | 勺 | 千 | 叉 | 口 | 土 | 士 | 夕 | 大 | 女 | 子 | 孑 | 孓 | 寸 |
A470 | 小 | 尢 | 尸 | 山 | 川 | 工 | 己 | 已 | 巳 | 巾 | 干 | 廾 | 弋 | 弓 | 才 | |
A4A1 | 丑 | 丐 | 不 | 中 | 丰 | 丹 | 之 | 尹 | 予 | 云 | 井 | 互 | 五 | 亢 | 仁 | |
A4B0 | 什 | 仃 | 仆 | 仇 | 仍 | 今 | 介 | 仄 | 元 | 允 | 內 | 六 | 兮 | 公 | 冗 | 凶 |
A4C0 | 分 | 切 | 刈 | 勻 | 勾 | 勿 | 化 | 匹 | 午 | 升 | 卅 | 卞 | 厄 | 友 | 及 | 反 |
A4D0 | 壬 | 天 | 夫 | 太 | 夭 | 孔 | 少 | 尤 | 尺 | 屯 | 巴 | 幻 | 廿 | 弔 | 引 | 心 |
A4E0 | 戈 | 戶 | 手 | 扎 | 支 | 文 | 斗 | 斤 | 方 | 日 | 曰 | 月 | 木 | 欠 | 止 | 歹 |
A4F0 | 毋 | 比 | 毛 | 氏 | 水 | 火 | 爪 | 父 | 爻 | 片 | 牙 | 牛 | 犬 | 王 | 丙 |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
C940 | 乂 | 乜 | 凵 | 匚 | 厂 | 万 | 丌 | 乇 | 亍 | 囗 | 兀 | 屮 | 彳 | 丏 | 冇 | 与 |
C950 | 丮 | 亓 | 仂 | 仉 | 仈 | 冘 | 勼 | 卬 | 厹 | 圠 | 夃 | 夬 | 尐 | 巿 | 旡 | 殳 |
C960 | 毌 | 气 | 爿 | 丱 | 丼 | 仨 | 仜 | 仩 | 仝 | 仚 | 刌 | 刉 | 匜 | 卌 | 圢 | 圣 |
C970 | 夗 | 夯 | 宁 | 宄 | 尒 | 尻 | 屴 | 屳 | 帄 | 庀 | 庂 | 忉 | 戉 | 扐 | 氕 | |
C9A1 | 氶 | 汃 | 氿 | 氻 | 犮 | 犰 | 玊 | 禸 | 肊 | 阞 | 伎 | 优 | 伬 | 仵 | 伔 | |
C9B0 | 仱 | 伀 | 价 | 伈 | 伝 | 伂 | 伅 | 伢 | 伓 | 伄 | 仴 | 伒 | 冱 | 刓 | 刐 | |
C9C0 | 劦 | 匢 | 匟 | 卍 | 厊 | 吇 | 囡 | 囟 | 圮 | 圪 | 圴 | 夼 | 妀 | 奼 | 妅 | 奻 |
C9D0 | 奾 | 奷 | 奿 | 孖 | 尕 | 尥 | 屼 | 屺 | 屻 | 屾 | 巟 | 幵 | 庄 | 异 | 弚 | 彴 |
C9E0 | 忕 | 忔 | 忏 | 扜 | 扞 | 扤 | 扡 | 扦 | 扢 | 扙 | 扠 | 扚 | 扥 | 旯 | 旮 | 朾 |
C9F0 | 朹 | 朸 | 朻 | 机 | 朿 | 朼 | 朳 | 氘 | 汆 | 汒 | 汜 | 汏 | 汊 | 汔 | 汋 |
CNS 11643-1986
1986年に経済部中央標準局が公布した13,735字の文字表です。BIG5とは異なり、こちらは正式な国家規格として制定されました。規格のWebサイト。
BIG5と同じく16進数4桁の文字番号を持ち、「第一字面」と「第二字面」から構成されます。BIG5との互換性を持っていますが、BIG5で複数登録されていた漢字は一文字に纏められています(前ページの表参照)。
文字 | 重複している番号 | |
---|---|---|
兀 | A461 | C94A |
嗀 | DCD1 | DDFC |
また、BIG5の画数部首配列を一部訂正したことにより、BIG5の文字配列とは異なる個所が多く見られます。
Unicode2.1のCJK統合漢字領域に収録されていますので、日本語オペレーティングシステム+アプリケーションがUnicode2.1に対応していれば利用可能です。
文字一覧はこちら(第一字面)とこちら(第二字面)(京都大学人文科学研究所 安岡孝一氏のWebサイト掲載のもの)
通用漢字標準交換碼
1988年に行政院主計処電子処理資料中心発表した6,319字の漢字表です。俗に「第十四字面」とも呼ばれるのは、CNS 11643の「第十四字面」として使われることを想定したためです。
16進数4桁の文字番号を持ち、第一部と第二部で構成されています。
- 2121~6246
- 「第一部」漢字6,148文字が収録されています。
- 6247~6435
- 「第二部」漢字171文字が収録されています。
CNS 11643「第一・第二字面」の異体字が多く収録されており、その多く(4,197文字)がUnicode2.1のCJK統合漢字領域に収録されることになります。そのため、JISの新旧字体と並び、Unicodeのコードセパレート問題を生じる要因となりました。
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2120 | 丨 | 丶 | 丿 | 亅 | 丅 | 丄 | 冂 | 冖 | 匸 | 卩 | 厶 | 个 | 亇 | 义 | 凢 | |
2130 | 乆 | 亏 | 亼 | 亾 | 兦 | 凣 | 刄 | 劜 | 夂 | 夊 | 宀 | 巛 | 幺 | 广 | 廴 | |
2140 | 彐 | 彑 | 彡 | 阝 | 乣 | 乢 | 亣 | 内 | 仅 | 仏 | 从 | 仌 | 冄 | 円 | ||
2150 | 凤 | 刅 | 办 | 劝 | 勽 | 匀 | 区 | 卆 | 卝 | 历 | 厷 | 双 | ||||
2160 | 収 | 圡 | 帀 | 弌 | 户 | 戸 | 攴 | 攵 | 无 | 玍 | 亗 | 仠 | ||||
2170 | 仧 | 仦 | 囘 | 冋 | 册 | 写 | 凥 | 刋 |
CNS 11643-1992
1992年に経済部中央標準局が公布した48,711字の文字表で、CNS 11643-1986の改訂版になります。
- 「第一字面」「第二字面」
- CNS 11643-1986と同じになります。
- 「第三字面」
- 「第十四字面」の「第一部」と同じになります。
- 文字一覧はこちら(京都大学人文科学研究所 安岡孝一氏のWebサイト掲載のもの)
- 「第四字面」
- 2121~6E5Cに漢字7,298文字が収録されています。
- 総画数順に並んでいます。
- 「第十四字面」の「第二部」漢字171文字を全て含みます。
- 文字一覧はこちら(京都大学人文科学研究所 安岡孝一氏のWebサイト掲載のもの)
- 「第五字面」
- 2121~7C51に漢字8,603文字が収録されています。
- 総画数順に並んでいます。
- 文字一覧はこちら(京都大学人文科学研究所 安岡孝一氏のWebサイト掲載のもの)
- 「第六字面」
- 2121~647Aに十四画以下の漢字6,388文字が収録されています。
- 文字一覧はこちら(京都大学人文科学研究所 安岡孝一氏のWebサイト掲載のもの)
- 「第七字面」
- 2121~6655に十五画以上の漢字6,539文字が収録されています。
- 「第六・七字面」まとめて総画数順に並んでいます。
- 文字一覧はこちら(京都大学人文科学研究所 安岡孝一氏のWebサイト掲載のもの)
- 罕用字体表
- 1986年に教育部から公布された18,480字の漢字表で、「常用国字標準字体表」「次常用国字標準字体表」以外に使われる場合のある漢字を収録 しています。
- 「第一~第五字面」には「罕用字体表」18,480文字を全て含んでいます。
- 「第六・第七字面」は「異体国字字表」の漢字を収録しています。
- 異体国字字表
- 1984年以降教育部が改訂を続ける漢字表で、「常用国字標準字体表」「次常用国字標準字体表」の異体字を収録しています。
Unicodeとの関係
CNS11643の1~15面収録文字とUnicodeとの対応については、以下の通り。
公式サイトの全字庫現況→CNS11643與Unicode對應表を参照。
- CNS11643収録文字:102637
- UnicodeのBMP領域収録文字:39141
- 拡張第二面(B・C)収録文字:43239
- 拡張第15面(私的領域)収録文字:20257