CHISEとは何か
CHISE(CHaracter Information Service Environment)とは、京都大学の守岡知彦氏が提示する、「従来の文字コードによる文字処理システムの限界を乗り越えるべく開発された、コンピュータで文字を扱うための総合的環境」です。
CHISEでは、文字を文字が持つ様々な要素(字形・音・意味・従来の文字コードの情報)の集合体として捉える事に最大の特徴があります。その為、利用の形態に応じて柔軟な運用が可能であり、そこが従来の字形(グリフ)に重きを置かざるを得なかった文字コードに対する利点であると言えるでしょう。
詳しくは、CHISEプロジェクトのページを参照の事。
CHISE IDS漢字検索とは?
CHISE IDS漢字検索とはIDSで規格化された文字の「部品」を利用してCHISEプロジェクトの漢字情報データベースから漢字を検索する方法です(CHISE / 漢字構造情報データベースについて)。
IDSとは、「漢字構成記述文字列(Ideographic Description Sequence:漢字を複数の「部品」の集合体として捉え、これら「部品」の合成により1文字の漢字を表現しようとする)」方法の内、Unicodeで標準規格として定義されたものを指します。
Unicode番号 | 文字 | 内容 |
---|---|---|
2FF0 | ⿰ | 左→右 |
2FF1 | ⿱ | 上→下 |
2FF2 | ⿲ | 左→中央→右 |
2FF3 | ⿳ | 上→中央→下 |
2FF4 | ⿴ | 四方→囲む |
2FF5 | ⿵ | 上→囲む |
2FF6 | ⿶ | 下→囲む |
2FF7 | ⿷ | 左→囲む |
2FF8 | ⿸ | 左上→囲む |
2FF9 | ⿹ | 右上→囲む |
2FFA | ⿺ | 左下→囲む |
2FFB | ⿻ | 重ねる |
従来、この方法による漢字の検索は、XEmacs-CHISEといったいささか特殊な方法でしか利用できなかったのですが、2005年5月より同システムを利用した漢字検索Webページを通じて利用可能となった次第です。
現在では、UnicodeのCJK統合漢字・拡張領域A,Bの約7万字が利用可能です。無料で拡張領域Bまで検索可能な文字検索システムは他に殆どありませんので、是非覚えておきましょう。但し、表示には当然対応する字形(グリフ)が実装されたフォントが必要です。
CHISE IDS漢字検索で漢字検索
まず始めに、CHISE IDS漢字検索のWebページに移動しましょう。以下の画面が表示されるはずです。
部品文字列のフォームボックスに、検索する漢字の部品を入力してください(IDSの記号は入れないでください)。
ここでは、「命」の部品「亼叩」を入力しました。
部品の入力順は適当で構いません。思いついた部品を適当に入力しましょう。
入力したら、
をクリックして下さい。下の画面の
をクリックすると、CHISE IDS漢字検索を実行します。検索が終了すると、以下の画面に切り替わります。
一番左が、該当する文字です。リンクが貼られている場合、クリックするとそれぞれの情報が表示されます。
左(もしくは上):CHISEの漢字データベースの画面
右(もしくは下):Unicode.orgのUniha dataの画面
二番目は、Unicodeのコード番号です。
三番目がIDSの各部品です。
その他、CBETAや唐代拓本の画像へのリンクが表示される場合があります。
その他
画像で表示されていなければ、
→ ることで、Unicodeの文字として利用可能です。但し、貼り付けの際には、
→ で貼り付けた方がよいでしょう。また、UnicodeのShift-JIS領域以外の文字(BMP・ExtA,B)については、アプリケーションが対応していなければ利用できませんので注意して下さい。
IDSの部品は、文字を構成する要素全てを入力しなくても構いません。また、部品そのものの形ではなく、元の字形で入力しても構いません。(例:にんべん「亻」→人 その他、さんずいは「水」等)。
『大漢和辭典』の番号で検索する事も出来ます。番号は「&M-*****;」の形式(「*」は数値。上の「命」の場合は、&M-03473;になります)で入力し、
を左クリックしてください。フォームボックスに漢字に直された状態で表示されるはずです(もちろん、『大漢和辞典』の収録文字の中には、Unicode未収録のものもあります)。同様に、Unicode文字の実体参照形式(「&#*****;」の形式。*は数値。この事例では「佾」が相当)で入力して
を左クリックすると、フォームボックス上で当該の漢字に変換されます。目的の漢字を上手く探せない場合、検索したい漢字が持つ部品を共有する他の漢字で探してIDSの部品を確定し、それを利用して探してみましょう。
例:「䱷」を探したい。
この字は「虍(とらがしら)」「魚(さかな)」「攵(のぶん)」を部品として持っていると推定されます。
「魚」はすぐにIMEで出てきますが、「虍」「攵」は出てこないかもしれません。
その場合、この両字を含む漢字、例えば「虎」「教」等を一旦検索して、検索後に表示される部品「虍」「攵」を再利用して検索しましょう。