学部自主制作

題目

「漢字部品結合によるコンピュータ漢字処理」の基礎となる「形声字に着目した漢字分解」の一調査

要旨

現在、情報処理の世界では「漢字が足りない」といった議論が盛んである。これらは理解不足、知識不足や個人のさまざまな意図、思惑も影響して収拾がつかない状態にある。

私は、「漢字が足りない」という事実とその状況について、日本だけでなく漢字文化圏全体の「コンピュータと漢字」に関する現状をサーベイした。

また、「漢字部品結合によるコンピュータ漢字処理」という私の基本的解決案の一助として、漢字の大多数を占める造字法としての形声結合に特に注目した。この形声結合を基調とする漢字分解方法をJIS X 0221の漢字集合の一部(約17,000字)に対して施した結果約2,500個の漢字部品を導出した。

付属するデータ


修士論文

題目

漢字フォントの自動生成に関する研究 〜漢字部品・筆画の合成による細かな異体字表現の実現〜

要旨

本論文では、5万種類を越えると言われる様々な漢字をコンピュータ上で自由に扱うためのアプローチとして、漢字フォントをコンピュータに自動生成させるシステムを提案する。

従来のフォント自動生成の研究では、人間がデザインする前のベースフォントの生成を目的としたものが多く、文字の描画技術に重点が置かれたため異体字といった現状のコンピュータ上で扱うことのできない漢字フォントの自動生成にまで踏み込んだものは見受けられない。

本システムでは、複数個の座標から表現された漢字の筆画によって漢字字体の骨組みをデータ化し、約600種類からなる漢字部品を任意に合成することによって、漢字フォントを自動生成する。生成システムを構築するだけでなく、実際にコンピュータ上で扱うことのできない漢字をどこまで表現できるかという可能性を追求することにも重点を置いた。さらに、インターネットのような大規模なネットワーク上においての漢字フォントの情報交換を保証するための方法として、ネットワーク上にフォントサーバを置き、ネットワークに接続する全てのコンピュータ上で本システムによって生成されたフォントを同等に表示することができるしくみを提案する。

本論文では実際にフォント生成エンジンの実装を行い、様々な漢字フォントの生成を試みた。また、簡易フォントサーバを実装し、ネットワーク上において任意のフォントを配信する仕組みについて検証した。


博士論文

題目

多漢字情報処理環境の構築−漢字字形生成機構の応用−

要旨

国際標準文字コードであるISO/IEC 10646およびUnicodeの普及によって、さまざまな漢字をコンピュータ上で利用できるようになった。一方で、文字コードへの文字の収録には使用典拠の提出や標準的な字体の採用といった一定のルールがあるため、このルールに適合しない文字については収録されない。また、漢字はその種類が多くフォントのデザインにはコストがかかるため、ISO/IEC 10646に収録された全ての漢字を実装しているフォントは多くない。

本論文では、フォントデザインにおいて専門外となる一般ユーザーにおいても、不足している字を自由にデザインし、情報処理を可能とするフォント環境の構築を行った。具体的には、以下の2つのテーマについて研究を行った。

  1. 漢字字形生成機構の構築
    従来の字形輪郭記述による漢字字形のデータ化に代わり、骨格肉付け方式を中心とした漢字字形生成機構を構築した。3階層による漢字字形表現モデルによって、ISO/IEC 10646に収録される99.9%の漢字を表現できるという結果が得られた。この方式は、フォントデザインについて専門外のユーザーが容易に漢字字形のデザインを行うことを可能としている。
  2. 漢字字形管理環境の構築
    漢字字形表現モデルによる漢字字形編集機能およびフォント管理システムを組み込んだWEBベースでのフォントデータ共同管理環境を構築した。任意のユーザーがフォントデータの編集、漢字集合の追加・削除を行うことが可能であり、また蓄積されたデータを自由に利用できるものである。この環境により、従来閉じた環境で管理されていた外字フォントを、ネットワークを通じて共有することや、複数人による協同作業によってフォントのデザイン時間コストを抑えることが可能となった。

本研究を通じて、一般ユーザーのみならず人文学情報処理においても、文字コードの制限にとらわれない研究リソースのデジタル化の促進および研究の発展への応用が可能となった。

キーワード

1 漢字フォント自動生成 2 文字データベース 3 Webコラボレーション
4 異体字処理 5 外字処理

Koichi KAMICHI -- fonts.jp