4.全文検索システムとは

4.1 全文検索システムの目的

全文検索システムとは、文章の全体から情報を検索するシステムのことである。つまり、あらかじめデータベースを作成することなく、一次情報である文書に対して直接検索するシステムである。全文検索システムには、Freya、SGSE、SSE、Namazuなどがあるが、私達が利用したのは、最もポピュラーなNamazuシステムである。

4.2 Namazuシステムの概要

Namazuは、愛知大学の高林哲氏が開発した日本語全文検索システムである。CGIとして動作させることにより、中小規模のWWW検索エンジンを構築することができるほか、ハードディスク内のファイルを対象としたようなパーソナルな用途にも使えるようになっている。

4.3 Namazuシステムの基本的な構成

Namazuには、大きく分けて@インデックス作成を担当する「インデクサ」といわれる部分、A実際に検索を行う「サーチエンジン」と呼ばれる部分び二つの機能がある。