English | Japanese

sary: Suffix Arrayのライブラリとツール

最終更新日: 2005-03-30 (公開日: 2000-11-06)


saryとは?

sary は Suffix Array のライブラリとツールです。Suffix Array と呼ばれるデータ構造を用いることにより、 10MB, 100MB といっ た巨大なテキストファイルに対する高速な全文検索を実現します。 特定の個所だけにインデックスポイントを割り当てることにより、 特定のフィールドのみを検索対象にすることもできます。

目次

新着情報

特徴

付属ツールの使い方

mksary

Suffix Arrayを構築します。メモリの少ない計算機で利用するとき は -b オプションを指定してください。その他のオプションは --help オプションを参照してください。実行例:

  # HUGE-TEXT ファイルに対して Suffix Arrayを作る

  % mksary HUGE-TEXT

  % ls HUGE-TEXT*
  HUGE-TEXT HUGE-TEXT.ary  # .ary ファイルが作られた

sary

mksary が構築した Suffix Arrayを利用 して HUGE-TEXT を PATTERN で検索検索します。GNU grep と同様に -i -A -B -C -c オプションが使えます。その他のオプションは --help オプション を参照してください。実行例:

  # HUGE-TEXT ファイルに対してキーワード PATTERN で検索

  % sary PATTERN HUGE-TEXT
  (検索結果が続く)

ダウンロード

GNU Lesser General Public License に従ったフリーソフトウェアとして公開します。

安定版

TODO

関連リンク集

メーリングリスト

sary メーリングリスト案内ページ から参加できます。


Satoru Takabayashi