実装状況
このプロジェクトは2013年1月に始まりました。現在では次の項目の実装が完了しています:
- 検索エンジンのコア
- ビットベクタ
- ウェーブレットマトリックス
- SAIS(接尾辞辞配列 - Induced Sorting)
- FM-Index
- インデックスファイル生成ツール
- バイナリ読み書きユーティリティ
- SAX/HTMLパーサ
- コマンドライン引数パーサ
- 検索エンジンユーティリティ
- ステマー (Snowball へJSX/Pythonコードジェネレータを追加)
- 検索クエリーパーサ
- 日本語の分かち書き(TinySegmenter)
- インデックス生成ツール
- node.js用クライアント
- 検索用クライアント
- node.js用クライアント
- jQueryウェブクライアント
将来の実装予定の機能
- プレーンテキスト/CSVファイルのサポート
- 単語分割オプションの追加
- 移植性の向上のために、検索インデックスのフォーマットを MessagePack に変更
- Sphinx (ドキュメントツール)用のインデックス生成ツールのPython実装
Tweet