全文検索エンジン Hyper Estraier on SAKURA Internet
NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開@ITpro
という記事が今日ありましたね。仕事柄、検索エンジンに興味があるので
MySQLの全文検索用拡張であるSennaのPostgreSQL版なのかーと思っていたら、
SennaってのはMySQLありきって訳じゃなくて Senna + MySQL Binding で
MySQL全文検索ができる なので このLudia はSennaのPostgraSQL Bindingなのね
と今更ながら勉強になった。
DBの組み込み型の full-text search も便利だけどどちらかと言えば、
APIとかを通じていろんなことができる単体の検索エンジンの方が興味あり..
Senna単体がそれに当たるなら、Sennaを使ってみようかな... と思ったが、
どうせやるなら前から興味あったが時間がなくて触ってなかった Hyper Estraier を
今の旬の時期にやってみるか と腰を上げてみた。
以下さくらインターネットにインストールしたときのメモ
隠すのも面倒なのでsyumaro公開 ww
基本的にマニュアル通り
libiconv の install
fetch http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.11.tar.gz
tar zxvf libiconv-1.11.tar.gz
cd libiconv-1.11
./configure --prefix=/home/syumaro
make
make install
zlib の install
fetch http://www.zlib.net/zlib-1.2.3.tar.gz
tar zxvf zlib-1.2.3.tar.gz
cd zlib-1.2.3
./configure --prefix=/home/syumaro
make
make install
qdbm の install
fetch http://qdbm.sourceforge.net/qdbm-1.8.71.tar.gz
tar zxvf qdbm-1.8.71.tar.gz
cd qdbm-1.8.71
./configure --enable-zlib --prefix=/home/syumaro
make
make install
HyperEstraier本体のinstall
fetch http://hyperestraier.sourceforge.net/hyperestraier-1.4.5.tar.gz
tar zxvf hyperestraier-1.4.5.tar.gz
cd hyperestraier-1.4.5
./configure --prefix=/home/syumaro
make
make install
管理コマンドで動作確認
bash-2.05b$ estcmd
/usr/libexec/ld-elf.so.1: Shared object "libqdbm.so.14" not found
orz...
当然これが必要でした.
export LD_LIBRARY_PATH=/home/syumaro/lib
改めて..
bash-2.05b$ estcmd
estcmd: command line utility for the core API of Hyper Estraier
...
...
完了!
動作確認
とりあえず、indexを作ってみる
初期index作成
bash-2.05b$ estcmd create testindex
->testindexというフォルダができる
データ用意するの面倒なのでとりあえずは
bash-2.05b$ estcmd randput -rjp testindex 1000
にてランダム日本語文章を1000個indexing
中身の確認
bash-2.05b$ estcmd inform testindex
number of documents: 1000
number of words: 455579
number of keywords: 0
file size: 15452915
inode number: 15637027
attribute indexes:
検索してみる
- 「あいうえお」という文字列が含まれる文章
bash-2.05b$ estcmd search -va testindex あいうえお
- @digest 属性に 「aa」という文字列が含まれる文章
bash-2.05b$ estcmd search -va -attr '@digest STRINC aa' testindex
APIとかでいろいろ遊んでみる予定
トラックバック(2)
このブログ記事を参照しているブログ一覧: 全文検索エンジン Hyper Estraier on SAKURA Internet
このブログ記事に対するトラックバックURL: http://hiyuzawa.jpn.org/MT-4.0-ja/mt-tb.cgi/22

HotPepperAPIとGoogle/YahooMapAPIと連動させたアプリ。
■FlashImageSearch

flashで見る画像検索。アイドルデータベースと連動。
■FindJob転職情報メール一気読み

FindJobから定期的に送られてくる転職情報メールを一気に確認するためのTool。
■新着pickup

Yahoo!の新着ピックアップサイトをサムネイル付きで表示。自動更新。
■AU-GPS with Gmap

AU携帯電話をGPSとして利用.GoogleMapで行動を表示.製作記録まとめ中!!
■finding_yado

じゃらんAPIを使った宿探しサイト.リクルートMashupコンテスト応募作品
■オークション商品分析Tool

Y!オクAPIを使って多角的に商品を表示。Flashにて
■Yahoo!Directory with History

FlashでY!カテゴリをブラウズ.登録日時も合わせてビジアル表示.
■Okiny-Flash-Search

Yahoo!検索APIを用いてflash上で検索.ソフトウエアキーボドや検索語Suggest,人気語なども表示.
■Okiny-Search

YahooUILibraryのEffectとYahoo!検索APIを組み合わせた面白い検索結果の表示方法を体験.
■Quick-Dictonary

firefoxのGrasemonkeyを使ってウエブ上の単語(英語/日本語)を簡単に単語翻訳
■サーバサイドブックマーク

環境やブラウザに問わずどこでも自分のブックマークがみれるTool. タグによる保存も..本人はてぶ使ってますorz...
■myweb-bookmark/search

ウエブ/画像/Q&A/Amazon/Blogみんな一度に検索しちゃいます
■myweb-bookmark

ウエブ/Q&A/Amazon/BlogみんなでブックマークしちゃうTool.
--形にまだなってないやつ--
■地域スポット(観光地)登録
位置情報とコンテンツ情報を登録しておくといいことあるかも...
■国土数値情報ウエブサービス化
ダウンロードしてGoogleMapに重ねてみました...
