全文検索エンジン Hyper Estraier on SAKURA Internet

| | トラックバック(2)

NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開@ITpro

という記事が今日ありましたね。仕事柄、検索エンジンに興味があるので
MySQLの全文検索用拡張であるSennaのPostgreSQL版なのかーと思っていたら、
SennaってのはMySQLありきって訳じゃなくて Senna + MySQL Binding で
MySQL全文検索ができる なので このLudia はSennaのPostgraSQL Bindingなのね
と今更ながら勉強になった。

DBの組み込み型の full-text search も便利だけどどちらかと言えば、
APIとかを通じていろんなことができる単体の検索エンジンの方が興味あり..
Senna単体がそれに当たるなら、Sennaを使ってみようかな... と思ったが、
どうせやるなら前から興味あったが時間がなくて触ってなかった Hyper Estraier
今の旬の時期にやってみるか と腰を上げてみた。

以下さくらインターネットにインストールしたときのメモ
隠すのも面倒なのでsyumaro公開 ww
基本的にマニュアル通り

libiconv の install

fetch http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.11.tar.gz
tar zxvf libiconv-1.11.tar.gz
cd libiconv-1.11
./configure --prefix=/home/syumaro
make
make install

zlib の install

fetch http://www.zlib.net/zlib-1.2.3.tar.gz
tar zxvf zlib-1.2.3.tar.gz
cd zlib-1.2.3
./configure --prefix=/home/syumaro
make
make install

qdbm の install

fetch http://qdbm.sourceforge.net/qdbm-1.8.71.tar.gz
tar zxvf qdbm-1.8.71.tar.gz
cd qdbm-1.8.71
./configure --enable-zlib --prefix=/home/syumaro
make
make install

HyperEstraier本体のinstall

fetch http://hyperestraier.sourceforge.net/hyperestraier-1.4.5.tar.gz
tar zxvf hyperestraier-1.4.5.tar.gz
cd hyperestraier-1.4.5
./configure --prefix=/home/syumaro
make
make install

管理コマンドで動作確認

bash-2.05b$ estcmd
/usr/libexec/ld-elf.so.1: Shared object "libqdbm.so.14" not found

orz...

当然これが必要でした.

export LD_LIBRARY_PATH=/home/syumaro/lib

改めて..

bash-2.05b$ estcmd
estcmd: command line utility for the core API of Hyper Estraier
...
...

完了!

動作確認
とりあえず、indexを作ってみる
初期index作成

bash-2.05b$ estcmd create testindex

->testindexというフォルダができる

データ用意するの面倒なのでとりあえずは

bash-2.05b$ estcmd randput -rjp testindex 1000

にてランダム日本語文章を1000個indexing

中身の確認

bash-2.05b$ estcmd inform testindex
number of documents: 1000
number of words: 455579
number of keywords: 0
file size: 15452915
inode number: 15637027
attribute indexes:

検索してみる

- 「あいうえお」という文字列が含まれる文章 
bash-2.05b$ estcmd search -va testindex あいうえお
- @digest 属性に 「aa」という文字列が含まれる文章
bash-2.05b$ estcmd search -va -attr '@digest STRINC aa' testindex

APIとかでいろいろ遊んでみる予定


トラックバック(2)

このブログ記事を参照しているブログ一覧: 全文検索エンジン Hyper Estraier on SAKURA Internet

このブログ記事に対するトラックバックURL: http://hiyuzawa.jpn.org/MT-4.0-ja/mt-tb.cgi/22

» bisexual twink free movies(bisexual twink free movies)~のトラックバック
» hardcore interracial fucking(hardcore interracial fucking)~のトラックバック

■MapPepper

HotPepperAPIとGoogle/YahooMapAPIと連動させたアプリ。

■FlashImageSearch

flashで見る画像検索。アイドルデータベースと連動。

■FindJob転職情報メール一気読み

FindJobから定期的に送られてくる転職情報メールを一気に確認するためのTool。

■新着pickup

Yahoo!の新着ピックアップサイトをサムネイル付きで表示。自動更新。

■AU-GPS with Gmap

AU携帯電話をGPSとして利用.GoogleMapで行動を表示.製作記録まとめ中!!

■finding_yado

じゃらんAPIを使った宿探しサイト.リクルートMashupコンテスト応募作品

■オークション商品分析Tool

Y!オクAPIを使って多角的に商品を表示。Flashにて

■Yahoo!Directory with History

FlashでY!カテゴリをブラウズ.登録日時も合わせてビジアル表示.

■Okiny-Flash-Search

Yahoo!検索APIを用いてflash上で検索.ソフトウエアキーボドや検索語Suggest,人気語なども表示.

■Okiny-Search

YahooUILibraryのEffectとYahoo!検索APIを組み合わせた面白い検索結果の表示方法を体験.

■Quick-Dictonary

firefoxのGrasemonkeyを使ってウエブ上の単語(英語/日本語)を簡単に単語翻訳

■サーバサイドブックマーク

環境やブラウザに問わずどこでも自分のブックマークがみれるTool. タグによる保存も..本人はてぶ使ってますorz...

■myweb-bookmark/search

ウエブ/画像/Q&A/Amazon/Blogみんな一度に検索しちゃいます

■myweb-bookmark

ウエブ/Q&A/Amazon/BlogみんなでブックマークしちゃうTool.


--形にまだなってないやつ--
■地域スポット(観光地)登録
位置情報とコンテンツ情報を登録しておくといいことあるかも...


■国土数値情報ウエブサービス化
ダウンロードしてGoogleMapに重ねてみました...


このブログ記事について

このページは、が2006年10月12日 23:19に書いたブログ記事です。

ひとつ前のブログ記事は「[mac] mac で ethereal メモ」です。

次のブログ記事は「Yahoo!の新着情報のピックアップサイトを集めてみた。」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 4.0