Lazy Diary @ Hatena Blog

PowerShell / Java / miscellaneous things about software development, Tips & Gochas. CC BY-SA 4.0/Apache License 2.0

全文検索システム

CCLUB サーバの情報交換システムを NetNews から ML に変更するにあたり、これまでの News Archive を全文検索システムで検索できるようになっているといいなぁ、という話。
全文検索システムと言えば Namazu だろうか。 Estraier が導入が簡単でいい、という話もある。あと、マシンパワーは十分だし、単純な方がいいよね、ということで、grep してしまえという話もある。

$ time sh -c 'find /var/spool/news/articles/cclub | xargs grep "Yusuke Sato" > /dev/null'

real    0m1.130s
user    0m0.261s
sys     0m0.868s

あと、NewsGroup という性質上、ディレクトリごとにインデックスを持てるようになっているといいかなぁ、という気もするけど、まぁいいか。"cclub.projects.homepage AND HOGEHOGE" みたいに検索してください、ということで。