Jinglepot Collaboration

About Java and some other stuff..

Solr POI 全文檢索

, ,

目前Solr運作狀況:
4GB RAM的非專用主機,每天自動更新POI資訊及同義詞庫,並定時自動重啟,已跑了幾個月都沒問題.
之前碰到的系統資源不足問題,是因為我一次index進去800多萬筆的資料, 所以會當機. 現在只是少量幾萬筆的資料更新是輕輕鬆鬆. 再家上每天Optimize一次index,速度快又穩定. Solr真是超強!

善用同義詞SynonymFilterFactory可以解開不少困境. 另外有Dismax Query Handler功能強大.

Solr Java heap space problem solved!Velocity - 初步了解

Comments

Anonymous Wednesday, February 10, 2010 2:45:33 AM

Anonymous writes: 我們本身在商業上已經有用Solr建庫使用年餘了。目前也開始嘗試建立very large scale的data set,你說的系統資源不足問題,一個可能是你餵庫的程序建立流程安排,另外就是機器本身的硬體規格或OS資源的安排要改善(尤其是memory和swap space等)另外就是架構上你可能要考慮採行collection distribution、replication或者1.4版的true distributed等型態。 我們目前在做的是replication架構的lab test來測試VLS data set。未來會往true distributed架構來做。原因很簡單,即使single machine你建出800萬筆資料,但是performance poor的可以,在實際商務應用上也是無意義。 看到台灣很少人在談建置使用Solr的經驗,所以欣見你的Blog,上來

KTjinglepot Friday, July 16, 2010 4:31:55 AM

謝謝你的分享, 其實我們已經在1.4版後採用. 很久沒上來更新文章了..

How to use Quote function:

  1. Select some text
  2. Click on the Quote link

Write a comment

Comment
(BBcode and HTML is turned off for anonymous user comments.)

If you can't read the words, press the small reload icon.


Smilies

February 2012
S M T W T F S
January 2012March 2012
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29