Wednesday, 16. December 2009, 08:28:56
php, hyperestraier, stannum
Stannum アップローダにログの全文検索を追加するという話。
mht ファイルなんかを受け付けている場合にその内容で検索できると便利なんじゃないかな!ということ。
Windows 鯖でも動かすことを考えて、全文検索エンジンはとりあえず
Hyper Estraierを使う。これを P2P モードで動かす。特に Windows 鯖では NT サービスとしてノードマスタを動かしておく。Hyper Estraier はすでに更新されなくなって久しい(Tokyo Estraier という新版に置き換えられている?)のだけどあまり気にしないことにする。
Stannum 側でやることは、
- ファイルがアップロードされたときとファイルが削除されるときにノードマスタに対して http でやり取りする
- アップロードされたファイルの内容から文書ドラフト(検索対象となるテキストとそのメタデータ)を生成する
- 検索インターフェースを作る
…ということくらい。
どれも技術的にはぜんぜん難しいものはないのだけど、たとえば mht ファイルから文書ドラフトを生成するときに何を取捨選択するかという点はちょっと考える必要がある。最も単純には mht ファイル内の html ソースからタグを全消去すればよいのだけど、それだとメール欄に埋め込まれた文字列が無視されてしまうし、html というのはつまるところ虹裏のログなのだけど、どの html にも共通して存在するであろう部分(送信フォームやフッタや、レスごとの「…」など)は検索対象としても意味がない。この辺りは微調整しなければならない。
Saturday, 26. September 2009, 04:10:43
apache
- 修正: Content-Type の保持を apr_hash_t にした
- 修正: .htaccess でカウンタを定義すると prefork MPM の Apache で Internal Server Error になるのを修正
- 追加: UUAddTargetMime、UUIgnore ディレクティブを新設
ソース
mod_uu-20090926-1.2.tar.gz
Windows バイナリ
mod_uu-20090926-1.2.zip
Read more...
Friday, 25. September 2009, 14:11:44
apache

某所の stannum uploader に見てる人数を出してみようかな!という話。
Read more...
Monday, 21. September 2009, 03:31:05
apache
uu ハンドラで jsonp が指定された場合のコールバック識別子が空でないとき、^[a-zA-Z0-9_.\[\]]+$ かどうか確認するようにした。
ソース
mod_uu-20090921-1.1.tar.gz
Windows バイナリ
mod_uu-20090921-1.1.zip
Thursday, 17. September 2009, 07:03:30
apache
- GDを使ってカウンタ画像を生成する。
- Windows でビルドしてみる。
Read more...
Tuesday, 15. September 2009, 13:15:50
handler フックも付け足してみる。
また、configure も作るようにしてみる。
Read more...
Tuesday, 15. September 2009, 08:21:48
apache
ログをデータベースにも保持できるようにしてみる。
Read more...
Friday, 11. September 2009, 15:26:23
apache
Thursday, 10. September 2009, 04:42:28
apache
そんなこんなでぼちぼち作り始める。ちなみに Ubuntu 9.04 で作業する。
Read more...
Showing posts 1 -
10 of 50.