Skip navigation.

赤心慶福

Hyper Estraier and stannum

, ,

Stannum アップローダにログの全文検索を追加するという話。
mht ファイルなんかを受け付けている場合にその内容で検索できると便利なんじゃないかな!ということ。

Windows 鯖でも動かすことを考えて、全文検索エンジンはとりあえずHyper Estraierを使う。これを P2P モードで動かす。特に Windows 鯖では NT サービスとしてノードマスタを動かしておく。Hyper Estraier はすでに更新されなくなって久しい(Tokyo Estraier という新版に置き換えられている?)のだけどあまり気にしないことにする。

Stannum 側でやることは、
  • ファイルがアップロードされたときとファイルが削除されるときにノードマスタに対して http でやり取りする
  • アップロードされたファイルの内容から文書ドラフト(検索対象となるテキストとそのメタデータ)を生成する
  • 検索インターフェースを作る

…ということくらい。

どれも技術的にはぜんぜん難しいものはないのだけど、たとえば mht ファイルから文書ドラフトを生成するときに何を取捨選択するかという点はちょっと考える必要がある。最も単純には mht ファイル内の html ソースからタグを全消去すればよいのだけど、それだとメール欄に埋め込まれた文字列が無視されてしまうし、html というのはつまるところ虹裏のログなのだけど、どの html にも共通して存在するであろう部分(送信フォームやフッタや、レスごとの「…」など)は検索対象としても意味がない。この辺りは微調整しなければならない。

mod_uu: 1.2

  • 修正: Content-Type の保持を apr_hash_t にした
  • 修正: .htaccess でカウンタを定義すると prefork MPM の Apache で Internal Server Error になるのを修正
  • 追加: UUAddTargetMime、UUIgnore ディレクティブを新設

ソース

mod_uu-20090926-1.2.tar.gz

Windows バイナリ

mod_uu-20090926-1.2.zip

Read more...

mod_uu and stannum

某所の stannum uploader に見てる人数を出してみようかな!という話。

Read more...

mod_uu: 1.1

uu ハンドラで jsonp が指定された場合のコールバック識別子が空でないとき、^[a-zA-Z0-9_.\[\]]+$ かどうか確認するようにした。

ソース

mod_uu-20090921-1.1.tar.gz

Windows バイナリ

mod_uu-20090921-1.1.zip

mod_uu: unique user counter module -- final

mod_uu: unique user counter module #7


  • GDを使ってカウンタ画像を生成する。

  • Windows でビルドしてみる。

Read more...

mod_uu: unique user counter module #6

handler フックも付け足してみる。

また、configure も作るようにしてみる。

Read more...

mod_uu: unique user counter module #5

ログをデータベースにも保持できるようにしてみる。

Read more...

mod_uu: unique user counter module #4

カウンタを作る続き。

Read more...

mod_uu: unique user counter module #3

そんなこんなでぼちぼち作り始める。ちなみに Ubuntu 9.04 で作業する。

Read more...