My Opera is closing 3rd of March

对于Webus的重新理解

一切源于引擎

Webus的背景故事

早在2006年1月,我们就开始做搜索引擎。我们最先尝试的是二手火车票搜索引擎,正好赶上春运,没有想到效果非常明显,我们仅仅在百度的火车票吧里面发了几个帖子,每天就有上千次搜索。于是我们信心大增,决定好好做搜索引擎。(当时酷讯“http://www.kooxoo.com”也在火车票吧里面宣传,呵呵,没有想到现在它这么NB了)

一开始,我们认为火车票搜索的使用时间很短,春运过后就没有人用了(后来事实证明的确如此)。于是我们要扩大功能范围。这时我们想到了网上购物方面:人们在淘宝、易趣上面买东西,当时经常是一边看商品,一边在google或者百度上面搜索相关信息。但是这样效率不高,因为别人要看的主要是商品的导购信息,而搜索的结果中各种信息都有。于是我们就按照淘宝的栏目设置做商品导购搜索引擎。

我们的技术实现方法简单有效,就是将那些经常发布导购信息的索引页面添加到系统中,然后由后台蜘蛛程序去更新,将最新的导购资讯提取到数据库中供用户搜索。

在确定了基本方法之后,我们组织了三个人全力寻找添加各种索引页面。经过一个星期艰苦奋斗,我们一共添加了大概5千个页面,大家都累坏了,觉得这样不是办法。于是我们就开始想:有没有什么办法可以让程序自动识别索引页面?我们开始研究,最后终于找到了可行的办法,而且还开发出了新的蜘蛛程序。

利用新程序,我们一个星期可以轻松的获得好几万个索引页面。那个时候我们都认为“新的时代来临了”呵呵。

在新程序的支持下,我们的系统早已超出了专业搜索引擎的范畴,变成了一个通用的搜索引擎。同时我们可以很方便的为索引页面分类,因此在某个特定领域搜索信息也成了顺理成章的事情。在认识到这点之后,我们打出了“主题式搜索引擎”的概念,于是就有了本Blog中大家看到的前面几篇文章。

关于搜索引擎的超市理论关于抽象类( abstract class )和接口( interface )的理解

Write a comment

New comments have been disabled for this post.

March 2014
S M T W T F S
February 2014April 2014
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31