Apache 關閉百度搜尋引擎存取
Thursday, May 11, 2006 3:10:55 AM
不过如果你是用自己家里的电脑来做一些的测试的话
相信,你不会希望带来无谓的搜索请求,而让自己的电脑变慢
这个时候,这篇文章应该要看看咯
這個問題應該算是個架站初期我就從網站分析程式發現的問題 ,只是一直遲遲沒處理 .百度的搜尋引擎會由同一台IP(或許是 PROXY 的假 IP ,或許是這是百度覺得他可以搜的比別人快的原因) ,對我的站台同時一次發出數個網站瀏覽的要求 ,不過相對的他也在幫我做網站的壓力測試 ,試試看低頻寬(大陸到台灣應該下載不快 ,我家上傳也只有 640kb )多人是不是容易出問題.
也曾上過百度的網站反應過這個問題 ,不過他們好像不太理我 ,每天的存取量還是高居各搜尋引擎第一名 ,不過帶來的網站人潮又不如想像中的多 .(目前搜尋引擎找到我網站的第一名是 Yahoo , 第二名是 Google ,第三名才是 Baidu )
在我東裝西裝後 ,發覺網站的處理越來越複雜 ,來自正常使用者的瀏覽量大概也爬昇到了一天一千多頁 ,覺得該管管這個瘋狂的搜尋引擎了(一天來我網站查詢超過 10,000 次) ,查了一下相關的設定 ,就以下面的指令修改 .htaccess 來關閉 Apache 允許百度搜尋引擎的存取 .
SetEnvIf User-Agent ^Baiduspider badrobot
<Files *>
Order allow,deny
Allow from all
Deny from env=badrobot
</Files>
雖然這樣會失去來自百度搜尋引擎的使用者 ,不過至少我的網站會讓一般人瀏覽的快一點 ,如果那天百度搜尋引擎可以改善這個問題 ,再考慮拿掉吧 ,搜尋了一下網路 Baiduspider 被認為是 badrobot 的文章還真的不少 ,如果百度真的想成為華文第一大搜尋引擎品牌 ,這個問題該解決還是得解決吧 .
修改之後 ,真的隱約的覺得自己的電腦變快了說 .至少不會變成龜速在等電腦了 .













