Skip navigation.

物有所不足,智有所不明

关注:php,mysql,ajax ,linux, js,开源

Win平台下安装ionCube

,

1,先到下面的地址下载:

http://downloads.ioncube.com/loader_downloads/ioncube_loaders_win_x86.zip (zip版)

http://downloads.ioncube.com/loader_downloads/ioncube_loaders_win_x86_ipf.zip (Installer版,我用这个安装好像有点问题)

2,解压ioncube_loaders_win_x86.zip到你想安装的目录



3,复制目录里的几个PHP文件到你的WEB目录,apache的目录(我用WAPM,所以目录是/usr/local/www/data)

4,执行安装http://yourip/path/ioncube-loader-helper.php

注:ioncube-loader-helper.php是你从ioncube里copy过来的

5,在刚才打开的页面里有三个连接,你点第二个(run-time loading installation instructions)进行安装,安装成功没成功会在点完后打开的页面的告诉你的

看下就知道了

6,如果成功了,点后退,再点页面里的第一个连接(php.ini installation instructions)来看你的PHP等的一些信息,同样也有告诉你下一步应该如何去做

7,在你的PHP的配置文件里加上一行

zend_extension_ts = X:\path\ioncube_loader_win_4.3.dll

注:这里的这个ioncube_loader_win_4.3.dll里因我用的是4.3.11,这个会在你做第六步的时候可以看到应该用哪个文件


然后重启apache


ionCube安装完成。

雅虎公司开源其UI库和设计模式

日前,雅虎公司将其UI库和设计模式(Design Patterns)开放出来,雅虎再一次向业界展示了它Web战略,以及与设计和开发社区之间主动合作关系。据说雅虎公司将保持对设计模式库项目每月一次的更新。

雅虎UI库的网页介绍:
The Yahoo! User Interface Library is a set of utilities and controls, written in JavaScript, for building richly interactive web applications using techniques such as DOM scripting, HTML and AJAX.

参考

http://developer.yahoo.net/yui/

http://developer.yahoo.net/ypatterns/

Apache rewrite技术实现Apache到lighttpd迁移

, ,

毫无疑问Apache是一个优秀的web server,但它也不万能的,在一些特定的环境下,也有Apache力不从心的时候。手上一台server由于瞬间高密度的访问非常多,因此Apache 1.3.x应付起来有点吃力,表现为响应速度慢,而且非常耗资源,Swap经常都是占满的。有一两次还导致机器负载过高(高达30-40,有个别时刻居然达到150之巨),感觉要死机的样子。

为此,必须寻求一个解决之道。分析之下,这台server目前的情况主要是由于运行了大量的fastcgi应用,而且这些应用的并发非常密集,平时白天就有200-300个连接,厉害的时候有近1000个在用进程。apache的运行情况top如下:

25806 nobody 15 0 7224 5888 1652 S 0.0 0.5 0:10 1 httpd
28152 nobody 15 0 6576 5856 1680 S 0.0 0.5 0:01 1 httpd
28686 nobody 15 0 7224 5808 1652 S 0.0 0.5 0:01 1 httpd

可见每个process的Share 内存就有1.6MB之多,如果是1000个进程就是1.6G了。加上其他开销,实际需要2G的存储空间,机器的内存是1G,交换区是1G,那实际上Swap将全部耗尽。

如何降低这些开销呢?fastcgi应用程序已经较好的优化了,耗费的资源很少,而且只有少于10个进程在运行,因此问题不在fastcgi。问题在Apache的并发响应能力,以及资源占用上。

使用lighttpd可以较好的解决这个问题,lighttpd基于单进程多路复用技术,因此消耗的资源非常少。而且支持fastcgi,但由于对php的支持仅限于fastcgi,与机器现有的一些网站并不能很好的兼容,因此考虑前端(80端口)用Apache,后端(2088)用lighttpd,通过rewrite技术,将fastcgi请求转交(Redirect)给后端的lighttpd处理。

这样原理上就能使apache的进程大幅度减少,并只是负责请求的转发而已,可以充分的利用原来的进程资源。而lighttpd消耗的cpu/memory资源也较低,因此完成同样的任务,Apache+lighttpd的方案就比原来的纯Apache要好得多。

实际运行证明,效率要好得多,响应速度提高了一个数量级以上。客户反映良好。

Apache rewrite + lighttpd 实现方法
原来负载较高的网站主机名highload.xxx.com ,运行的fastcgi prefix是/fcgi-bin。因此需要对这个虚拟主机进行Rewrite配置。

第一步,编译apache,激活mod_rewrite:

./configure \
--with-layout=Apache --prefix=/usr/local/httpd \
--enable-shared=max --enable-module=rewrite \
--enable-shared=rewrite
安装并加载好之后,配置highload.xxx.com的虚拟主机,在VirtualHost里增加:

RewriteEngine on
RewriteRule ^\/fcgi-bin\/(.+) http://highload.xxx.com:2088/$1
第二步,编译lighttpd,配置fastcgi并使lighttpd监听于2088端口:

./configure --prefix=/usr/local/lighttpd
配置:

server.modules = (
"mod_access",
"mod_fastcgi",
"mod_accesslog" )

server.document-root = "/var/www/vhost/highload/fcgi-bin/"
server.errorlog = "/var/log/lighttpd/lighttpd.error.log"

server.indexfiles = ( "index.php", "index.html",
"index.htm", "default.htm" )

mimetype.assign = (
".pdf" => "application/pdf",
".sig" => "application/pgp-signature",
".spl" => "application/futuresplash",
".class" => "application/octet-stream",
".ps" => "application/postscript",
".torrent" => "application/x-bittorrent",
".dvi" => "application/x-dvi",
".gz" => "application/x-gzip",
".pac" => "application/x-ns-proxy-autoconfig",
".swf" => "application/x-shockwave-flash",
".tar.gz" => "application/x-tgz",
".tgz" => "application/x-tgz",
".tar" => "application/x-tar",
".zip" => "application/zip",
".mp3" => "audio/mpeg",
".m3u" => "audio/x-mpegurl",
".wma" => "audio/x-ms-wma",
".wax" => "audio/x-ms-wax",
".ogg" => "audio/x-wav",
".wav" => "audio/x-wav",
".gif" => "image/gif",
".jpg" => "image/jpeg",
".jpeg" => "image/jpeg",
".png" => "image/png",
".xbm" => "image/x-xbitmap",
".xpm" => "image/x-xpixmap",
".xwd" => "image/x-xwindowdump",
".css" => "text/css",
".html" => "text/html",
".htm" => "text/html",
".js" => "text/javascript",
".asc" => "text/plain",
".c" => "text/plain",
".conf" => "text/plain",
".text" => "text/plain",
".txt" => "text/plain",
".dtd" => "text/xml",
".xml" => "text/xml",
".mpeg" => "video/mpeg",
".mpg" => "video/mpeg",
".mov" => "video/quicktime",
".qt" => "video/quicktime",
".avi" => "video/x-msvideo",
".asf" => "video/x-ms-asf",
".asx" => "video/x-ms-asf",
".wmv" => "video/x-ms-wmv",
".bz2" => "application/x-bzip",
".tbz" => "application/x-bzip-compressed-tar",
".tar.bz2" => "application/x-bzip-compressed-tar"
)

url.access-deny = ( "~", ".inc" )
server.port = 2080

fastcgi.server = ( "prog1" =>
("prog1" =>("socket" => "/tmp/prog1.socket")),
"prog2" =>
("prog2" =>("socket" => "/tmp/prog2.socket"))
)
这样lighttpd将监听于2088端口,访问http://highload.xxx.com:2088/prog1或prog2就可以执行fastcgi应用了。

注意,由于prog1/prog2等程序是非PHP 的fastcgi程序,由perl/c写成,因此必须用lighttpd的spawn-fcgi程序实现将这些fcgi应用运行,才能启动lighttpd,否则lighttpd会出错。

进入/usr/local/lighttpd/bin,执行:
./spawn-fcgi -s /tmp/prog1.socket -f /var/www/vhost/highload/prog1

./spawn-fcgi -s /tmp/prog2.socket -f /var/www/vhost/highload/prog2
执行成功的话,将显示:

spawn-fcgi.c.160: child spawned successfully: PID: 602
重新启动apache,这样凡是访问http://highload.xxx.com/fcgi-bin/prog1或prog2,将自动定向到http://highload.xxx.com:2080/prog*。

经过这样改进后,平均的Apache进程数从650-700降低到250,其余的400-500个并发就由lighttpd来处理。整机的负载也降低了很多。主要是内存使用大幅度降低了。只有原来的40%用量,swap余量非常足够:-)

而且最重要的是,响应速度快了很多。以下是并发请求的监视图:


注意:图上显示的是按每秒的并发请求次数,而不是并发连接数,并发连接数大概是这个数的10倍,也即如果有25请求/秒,那么实际在一段时间内的持续并发连接数就有250-300个。

基于反向代理的Web缓存加速-----可缓存的CMS系统设计

内容摘要:
对于一个日访问量达到百万级的网站来说,速度很快就成为一个瓶颈。除了优化内容发布系统的应用本身外,如果能把不需要实时更新的动态页面的输出结果转化成静态网页来发布,速度上的提升效果将是显著的,因为一个动态页面的速度往往会比静态页面慢2-10倍,而静态网页的内容如果能被缓存在内存里,访问速度甚至会比原有动态网页有2-3个数量级的提高。


动态缓存和静态缓存的比较
基于反向代理加速的站点规划

基于apache mod_proxy的反向代理加速实现
基于squid的反向代理加速实现
面向缓存的页面设计
应用的缓存兼容性设计:
HTTP_HOST/SERVER_NAME和REMOTE_ADDR/REMOTE_HOST需要用 HTTP_X_FORWARDED_HOST/HTTP_X_FORWARDED_SERVER代替
后台的内容管理系统的页面输出遵守可缓存的设计,这样就可以把性能问题交给前台的缓存服务器来解决了,从而大大简化CMS系统本身的复杂程度。

静态缓存和动态缓存的比较
静态页面的缓存可能有2种形式:其实主要区别就是CMS是否自己负责关联内容的缓存更新管理。

静态缓存:是在新内容发布的同时就立刻生成相应内容的静态页面,比如:2003年3月22日,管理员通过后台内容管理界面录入一篇文章后,就立刻生成http://www.chedong.com/tech/2003/03/22/001.html这个静态页面,并同步更新相关索引页上的链接。


动态缓存:是在新内容发布以后,并不预先生成相应的静态页面,直到对相应内容发出请求时,如果前台缓存服务器找不到相应缓存,就向后台内容管理服务器发出请求,后台系统会生成相应内容的静态页面,用户第一次访问页面时可能会慢一点,但是以后就是直接访问缓存了。

如果去ZDNet等国外网站会发现他们使用的基于Vignette内容管理系统都有这样的页面名称:0,22342566,300458.html。其实这里的0,22342566,300458就是用逗号分割开的多个参数:
第一次访问找不到页面后,相当于会在服务器端产生一个doc_type= 0&doc_id=22342566&doc_template=300458的查询,
而查询结果会生成的缓存的静态页面: 0,22342566,300458.html

静态缓存的缺点:

复杂的触发更新机制:这两种机制在内容管理系统比较简单的时候都是非常适用的。但对于一个关系比较复杂的网站来说,页面之间的逻辑引用关系就成为一个非常非常复杂的问题。最典型的例子就是一条新闻要同时出现在新闻首页和相关的3个新闻专题中,在静态缓存模式中,每发一篇新文章,除了这篇新闻内容本身的页面外,还需要系统通过触发器生成多个新的相关静态页面,这些相关逻辑的触发也往往就会成为内容管理系统中最复杂的部分之一。
旧内容的批量更新: 通过静态缓存发布的内容,对于以前生成的静态页面的内容很难修改,这样用户访问旧页面时,新的模板根本无法生效。
在动态缓存模式中,每个动态页面只需要关心,而相关的其他页面能自动更新,从而大大减少了设计相关页面更新触发器的需要。


以前做小型应用的时候也用过类似方式:应用首次访问以后将数据库的查询结果在本地存成一个文件,下次请求时先检查本地缓存目录中是否有缓存文件,从而减少对后台数据库的访问。虽然这样做也能承载比较大的负载,但这样的内容管理和缓存管理一体的系统是很难分离的,而且数据完整性也不是很好保存,内容更新时,应用需要把相应内容的的缓存文件删除。但是这样的设计在缓存文件很多的时候往往还需要将缓存目录做一定的分布,否则一个目录下的文件节点超过3000,rm *都会出错。


这时候,系统需要再次分工,把复杂的内容管理系统分解成:内容输入和缓存这2个相对简单的系统实现。


后台:内容管理系统,专心的将内容发布做好,比如:复杂的工作流管理,复杂的模板规则等……
前台:页面的缓存管理则可以使用缓存系统实现

______________________ ___________________|Squid Software cache| |F5 Hardware cache|---------------------- ------------------- \ / \ ________________ / |ASP |JSP |PHP | Content Manage System ----------------
所以分工后:内容管理和缓存管理2者,无论哪一方面可选的余地都是非常大的:软件(比如前台80端口使用SQUID对后台8080的内容发布管理系统进行缓存),缓存硬件,甚至交给akamai这样的专业服务商。


面向缓存的站点规划
一个利用SQUID对多个站点进行做WEB加速http acceleration方案:
原先一个站点的规划可能是这样的:
200.200.200.207 www.chedong.com
200.200.200.208 news.chedong.com
200.200.200.209 bbs.chedong.com
200.200.200.205 images.chedong.com
面向缓存服务器的设计中:所有站点都通过外部DNS指向到同一个IP:200.200.200.200/201这2台缓存服务器上(使用2台是为了冗余备份)
_____________________ ________www.chedong.com 请求 \ | cache box | | | / 192.168.0.4 www.chedong.com news.chedong.com 请求 -| 200.200.200.200/201 |-|firewall| - 192.168.0.4 news.chedong.com bbs.chedong.com 请求 / | /etc/hosts | | box | \ 192.168.0.3 bbs.chedong.com --------------------- --------
工作原理:
外部请求过来时,设置缓存根据配置文件进行转向解析。这样,服务器请求就可以转发到我们指定的内部地址上。
在处理多虚拟主机转向方面:mod_proxy比squid要简单一些:可以把不同服务转向后后台多个IP的不同端口上。
而squid只能通过禁用DNS解析,然后根据本地的/etc/hosts文件根据请求的域名进行地址转发,后台多个服务器必须使用相同的端口。
使用反向代理加速,我们不仅可以得到性能上的提升,而且还能获得额外的安全性和配置的灵活度:

配置灵活性提高:可以自己在内部服务器上控制后台服务器的DNS解析,当需要在服务器之间做迁移调整时,就不用大量修改外部DNS配置了,只需要修改内部DNS实现服务的调整。
数据安全性增加:所有后台服务器可以很方便的被保护在防火墙内。
后台应用设计复杂程度降低:原先为了效率常常需要建立专门的图片服务器images.chedong.com和负载比较高的应用服务器 bbs.chedong.com分离,在反向代理加速模式中,所有前台请求都通过缓存服务器:实际上就都是静态页面,这样,应用设计时就不用考虑图片和应用本身分离了,也大大降低了后台内容发布系统设计的复杂程度,由于数据和应用都存放在一起,也方便了文件系统的维护和管理。

基于Apache mod_proxy的反向代理缓存加速实现
Apache包含了mod_proxy模块,可以用来实现代理服务器,针对后台服务器的反向加速
安装apache 1.3.x 编译时:
--enable-shared=max --enable-module=most
注:Apache 2.x中mod_proxy已经被分离成mod_proxy和mod_cache:同时mod_cache有基于文件和基于内存的不同实现
创建/var/www/proxy,设置apache服务所用户可写
mod_proxy配置样例:反相代理缓存+缓存
架设前台的www.example.com反向代理后台的www.backend.com的8080端口服务。
修改:httpd.conf
<VirtualHost *>
ServerName www.example.com
ServerAdmin admin@example.com
# reverse proxy setting
ProxyPass / http://www.backend.com:8080/
ProxyPassReverse / http://www.backend.com:8080/
# cache dir root
CacheRoot "/var/www/proxy"
# max cache storage
CacheSize 50000000
# hour: every 4 hour
CacheGcInterval 4
# max page expire time: hour
CacheMaxExpire 240
# Expire time = (now - last_modified) * CacheLastModifiedFactor
CacheLastModifiedFactor 0.1
# defalt expire tag: hour
CacheDefaultExpire 1
# force complete after precent of content retrived: 60-90%
CacheForceCompletion 80
CustomLog /usr/local/apache/logs/dev_access_log combined
</VirtualHost>

基于Squid的反向代理加速实现
Squid是一个更专用的代理服务器,性能和效率会比Apache的mod_proxy高很多。
如果需要combined格式日志补丁:
http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html
squid的编译:
./configure --enable-useragent-log --enable-referer-log --enable-default-err-language=Simplify_Chinese \ --enable-err-languages="Simplify_Chinese English" --disable-internal-dns
make
#make install
#cd /usr/local/squid
make dir cache
chown squid.squid *
vi /usr/local/squid/etc/squid.conf
在/etc/hosts中:加入内部的DNS解析,比如:
192.168.0.4 www.chedong.com
192.168.0.4 news.chedong.com
192.168.0.3 bbs.chedong.com
---------------------cut here----------------------------------
# visible name
visible_hostname cache.example.com
# cache config: space use 1G and memory use 256M
cache_dir ufs /usr/local/squid/cache 1024 16 256
cache_mem 256 MB
cache_effective_user squid
cache_effective_group squid

http_port 80
httpd_accel_host virtual
httpd_accel_single_host off
httpd_accel_port 80
httpd_accel_uses_host_header on
httpd_accel_with_proxy on
# accelerater my domain only
acl acceleratedHostA dstdomain .example1.com
acl acceleratedHostB dstdomain .example2.com
acl acceleratedHostC dstdomain .example3.com
# accelerater http protocol on port 80
acl acceleratedProtocol protocol HTTP
acl acceleratedPort port 80
# access arc
acl all src 0.0.0.0/0.0.0.0
# Allow requests when they are to the accelerated machine AND to the
# right port with right protocol
http_access allow acceleratedProtocol acceleratedPort acceleratedHostA
http_access allow acceleratedProtocol acceleratedPort acceleratedHostB
http_access allow acceleratedProtocol acceleratedPort acceleratedHostC
# logging
emulate_httpd_log on
cache_store_log none
# manager
acl manager proto cache_object
http_access allow manager all
cachemgr_passwd pass all

----------------------cut here---------------------------------
创建缓存目录:
/usr/local/squid/sbin/squid -z
启动squid
/usr/local/squid/sbin/squid
停止squid:
/usr/local/squid/sbin/squid -k shutdown
启用新配置:
/usr/local/squid/sbin/squid -k reconfig
通过crontab每天0点截断/轮循日志:
0 0 * * * (/usr/local/squid/sbin/squid -k rotate)

可缓存的动态页面设计
什么样的页面能够比较好的被缓存服务器缓存呢?如果返回内容的HTTP HEADER中有"Last-Modified"和"Expires"相关声明,比如:
Last-Modified: Wed, 14 May 2003 13:06:17 GMT
Expires: Fri, 16 Jun 2003 13:06:17 GMT
前端缓存服务器在期间会将生成的页面缓存在本地:硬盘或者内存中,直至上述页面过期。
因此,一个可缓存的页面:
页面必须包含Last-Modified: 标记
一般纯静态页面本身都会有Last-Modified信息,动态页面需要通过函数强制加上,比如在PHP中:
// always modified now
header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT");


必须有Expires或Cache-Control: max-age标记设置页面的过期时间:
对于静态页面,通过apache的mod_expires根据页面的MIME类型设置缓存周期:比如图片缺省是1个月,HTML页面缺省是2天等。
<IfModule mod_expires.c>
ExpiresActive on
ExpiresByType image/gif "access plus 1 month"
ExpiresByType text/css "now plus 2 day"
ExpiresDefault "now plus 1 day"
</IfModule>

对于动态页面,则可以直接通过写入HTTP返回的头信息,比如对于新闻首页index.php可以是20分钟,而对于具体的一条新闻页面可能是1天后过期。比如:在php中加入了1个月后过期:
// Expires one month later
header("Expires: " .gmdate ("D, d M Y H:i:s", time() + 3600 * 24 * 30). " GMT");


如果服务器端有基于HTTP的认证,必须有Cache-Control: public标记,允许前台
ASP应用的缓存改造 首先在公用的包含文件中(比如include.asp)加入以下公用函数:
<%
' Set Expires Header in minutes
Function SetExpiresHeader(ByVal minutes)
' set Page Last-Modified Header:
' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
Response.AddHeader "Last-Modified", DateToHTTPDate(Now())

' The Page Expires in Minutes
Response.Expires = minutes

' Set cache control to externel applications
Response.CacheControl = "public"
End Function
' Converts date (19991022 11:08:38) to http form (Fri, 22 Oct 1999 12:08:38 GMT)
Function DateToHTTPDate(ByVal OleDATE)
Const GMTdiff = #08:00:00#
OleDATE = OleDATE - GMTdiff
DateToHTTPDate = engWeekDayName(OleDATE) & _
", " & Right("0" & Day(OleDATE),2) & " " & engMonthName(OleDATE) & _
" " & Year(OleDATE) & " " & Right("0" & Hour(OleDATE),2) & _
":" & Right("0" & Minute(OleDATE),2) & ":" & Right("0" & Second(OleDATE),2) & " GMT"
End Function
Function engWeekDayName(dt)
Dim Out
Select Case WeekDay(dt,1)
Case 1:Out="Sun"
Case 2:Out="Mon"
Case 3:Out="Tue"
Case 4:Out="Wed"
Case 5:Out="Thu"
Case 6:Out="Fri"
Case 7:Out="Sat"
End Select
engWeekDayName = Out
End Function
Function engMonthName(dt)
Dim Out
Select Case Month(dt)
Case 1:Out="Jan"
Case 2:Out="Feb"
Case 3:Out="Mar"
Case 4:Out="Apr"
Case 5:Out="May"
Case 6:Out="Jun"
Case 7:Out="Jul"
Case 8:Out="Aug"
Case 9:Out="Sep"
Case 10:Out="Oct"
Case 11:Out="Nov"
Case 12:Out="Dec"
End Select
engMonthName = Out
End Function
%>
然后在具体的页面中,比如index.asp和news.asp的“最上面”加入以下代码:HTTP Header

<%
'页面将被设置20分钟后过期
SetExpiresHeader(20)
%>

应用的缓存兼容性设计

经过代理以后,由于在客户端和服务之间增加了中间层,因此服务器无法直接拿到客户端的IP,服务器端应用也无法直接通过转发请求的地址返回给客户端。但是在转发请求的HTTD头信息中,增加了HTTP_X_FORWARDED_????信息。用以跟踪原有的客户端IP地址和原来客户端请求的服务器地址:
下面是2个例子,用于说明缓存兼容性应用的设计原则:

'对于一个需要服务器名的地址的ASP应用:不要直接引用HTTP_HOST/SERVER_NAME,判断一下是否有HTTP_X_FORWARDED_SERVER function getHostName () dim hostName as String = "" hostName = Request.ServerVariables("HTTP_HOST") if not isDBNull(Request.ServerVariables("HTTP_X_FORWARDED_HOST")) then if len(trim(Request.ServerVariables("HTTP_X_FORWARDED_HOST"))) > 0 then hostName = Request.ServerVariables("HTTP_X_FORWARDED_HOST") end if end if return hostNmae end function //对于一个需要记录客户端IP的PHP应用:不要直接引用REMOTE_ADDR,而是要使用HTTP_X_FORWARDED_FOR, function getUserIP (){ $user_ip = $_SERVER["REMOTE_ADDR"]; if ($_SERVER["HTTP_X_FORWARDED_FOR"]) { $user_ip = $_SERVER["HTTP_X_FORWARDED_FOR"]; } }

注意:HTTP_X_FORWARDED_FOR如果经过了多个中间代理服务器,有何能是逗号分割的多个地址,
比如:200.28.7.155,200.10.225.77 unknown,219.101.137.3
因此在很多旧的数据库设计中(比如BBS)往往用来记录客户端地址的字段被设置成20个字节就显得过小了。
经常见到类似以下的错误信息:

Microsoft JET Database Engine 错误 '80040e57'

字段太小而不能接受所要添加的数据的数量。试着插入或粘贴较少的数据。

/inc/char.asp,行236

原因就是在设计客户端访问地址时,相关用户IP字段大小最好要设计到50个字节以上,当然经过3层以上代理的几率也非常小。
如何检查目前站点页面的可缓存性(Cacheablility)呢?可以参考以下2个站点上的工具:
http://www.ircache.net/cgi-bin/cacheability.py

附:SQUID性能测试试验

phpMan.php是一个基于php的man page server,每个man
page需要调用后台的man命令和很多页面格式化工具,系统负载比较高,提供了Cache
Friendly的URL,以下是针对同样的页面的性能测试资料:
测试环境:Redhat 8 on Cyrix 266 / 192M Mem
测试程序:使用apache的ab(apache benchmark):
测试条件:请求50次,并发50个连接
测试项目:直接通过apache 1.3 (80端口) vs squid 2.5(8000端口:加速80端口)

测试1:无CACHE的80端口动态输出:
ab -n 100 -c 10 http://www.chedong.com:81/phpMan.php/man/kill/1
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
http://www.zeustech.net/
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/

Benchmarking localhost (be patient).....done
Server Software:
Apache/1.3.23
Server Hostname: localhost
Server
Port:
80

Document Path:
/phpMan.php/man/kill/1
Document Length: 4655 bytes

Concurrency Level: 5
Time taken for tests: 63.164 seconds
Complete requests: 50
Failed requests: 0
Broken pipe errors: 0
Total transferred: 245900 bytes
HTML transferred: 232750 bytes
Requests per second: 0.79 [#/sec] (mean)
Time per request: 6316.40 [ms]
(mean)
Time per request: 1263.28 [ms]
(mean, across all concurrent requests)
Transfer rate:
3.89 [Kbytes/sec] received

Connnection Times (ms)

min mean[+/-sd] median max
Connect: 0
29 106.1 0 553
Processing: 2942 6016
1845.4 6227 10796

Waiting:
2941 5999 1850.7 6226 10795

Total:
2942 6045 1825.9 6227 10796

Percentage of the requests served within a certain time (ms)
50% 6227
66% 7069
75% 7190
80% 7474
90% 8195
95% 8898
98% 9721
99% 10796
100% 10796 (last request)

测试2:SQUID缓存输出
/home/apache/bin/ab -n50 -c5
"http://localhost:8000/phpMan.php/man/kill/1"
This is ApacheBench, Version 1.3d <$Revision: 1.2 $> apache-1.3
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd,
http://www.zeustech.net/
Copyright (c) 1998-2001 The Apache Group, http://www.apache.org/

Benchmarking localhost (be patient).....done
Server Software:
Apache/1.3.23
Server Hostname: localhost
Server
Port:
8000

Document Path:
/phpMan.php/man/kill/1
Document Length: 4655 bytes

Concurrency Level: 5
Time taken for tests: 4.265 seconds
Complete requests: 50
Failed requests: 0
Broken pipe errors: 0
Total transferred: 248043 bytes
HTML transferred: 232750 bytes
Requests per second: 11.72 [#/sec] (mean)
Time per request: 426.50 [ms] (mean)
Time per request: 85.30 [ms] (mean,
across all concurrent requests)
Transfer rate:
58.16 [Kbytes/sec] received

Connnection Times (ms)

min mean[+/-sd] median max
Connect:
0 1
9.5 0 68
Processing:
7 83 537.4
7 3808

Waiting:
5 81 529.1
6 3748

Total:
7 84 547.0
7 3876

Percentage of the requests served within a certain time (ms)
50% 7
66% 7
75% 7
80% 7
90% 7
95% 7
98% 8
99% 3876
100% 3876 (last request)

结论:No Cache / Cache = 6045 / 84 = 70
结论:对于可能被缓存请求的页面,服务器速度可以有2个数量级的提高,因为SQUID是把缓存页面放在内存里的(因此几乎没有硬盘I/O操作)。

小节:



大访问量的网站应尽可能将动态网页生成静态页面作为缓存发布,甚至对于搜索引擎这样的动态应用来说,缓存机制也是非常非常重要的。

在动态页面中利用HTTP Header定义缓存更新策略。

利用缓存服务器获得额外的配置和安全性

日志非常重要:SQUID日志缺省不支持COMBINED日志,但对于需要REFERER日志的这个补丁非常重要:http://www.squid-cache.org/mail-archive/squid-dev/200301/0164.html




参考资料:
HTTP代理缓存
http://vancouver-webpages.com/proxy.html


可缓存的页面设计
http://linux.oreillynet.com/pub/a/linux/2002/02/28/cachefriendly.html
运用ASP.NET的输出缓冲来存储动态页面 - 开发者 - ZDNet China
http://www.zdnet.com.cn/developer/tech/story/0,2000081602,39110239-2,00.htm
相关RFC文档:



RFC
2616:



section
13 (Caching)

section
14.9 (Cache-Control header)

section
14.21 (Expires header)

section
14.32 (Pragma: no-cache) is important if you are interacting with
HTTP/1.0 caches

section
14.29 (Last-Modified) is the most common validation method

section
3.11 (Entity Tags) covers the extra validation method





可缓存性检查
http://www.web-caching.com/cacheability.html
缓存设计要素
http://vancouver-webpages.com/CacheNow/detail.html

ZOPE上的几篇使用APACHE MOD_PROXY MOD_GZIP加速的文档
http://www.zope.org/Members/anser/apache_zserver/
http://www.zope.org/Members/softsign/ZServer_and_Apache_mod_gzip
http://www.zope.org/Members/rbeer/caching

苹果电脑的CEO斯蒂夫·乔布斯在斯坦福大学毕业典礼上的演讲

,

(斯坦福)是世界上最好的大学之一,今天能参加各位的毕业典礼,我备感荣幸。(尖叫声)我从来没有从大学毕业,说句实话,此时算是我离大学毕业最近的一刻。(笑声)今天,我想告诉你们我生命中的三个故事,并非什么了不得的大事件,只是三个小故事而已。

第一个故事,是关于串起生命中的点点滴滴。(原文为“connecting the dots”指一种小游戏:把标有序列号的点连起来,就构成一幅图画——译注)

我在里德大学呆了6个月就退学了,但之后仍作为旁听生混了18个月后才最终离开。我为什么要退学呢?

故事要从我出生之前开始说起。我的生母是一名年轻的未婚妈妈,当时她还是一所大学的在读研究生,于是决定把我送给其他人收养。她坚持我应该被一对念过大学的夫妇收养,所以在我出生的时候,她已经为我被一个律师和他的太太收养做好了所有的准备。但在最后一刻,这对夫妇改了主意,决定收养一个女孩。侯选名单上的另外一对夫妇,也就是我的养父母,在一天午夜接到了一通电话:“有一个不请自来的男婴,你们想收养吗?”他们回答:“当然想。”事后,我的生母才发现我的养母根本就没有从大学毕业,而我的养父甚至连高中都没有毕业,所以她拒绝签署最后的收养文件,直到几个月后,我的养父母保证会把我送到大学,她的态度才有所转变。


17年之后,我真上了大学。但因为年幼无知,我选择了一所和斯坦福一样昂贵的大学,(笑声)我的父母都是工人阶级,他们倾其所有资助我的学业。在6个月之后,我发现自己完全不知道这样念下去究竟有什么用。当时,我的人生漫无目标,也不知道大学对我能起到什么帮助,为了念书,还花光了父母毕生的积蓄,所以我决定退学。我相信车到山前必有路。当时作这个决定的时候非常害怕,但现在回头去看,这是我这一生所作出的最正确的决定之一。(笑声)从我退学那一刻起,我就再也不用去上那些我毫无兴趣的必修课了,我开始旁听那些看来比较有意思的科目。

这件事情做起来一点都不浪漫。因为没有自己的宿舍,我只能睡在朋友房间的地板上;可乐瓶的押金是5分钱,我把瓶子还回去好用押金买吃的;在每个周日的晚上,我都会步行7英里穿越市区,到Hare Krishna教堂吃一顿大餐,我喜欢那儿的食物。我跟随好奇心和直觉所做的事情,事后证明大多数都是极其珍贵的经验。

我举一个例子:那个时候,里德大学提供了全美国最好的书法教育。整个校园的每一张海报,每一个抽屉上的标签,都是漂亮的手写体。由于已经退学,不用再去上那些常规的课程,于是我选择了一个书法班,想学学怎么写出一手漂亮字。在这个班上,我学习了各种衬线和无衬线字体,如何改变不同字体组合之间的字间距,以及如何做出漂亮的版式。那是一种科学永远无法捕捉的充满美感、历史感和艺术感的微妙,我发现这太有意思了。

当时,我压根儿没想到这些知识会在我的生命中有什么实际运用价值;但是10年之后,当我们的设计第一款Macintosh电脑的候,这些东西全派上了用场。我把它们全部设计进了 Mac,这是第一台可以排出好看版式的电脑。如果当时我大学里没有旁听这门课程的话,Mac就不会提供各种字体和等间距字体。自从视窗系统抄袭了Mac以后,(鼓掌大笑)所有的个人电脑都有了这些东西。如果我没有退学,我就不会去书法班旁听,而今天的个人电脑大概也就不会有出色的版式功能。当然我在念大学的那会儿,不可能有先见之明,把那些生命中的点点滴滴都串起来;但10年之后再回头看,生命的轨迹变得非常清楚。

再强调一次,你不可能充满预见地将生命的点滴串联起来;只有在你回头看的时候,你才会发现这些点点滴滴之间的联系。所以,你要坚信,你现在所经历的将在你未来的生命中串联起来。你不得不相信某些东西,你的直觉,命运,生活,因缘际会……正是这种信仰让我不会失去希望,它让我的人生变得与众不同。


我的第二个故事是关于爱与失去。

我是幸运的,在年轻的时候就知道了自己爱做什么。在我20岁的时候,就和沃兹在我父母的车库里开创了苹果电脑公司。我们勤奋工作,只用了10年的时间,苹果电脑就从车库里的两个小伙子扩展成拥有4000名员工,价值达到20亿美元的企业。而在此之前的一年,我们刚推出了我们最好的产品Macintosh电脑,当时我刚过而立之年。然后,我就被炒了鱿鱼。一个人怎么可以被他所创立的公司解雇呢?(笑声)这么说吧,随着苹果的成长,我们请了一个原本以为很能干的家伙和我一起管理这家公司,在头一年左右,他干得还不错,但后来,我们对公司未来的前景出现了分歧,于是我们之间出现了矛盾。由于公司的董事会站在他那一边,所以在我30岁的时候,就被踢出了局。我失去了一直贯穿在我整个成年生活的重心,打击是毁灭性的。

在头几个月,我真不知道要做些什么。我觉得我让企业界的前辈们失望了,我失去了传到我手上的指挥棒。我遇到了戴维·帕卡德(普惠的创办人之一——译注)和鲍勃·诺伊斯(英特尔的创办人之一——译注),我向他们道歉,因为我把事情搞砸了。我成了人人皆知的失败者,我甚至想过逃离硅谷。但曙光渐渐出现,我还是喜欢我做过的事情。在苹果电脑发生的一切丝毫没有改变我,一个比特(bit)都没有。虽然被抛弃了,但我的热忱不改。我决定重新开始。

我当时没有看出来,但事实证明,我被苹果开掉是我这一生所经历过的最棒的事情。成功的沉重被凤凰涅槃的轻盈所代替,每件事情都不再那么确定,我以自由之躯进入了我整个生命当中最有创意的时期。

在接下来的5年里,我开创了一家叫做NeXT的公司,接着是一家名叫Pixar的公司,并且接识了后来成为我妻子的曼妙女郎。Pixar制作了世界上第一部全电脑动画电影《玩具总动员》,现在这家公司是世界上最成功的动画制作公司之一。(掌声)后来经历一系列的事件,苹果买下了NeXT,于是我又回到了苹果,我们在NeXT研发出的技术在推动苹果复兴的核心动力。我和劳伦斯也拥有了美满的家庭。

我非常肯定,如果没有被苹果炒掉,这一切都不可能在我身上发生。对于病人来说,良药总是苦口。生活有时候就像一块板砖拍向你的脑袋,但不要丧失信心。热爱我所从事的工作,是一直支持我不断前进的惟一理由。你得找出你的最爱,对工作如此,对爱人亦是如此。工作将占据你生命中相当大的一部分,从事你认为具有非凡意义的工作,方能给你带来真正的满足感。而从事一份伟大工作的惟一方法,就是去热爱这份工作。如果你到现在还没有找到这样一份工作,那么就继续找。不要安于现状,当万事了于心的时候,你就会知道何时能找到。如同任何伟大的浪漫关系一样,伟大的工作只会在岁月的酝酿中越陈越香。所以,在你终有所获之前,不要停下你寻觅的脚步。不要停下。


我的第三个故事是关于死亡。

在17 岁的时候,我读过一句格言,好像是:“如果你把每一天都当成你生命里的最后一天,你将在某一天发现原来一切皆在掌握之中。”(笑声)这句话从我读到之日起,就对我产生了深远的影响。在过去的33年里,我每天早晨都对着镜子问自己:“如果今天是我生命中的末日,我还愿意做我今天本来应该做的事情吗?”当一连好多天答案都否定的时候,我就知道做出改变的时候到了。

提醒自己行将入土是我在面临人生中的重大抉择时,最为重要的工具。

因为所有的事情——外界的期望、所有的尊荣、对尴尬和失败的惧怕——在面对死亡的时候,都将烟消云散,只留下真正重要的东西。在我所知道的各种方法中,提醒自己即将死去是避免掉入畏惧失去这个陷阱的最好办法。人赤条条地来,赤条条地走,没有理由不听从你内心的呼唤。

大约一年前,我被诊断出癌症。在早晨7:30我做了一个检查,扫描结果清楚地显示我的胰脏出现了一个肿瘤。我当时甚至不知道胰脏究竟是什么。医生告诉我,几乎可以确定这是一种不治之症,顶多还能活3至6个月。大夫建议我回家,把诸事安排妥当,这是医生对临终病人的标准用语。这意味着你得把你今后10年要对你的子女说的话用几个月的时间说完;这意味着你得把一切都安排妥当,尽可能减少你的家人在你身后的负担;这意味着向众人告别的时间到了。

我整天都想着诊断结果。那天晚上做了一个切片检查,医生把一个内诊镜从我的喉管伸进去,穿过我的胃进入肠道,将探针伸进胰脏,从肿瘤上取出了几个细胞。我打了镇静剂,但我的太太当时在场,她后来告诉我说,当大夫们从显微镜下观察了细胞组织之后,都哭了起来,因为那是一非常罕见的,可以通过手术治疗的胰脏癌。我接受了手术,现在已经康复了。

这是我最接近死亡的一次,我希望在随后的几十年里,都不要有比这一次更接近死亡的经历。在经历了这次与死神擦肩而过的经验之后,死亡对我来说只是一项有效的判断工具,并且只是一个纯粹的理性概念时相比,我能够更肯定地告诉你们以下事实:没人想死;即使想去天堂的人,也是希望能活着进去。(笑声)死亡是我们每个人的人生终点站,没人能够成为例外。生命就是如此,因为死亡很可能是生命最好的造物,它是生命更迭的媒介,送走耋耄老者,给新生代让路。现在你们还是新生代,但不久的将来你们也将逐渐老去,被送出人生的舞台。很抱歉说得这么富有戏剧性,但生命就是如此。

你们的时间有限,所以不要把时间浪费在别人的生活里。不要被条条框框束缚,否则你就生活在他人思考的结果里。不要让他人的观点所发出的噪音淹没你内心的声音。最为重要的是,要有遵从你的内心和直觉的勇气,它们可能已知道你其实想成为一个什么样的人。其他事物都是次要的。

在我年轻的时候,有一本非常棒的杂志叫《全球目录》(The Whole Earth Catalog),它被我们那一代人奉为圭臬。这本杂志的创办人是一个叫斯图尔特·布兰德的家伙,他住在Menlo Park,距离这儿不远。他把这本杂志办得充满诗意。那是在60年代末期,个人电脑、桌面发排系统还没有出现,所以出版工具只有打字机、剪刀和宝丽来相机。这本杂志有点像印在纸上的Google,但那是在Google出现的35年前;它充满了理想色彩,内容都是些非常好用的工具和了不起的见解。

斯图尔特和他的团队做了几期《全球目录》,快无疾而终的时候,他们出版了最后一期。那是在70年代中期,我当时处在你们现在的年龄。在最后一期的封底有一张清晨乡间公路的照片,如果你喜欢搭车冒险旅行的话,经常会碰到的那种小路。在照片下面有一排字:物有所不足,智有所不明(Stay Hungry. Stay Foolish.)这是他们停刊的告别留言。物有所不足,智有所不明。我总是以此自诩。现在,在你们毕业开始新生活的时候,我把这句话送给你们。
December 2009
S M T W T F S
November 2009January 2010
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31