apache sql注入url重写写问题,域名跳转到域名+路径

Apache中Rewrite 指定的url http跳转https
<a data-traceid="question_detail_above_text_l&&
Apache怎么通过rewrite实现带问号的URL跳转
http://www.huan.com/?serverver=v2&task=login&get_new_phone
http://www.huan.com/?serverver=v2&task=register&get_new_phone
分别跳转到
https://www.huan.com/?serverver=v2&task=login&get_new_phone
https://www.huan.com/?serverver=v2&task=register&get_new_phone
RewriteEngine on
RewriteCond %{SERVER_PORT} !^443$
RewriteRule ^(.*)?$ https://%{SERVER_NAME}$1 [L,R]
把这三句规则放到virtualhost 的80端口里,可以实现所有HTTP跳转到HTTPS
谢谢。其实只想把如上URL中符合task=login的规则转发到https,其他的还是http
可以参考:http://bbs.linuxtone.org/thread-.html温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!&&|&&
有理想,有抱负,但有点小懒。
LOFTER精选
网易考拉推荐
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
一:本文旨在提供怎么用Apache重写规则来解决一些常见的URL重写方法的问题,通过常见的&实例给用户一些使用重写规则的基本方法和线索。&二:为什么需要用重写规则?&一个网站,如果是长期需要放在internet上提供服务,必定会有不断地更新和维护,如临&时转移到其他服务器进行维护,重新组织目录结构,变换URL甚至改动到新的等等,&而为了让客户不会因此受到所有影响,最佳的方法就是使用Apache Rewrite Rule(重写&规则)。&三: 重写规则的作用范围&1) 能使用在Apache主设置文件httpd.conf中&2) 能使用在httpd.conf里定义的设置中&3) 能使用在基本目录的跨越设置文件.htaccess中&四:重写规则的应用条件&只有当用户的WEB请求最终被导向到某台WEB服务器的Apache后台,则这台WEB服务器接受&进来的请求,根据设置文件该请求是主设置还是,再根据用户在浏览器中请求的&URI来配对重写规则并且根据实际的请求路径配对.htaccess中的重写规则。最后把请求&的内容传回给用户,该响应可能有两种:&1) 对浏览器请求内容的外部重定向(Redirect)到另一个URL。&让浏览器再次以新的URI发出请求(R=301或R=302,临时的或是永久的重定向)&如:一个网站有正规的URL和别名URL,对别名URL进行重定向到正规URL,或网站改换&成了新的&则把旧的重定向到新的(Redirect)&2) 也可能是由Apache内部子请求代理产生新的内容送回给客户[P,L]&这是Apache内部根据重写后的URI内部通过代理模块请求内容并送回内容给客户,而客户&端浏览器并&不知道,浏览器中的URI不会被重写。但实际内容被Apache根据重写规则后的URI得到。&如:在公司防火墙上运行的Apache启动这种代理重写规则,代理对内部网段上的WEB服务&器的请求。五:重写规则怎样工作?&我们假定在编译Apache时已把mod_rewrite编译成模块,确信你的httpd.conf中有&LoadModule rewrite_module libexec/mod_rewrite.so&并且在Addmodule中有&Addmodule mod_rewrite.c&则能使用重写规则。&当外部请求来到Apache,Apache调用重写规则中的定义来重写由用户浏览器指定请求的&URI,最后被重写的URI如果是重定向,则送由浏览器作再一次请求;如果是代理则把重写&后的URI交给代理模块请求最终的内容(Content),最后把内容送回给浏览器。&六: 何时使用.htaccess中的重写规则定义?&如果你对你的的网站内容所在的服务器没有管理员权限,或你的网站放在ISP的服务器&上托管等等条件下,你无法改写主设置文件,然而你能对你的WEB站点内容所在的目录&有写权限,则你能设置自己的.htaccess&文件达到同样的目的。但你需要确定主设置文件中对你的网站所在的目录定义了下面的内&容:&Options Indexes FollowSymLinks&AllowOverride all&否则你的.htaccess不会工作。&七: 应用举例&假定Apache被编译安装在主机192.168.1.56的/usr/local/apache/ 目录下面,我们编&译进了重写和代理模块。&1) 隐藏Apache下的某个目录,使得对该目录的所有请求都重定向到另一个文件。&a& httpd.conf的实现方法&我们放下面的部分到/usr/local/apache/conf/httpd.conf&options Indexes followsymlinks&allowoverride all&rewriteengine on&rewritebase /&rewriterule ^(.*)$ index.html.en [R=301]&注:rewriteengine on 为重写引擎开关,如果设为off,则所有重写规则定义将不被应&用,该开关的另一好处就是如果为了临时拿掉重写规则,则改为off再重启动Apache即&可,不必将下面一条条的重写规则注释掉。&rewritebase / 的作用是如果在下面的rewriterule定义中被重写后的部分(此处为文件&名index.html.en)前面没有/,则是相对目录,相对于这个rewritebase后面的定义也就&是/usr/local/apache/htdocs/index.html.en,否则,如果此处没有rewritebase /这&一项,则被重写成&http://192.168.1.56/usr/local/apache/htdocs/manual/index.html.en ,显然是&不正确的。&不过这里我们也能不用rewritebase / , 而改为&rewriteengine on&rewriterule ^(.*)$ /index.html.en [R=301]&或&rewriteengine on&rewriterule ^(.*)$ http://192.168.1.56/index.html.en [R=301]&b& .htaccess的实现方法&我们先放下面的部分到httpd.conf&options Indexes followsymlinks&allowoverride all&然后放下面的部分到/usr/local/apache/htdocs/manual/.htaccess中&rewriteengine on&rewritebase /&rewriterule ^(.*)$ index.html.en [R=301]&注:对文件.htaccess所作的所有改动不必重启动Apache.&问:要是把这个manual目录重定向到用户jephe的自己的主目录呢?&用下面的.htaccess方案。&rewriteengine on&rewritebase /~jephe/&rewriterule ^(.*)$ $1 [R=301]&则对manual目录下所有文件的请求被重定向到~jephe目录下相同文件的请求。&2) 转换www.username.domain.com的对于username的主页请求为&www.domain.com/username&对于HTTP/1.1的请求包括一个Host: HTTP头,我们能用下面的规则集重写&http://www.username.domain.com/anypath 到 /home/username/anypath&Rewriteengine on&rewritecond %{HTTP_HOST} ^www\.[^.]+\.host\.com$&rewriterule ^(.+) %{HTTP_HOST}$1 [C]&rewriterule ^www\.([^.]+)\.host\.com(.*) /home/$1$2&注:&rewritecond 条件重写规则,当满足后面定义的条件后才会应用下面的重写规则,&rewritecond有各种变量&,请查阅相关文件。&3) 防火墙上的重写规则代理内部网段上服务器的请求。&NameVirtualhost 1.2.3.4&servername www.domain.com&rewriteengine on&proxyrequest on&rewriterule ^/(.*)$ http://192.168.1.3/$1 [P,L]&注:当外部浏览器请求www.domain.com时被解析到IP地址1.2.3.4 ,Apache 交出&mod_rewrite处理转换成&http://192.168.1.3/$1后再交由代理模块mod_proxy得到内容后传送回用户的浏览器。&4) 基本预先设定的转换MAP表进行重写 rewritemap&转换www.domain.com/{countrycode}/anypath 到Map表中规定的URI,上面是&中的定义&rewritelog /usr/local/apache/logs/rewrite.log&rewriteloglevel 9&rewriteengine on&proxyrequest on&rewritemap sitemap txt:/usr/local/apache/conf/rewrite.map&rewriterule ^/([^/]+)+/(.*)$ http://%{REMOTE_HOST}::$1 [C]&rewriterule (.*)::([a-z]+)$ ${sitemap:$2|http://h.i.j.k
阅读(1071)|
用微信&&“扫一扫”
将文章分享到朋友圈。
用易信&&“扫一扫”
将文章分享到朋友圈。
历史上的今天
loftPermalink:'',
id:'fks_',
blogTitle:'【转】Apache的重写(.htaccess文件的使用)',
blogAbstract:'\t&转自:http://www.cnblogs.com/ybbqg/archive//2405500.html&一:本文旨在提供怎么用Apache重写规则来解决一些常见的URL重写方法的问题,通过常见的&',
blogTag:'',
blogUrl:'blog/static/',
isPublished:1,
istop:false,
modifyTime:0,
publishTime:9,
permalink:'blog/static/',
commentCount:0,
mainCommentCount:0,
recommendCount:0,
bsrk:-100,
publisherId:0,
recomBlogHome:false,
currentRecomBlog:false,
attachmentsFileIds:[],
groupInfo:{},
friendstatus:'none',
followstatus:'unFollow',
pubSucc:'',
visitorProvince:'',
visitorCity:'',
visitorNewUser:false,
postAddInfo:{},
mset:'000',
remindgoodnightblog:false,
isBlackVisitor:false,
isShowYodaoAd:false,
hostIntro:'有理想,有抱负,但有点小懒。',
hmcon:'0',
selfRecomBlogCount:'0',
lofter_single:''
{list a as x}
{if x.moveFrom=='wap'}
{elseif x.moveFrom=='iphone'}
{elseif x.moveFrom=='android'}
{elseif x.moveFrom=='mobile'}
${a.selfIntro|escape}{if great260}${suplement}{/if}
{list a as x}
推荐过这篇日志的人:
{list a as x}
{if !!b&&b.length>0}
他们还推荐了:
{list b as y}
转载记录:
{list d as x}
{list a as x}
{list a as x}
{list a as x}
{list a as x}
{if x_index>4}{break}{/if}
${fn2(x.publishTime,'yyyy-MM-dd HH:mm:ss')}
{list a as x}
{if !!(blogDetail.preBlogPermalink)}
{if !!(blogDetail.nextBlogPermalink)}
{list a as x}
{if defined('newslist')&&newslist.length>0}
{list newslist as x}
{if x_index>7}{break}{/if}
{list a as x}
{var first_option =}
{list x.voteDetailList as voteToOption}
{if voteToOption==1}
{if first_option==false},{/if}&&“${b[voteToOption_index]}”&&
{if (x.role!="-1") },“我是${c[x.role]}”&&{/if}
&&&&&&&&${fn1(x.voteTime)}
{if x.userName==''}{/if}
网易公司版权所有&&
{list x.l as y}
{if defined('wl')}
{list wl as x}{/list}&nbsp>&nbsp
&nbsp>&nbsp
&nbsp>&nbsp
Apache Rewrite url重定向功能的简单配置
摘要:1.ApacheRewrite的主要功能就是实现URL的跳转和隐藏真实地址,基于Perl语言的正则表达式规范。平时帮助我们实现拟静态,拟目录,域名跳转,防止盗链等2.ApacheRewrite的配置Apache下的Rewrite配置主要有两种,一种是针对整个apache服务器的配置,此种配置的Rewrite规则是直接在httpd.conf下书写。配置步骤如下:(1)去除httpd.conf文件中&#LoadModulerewrite_modulemodules/mo
1.Apache Rewrite的主要功能
就是实现URL的跳转和隐藏真实地址,基于Perl语言的正则表达式规范。平时帮助我们实现拟静态,拟目录,域名跳转,防止盗链等
2.Apache Rewrite的配置
Apache下的Rewrite配置主要有两种,一种是针对整个apache服务器的配置,此种配置的Rewrite规则是直接在httpd.conf下书写。配置步骤如下: (1)去除httpd.conf文件中&#LoadModule rewrite_module modules/mod_rewrite.so&前面的&#&号; (2)然后再在httpd.conf中书写如下规则: RewriteEngine on #当访问任何以t_开头,以.html结尾的文件时,将$1用与(.*)匹配的字符替换后,访问相应的test.php页面 RewriteRule ^/t_(.*).html$ /test.php?id=$1另一种是针对apache服务器下的某一目录的配置,此种配置的Rewrite规则需在此目录下建立一个.htaccess文件来书写。配置步骤如下: (1)去除httpd.conf文件中&#LoadModule rewrite_module modules/mod_rewrite.so&前面的&#&号; (2)修改httpd.conf文件中的&AllowOverride None&为&AllowOverride all&,同时最好将Options也置为&all&,否则可能会出问题。 (3)在目录中建立.htaccess文件,并用记事本打开,书写如下规则: RewriteEngine on RewriteRule ^/t_(.*).html$ /test.php?id=$1
3.Apache Rewrite规则的书写
RewriteEngine on RewriteRule ^/test([0-9]*).html$ /test.php?id=$1 RewriteRule ^/new([0-9]*)/$ /new.php?id=$1 [R]RewriteEngine on #当我们访问的地址不是以www.163.com开头的,那么执行下一条规则 RewriteCond %{HTTP_HOST} !^www.163.com [NC] RewriteRule ^/(.*) http://www.163.com/ [L]
4.Apache Rewrite规则修正符
1) R 强制外部重定向 2) F 禁用URL,返回403HTTP状态码。 3) G 强制URL为GONE,返回410HTTP状态码。 4) P 强制使用代理转发。 5) L 表明当前规则是最后一条规则,停止分析以后规则的重写。 6) N 重新从第一条规则开始运行重写过程。 7) C 与下一条规则关联如果规则匹配则正常处理,以下修正符无效8) T=MIME-type(force MIME type) 强制MIME类型 9) NS 只用于不是内部子请求 10) NC 不区分大小写 11) QSA 追加请求字符串 12) NE 不在输出转义特殊字符 /%3d$1 等价于 =$1
http://www.jb51.net/article/24435.htm
以上是的内容,更多
的内容,请您使用右上方搜索功能获取相关信息。
若你要投稿、删除文章请联系邮箱:zixun-group@service.aliyun.com,工作人员会在五个工作日内给你回复。
新用户大礼包!
现在注册,免费体验40+云产品,及域名优惠!
云服务器 ECS
可弹性伸缩、安全稳定、简单易用
&40.8元/月起
预测未发生的攻击
&24元/月起
你可能还喜欢
你可能感兴趣
阿里云教程中心为您免费提供
Apache Rewrite url重定向功能的简单配置相关信息,包括
的信息,所有Apache Rewrite url重定向功能的简单配置相关内容均不代表阿里云的意见!投稿删除文章请联系邮箱:zixun-group@service.aliyun.com,工作人员会在五个工作日内答复
售前咨询热线
支持与服务
资源和社区
关注阿里云
International教你Tomcat URL重写【linux就该这么学吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:11,169贴子:
教你Tomcat URL重写
tomcat默认情况下不带www的域名是不会跳转到带www的域名的,而且也无法像apache那样通过配置.htaccess来实现。如果想要把不带“www&#39;的域名重定向到带”www&域名下,又不想写代码,可以使用UrlRewriteFilter来实现。 前期准备安装JDKyum install java-1.8.0-openjdk-develvim /etc/profile.d/jdk.shexport JAVA_HOME=/usr/java/latest
# 首先定义JAVA_HOME的环境变量export PATH=$JAVA_HOME/bin:$PATH
# 然后追加.
/etc/profile.d/jdk.sh安装tomcatyum install tomcat tomcat-admin-webapps.noarch \tomcat-webapps.noarch tomcat-docs-webapp.noarchurlRewriteFilter实现重定向urlRewriteFilter是一个用于改写URL的Web过滤器,类似于Apache的mod_rewrite。适用于任何Web应用服务器(如Tomcat,**oss,jetty,Resin,Orion等)。其典型应用就把动态URL静态化,便于搜索引擎爬虫抓取你的动态网页。下载UrlRewriteFilterUrlRewriteFilter的官方网站jar包要放在应用的WEB-INF/lib目录中yum install wget -ycd /usr/share/tomcat/webapps/ROOT/WEB-INF/lib/wget 配置过滤规则在应用的./WEB-INF/目录下创建一个名为urlrewrite.xml规则文件,名称千万不能出错!!vim ./WEB-INF/urlrewrite.xmlseo redirect^^localhost^/.*配置tomcat在应用的`./WEB-INF/中的web.xml中添加vim ./WEB-INF/web.xml
UrlRewriteFilterorg.tuckey.web.filters.urlrewrite.UrlRewriteFilterUrlRewriteFilter/*REQUESTFORWARD原文来自:免费提供最新Linux技术教程书籍,为开源技术爱好者努力做得更多更好,开源站点:
贴吧热议榜
使用签名档&&
保存至快速回贴URL重写指南 - [ Apache2.2中文手册 ] - 在线原生手册 - php中文网
URL重写指南
Originally written byRalf S. Engelschall &rse@apache.org&
December 1997
本文是mod_rewrite的参考文档,阐述在实际应用中如何解决网管所面临的基于URL的典型问题,并详细描述了如何配置URL重写规则集以解决问题。
Apache的mod_rewrite是提供了强大URL操作的杀手级的模块,可以实现几乎所有你梦想的URL操作类型,其代价是你必须接受其复杂性,因为mod_rewrite的主要障碍就是初学者不容易理解和运用,即使是Apache专家有时也会发掘出mod_rewrite的新用途。换句话说:对于mod_rewrite,或者是打退堂鼓永不再用,或者是喜欢它并一生受用。本文试图通过对已有方案的表述来创造一个成功的开端,以免你放弃。
我自己创造和收集了许多实践方案,不要有畏惧心理,从这些例子开始学习URL重写的黑匣子吧。
注意:根据你的服务器配置,可能有必要对例子作些微修改,比如,新启用mod_alias和mod_userdir时要增加[PT]标志,或者重写.htaccess而不是单个服务器中的规则集。对一个特定的规则集应该先透彻理解然后再考虑应用,这样才能避免出现问题。
在有些web服务器上,一个资源会拥有多个URL,在实际应用和发布中应该被使用的是规范的URL,其他的则是简写或者只在内部使用。无论用户在请求中使用什么形式的URL,他最终看见的都应该是规范的URL。
对所有不规范的URL执行一个外部HTTP重定向,以改变它在浏览器地址栏中的显示及其后继请求。下例中的规则集用规范的/u/user替换/~user,并修正了/u/user所遗漏的后缀斜杠。
RewriteRule
^/~([^/]+)/?(.*)
RewriteRule
^/([uge])/([^/]+)$
规范的主机名
这个规则的目的是强制使用特定的主机名以代替其他名字。比如,你想强制使用www.example.com代替example.com,就可以在以下方法的基础上进行修改:
# 针对运行在非80端口的站点
RewriteCond %{HTTP_HOST}
!^fully\.qualified\.domain\.name [NC]
RewriteCond %{HTTP_HOST}
RewriteCond %{SERVER_PORT} !^80$
RewriteRule ^/(.*)
http://fully.qualified.domain.name:%{SERVER_PORT}/$1 [L,R]
# 对一个运行在80端口的站点
RewriteCond %{HTTP_HOST}
!^fully\.qualified\.domain\.name [NC]
RewriteCond %{HTTP_HOST}
RewriteRule ^/(.*)
http://fully.qualified.domain.name/$1 [L,R]
移动过的DocumentRoot
通常,web服务器的DocumentRoot直接对应于URL"/",但是,它常常不是处于最高一级,而可能只是众多数据池中的一个实体。比如,在Intranet站点中,有/e/www/(WWW的主页)、/e/sww/(Intranet的主页)等等,而DocumentRoot指向了/e/www/,则必须保证此数据池中所有内嵌的图片和其他元素对后继请求有效。
只须重定向URL"/"到"/e/www/"即可。这个方案看起来很简单,但只是因为有了mod_rewrite模块的支持,它才简单,因为传统的URL Aliases机制(由mod_alias及其相关模块提供)只是作了一个前缀匹配,DocumentRoot是一个对所有URL的前缀,因而无法实现这样的重定向。而用mod_rewrite的确很简单:
RewriteEngine on
RewriteRule
注意, 也可以通过RedirectMatch指令达到这个目的:
RedirectMatch ^/$ http://example.com/e/www/
后缀斜杠的问题
每个网管对引用目录后缀斜杠的问题都有一本苦经,如果遗漏了,服务器会产生一个错误,因为如果请求是/~quux/foo而不是/~quux/foo/ ,服务器就会去找一个叫foo的文件,而它是一个目录,所以就报错了。事实上,大多数情况下,它自己会试图修正这个错误,但是有时候需要你手工纠正,比如,在重写了许多CGI脚本中的复杂的URL以后。
解决这个微妙问题的方案是让服务器自动添加后缀斜杠。对此,必须使用一个外部重定向,使浏览器正确地处理后继的对诸如图片的请求。如果仅仅作一个内部重写,可能只对目录页面有效,而对内嵌有使用相对URL的图片的页面无效,因为浏览器有请求内嵌目标的可能。比如,如果不用外部重定向,/~quux/foo/index.html页面中对image.gif的请求,其结果将是/~quux/image.gif
所以,应该这样写:
RewriteEngine
RewriteBase
RewriteRule
又懒又疯狂的做法是把这些写入其宿主目录中的顶级.htaccess中,但是须注意,如此会带来一些处理上的开销。
RewriteEngine
RewriteBase
RewriteCond
%{REQUEST_FILENAME}
RewriteRule
^(.+[^/])$
集群网站的同类URL规划
我们希望在一个Intranet集群网站中,对所有WWW服务器建立一致的URL规划,也就是说,所有的URL(针对每个服务器进行本地配置,因此是独立于各个服务器的)实际上都是独立于各个服务器的!我们需要的是一个具有独立于各个服务器的一致性规划的WWW名称空间,即URL不需要包含物理目标服务器,而由集群本身来自动定位物理目标主机。
首先,目标服务器的信息来自(产生)于包含有用户、组以及实体的外部地图,其格式形如:
server_of_user1
server_of_user2
这些信息被存入map.xxx-to-host文件。其次,如果URL在一个服务器上无效,需要引导所有的服务器重定向URL
/u/user/anypath
/g/group/anypath
/e/entity/anypath
http://physical-host/u/user/anypath
http://physical-host/g/group/anypath
http://physical-host/e/entity/anypath
以下规则集依靠映射文件来完成这个操作(假定,如果一个用户在映射中没有对应的项,则使用server0为默认服务器):
RewriteEngine on
RewriteMap
user-to-host
txt:/path/to/map.user-to-host
RewriteMap
group-to-host
txt:/path/to/map.group-to-host
RewriteMap
entity-to-host
txt:/path/to/map.entity-to-host
RewriteRule
^/u/([^/]+)/?(.*)
http://${user-to-host:$1|server0}/u/$1/$2
RewriteRule
^/g/([^/]+)/?(.*)
http://${group-to-host:$1|server0}/g/$1/$2
RewriteRule
^/e/([^/]+)/?(.*) http://${entity-to-host:$1|server0}/e/$1/$2
RewriteRule
^/([uge])/([^/]+)/?$
/$1/$2/.www/
RewriteRule
^/([uge])/([^/]+)/([^.]+.+)
/$1/$2/.www/$3\
移动用户主目录到不同的web服务器
通常,许多网管在建立一个新的web服务器时,都会有这样的要求:重定向一个web服务器上的所有用户主目录到另一个web服务器。
很简单,在老的web服务器上重定向所有的URL"/~user/anypath"到http://newserver/~user/anypath
RewriteEngine on
RewriteRule
http://newserver/~$1
结构化的用户主目录
一些拥有几千个用户的网站通常都使用结构化的用户主目录规划,即每个用户主目录位于一个带有特定前缀,比如其用户名的第一个字符的子目录下:/~foo/anypath代表/home/f/foo/.www/anypath,而/~bar/anypath代表/home/b/bar/.www/anypath
可以使用下列规则集来扩展~以达到上述目的。
RewriteEngine on
RewriteRule
^/~(([a-z])[a-z0-9]+)(.*)
/home/$2/$1/.www$3
文件系统的重组
这是一个不加雕琢的例子:一个大量使用针对目录的规则集以实现平滑的观感,并且从来不用调整数据结构的杀手级的应用。背景:net.sw从1992年开始,存放了我收集的免费Unix软件包。它是我的爱好也是我的工作,因为在学习计算机科学的同时,业余时间还做了多年的系统和网络管理员。每周我都需要整理软件,因而建立了一个层次很深的目录结构来存放各种软件包:
drwxrwxr-x
3 18:39 Audio/
drwxrwxr-x
9 14:37 Benchmark/
drwxrwxr-x
9 00:34 Crypto/
drwxrwxr-x
9 00:41 Database/
drwxrwxr-x
512 Jul 30 19:25 Dicts/
drwxrwxr-x
9 01:54 Graphic/
drwxrwxr-x
9 01:58 Hackers/
drwxrwxr-x
9 03:19 InfoSys/
drwxrwxr-x
9 03:21 Math/
drwxrwxr-x
9 03:24 Misc/
drwxrwxr-x
1 16:33 Network/
drwxrwxr-x
9 05:53 Office/
drwxrwxr-x
9 09:24 SoftEng/
drwxrwxr-x
9 12:17 System/
drwxrwxr-x
3 20:15 Typesetting/
drwxrwxr-x
9 14:08 X11/
1996年7月,我决定通过一个漂亮的Web接口公开我的收藏。"漂亮"是指提供一个接口以直接浏览整个目录结构,同时不对这个结构做任何改变,甚至也不在结构顶部放置CGI脚本。为什么呢?因为这个结构还要能够被FTP访问,而且我不希望其中有任何Web或者CGI成分。
这个方案分为两个部分:第一个部分,是用于在空闲时间建立所有目录页面的CGI脚本集。我把它们放在/e/netsw/.www/,如下:
-rw-r--r--
1 18:10 .wwwacl
drwxr-xr-x
5 15:51 DATA/
-rw-rw-rw-
372982 Aug
5 16:35 LOGFILE
-rw-r--r--
4 09:27 TODO
-rw-r--r--
1 18:01 netsw-about.html
-rwxr-xr-x
2 10:33 netsw-access.pl
-rwxr-xr-x
1 17:35 netsw-changes.cgi
-rwxr-xr-x
5 14:49 netsw-home.cgi
drwxr-xr-x
8 23:47 netsw-img/
-rwxr-xr-x
5 15:49 netsw-lsdir.cgi
-rwxr-xr-x
3 18:43 netsw-search.cgi
-rwxr-xr-x
1 17:41 netsw-tree.cgi
-rw-r--r--
234 Jul 30 16:35 netsw-unlimit.lst
其中的"DATA"子目录包含了上述目录结构,即实在的net.sw ,由rdist在需要的时候自动更新。第二个部分的遗留问题是:如何连接这两个结构为一个平滑观感的URL树?我希望在运行适当的CGI脚本而使用各种URL的时候,使用户感觉不到"DATA"目录的存在。方案如下:首先,我把下列配置放在服务器上DocumentRoot中针对目录的配置文件里,重写公布的URL"/net.sw/"为内部路径"/e/netsw" :
RewriteRule
RewriteRule
^net.sw/(.*)$
e/netsw/$1
第一条规则是针对遗漏后缀斜杠的请求的!第二条规则才是真正实现功能的。接着,就是放在针对目录的配置文件/e/netsw/.www/.wwwacl中的杀手级的配置了:
ExecCGI FollowSymLinks Includes MultiViews
RewriteEngine on
# 我们通过"/net.sw/"前缀到达
RewriteBase
# 首先重写根目录到cgi处理脚本
RewriteRule
netsw-home.cgi
RewriteRule
^index\.html$
netsw-home.cgi
当浏览器请求perdir页面时剥去子目录
RewriteRule
^.+/(netsw-[^/]+/.+)$
# 现在打断本地文件的重写
RewriteRule
^netsw-home\.cgi.*
RewriteRule
^netsw-changes\.cgi.*
RewriteRule
^netsw-search\.cgi.*
RewriteRule
^netsw-tree\.cgi$
RewriteRule
^netsw-about\.html$
RewriteRule
^netsw-img/.*$
# 任何别的东西都是一个由另一个cgi脚本处理的子目录
RewriteRule
!^netsw-lsdir\.cgi.*
RewriteRule
netsw-lsdir.cgi/$1
阅读提示:
注意前半部分中的标志L(最后),和无对应项("-")
注意后半部分中的符号!(非),和标志C(链)
注意最后一条规则的全匹配模式
NCSA图像映射和mod_imap
许多人都希望在从NCSA web服务器向较现代的Apache web服务器转移中实现平滑过渡,即希望老的NCSA图像映射程序能在Apache的较现代的mod_imagemap支持下正常运作。但问题在于,到处都是通过/cgi-bin/imagemap/path/to/page.map引用imagemap程序的连接,而在Apache下,应该写成/path/to/page.map
使用全局规则在传输过程中去除所有这些请求的前缀:
RewriteEngine
RewriteRule
^/cgi-bin/imagemap(.*)
在多个目录中搜索页面
有时会有必要使web服务器在多个目录中搜索页面,对此,MultiViews或者其他技术无能为力。
编制一个明确的规则集以搜索目录中的文件。
RewriteEngine on
# 首先尝试在 custom/...中寻找
RewriteCond
/your/docroot/dir1/%{REQUEST_FILENAME}
RewriteRule
/your/docroot/dir1/$1
# 然后尝试在 pub/...中寻找
RewriteCond
/your/docroot/dir2/%{REQUEST_FILENAME}
RewriteRule
/your/docroot/dir2/$1
# 再找不到就继续寻找其他的Alias 或 ScriptAlias 目录...
RewriteRule
按照URL的片段设置环境变量
如果希望保持请求之间的状态信息,又不希望使用CGI来包装所有页面,而是只通过分离URL中的有用信息来编码。
可以用一个规则集来分离出状态信息,并设置环境变量以备此后用于XSSI或CGI 。这样,一个"/foo/S=java/bar/"的URL会被解析为/foo/bar/ ,而环境变量STATUS则被设置为"java"。
RewriteEngine on
RewriteRule
^(.*)/S=([^/]+)/(.*)
$1/$3 [E=STATUS:$2]
虚拟用户主机
如果需要为用户username支持一个www.username.host.domain.com的主页,但不是用在此机器上建虚拟主机的方法,而是用仅在此机器上增加一个DNS记录的方法实现。
对HTTP/1.0的请求,这是无法实现的;但是对HTTP/1.1的在HTTP头中包含有主机名的请求,可以用以下规则集来内部地重写http://www.username.host.com/anypath为/home/username/anypath
RewriteEngine on
RewriteCond
%{HTTP_HOST}
^www\.[^.]+\.host\.com$
RewriteRule
%{HTTP_HOST}$1
RewriteRule
^www\.([^.]+)\.host\.com(.*) /home/$1$2
为外来访问者重定向用户主目录
对不是来自本地域ourdomain.com的外来访问者的请求,重定向其用户主目录URL到另一个web服务器www.somewhere.com ,有时这种做法也会用在虚拟主机的配置段中。
只须一个重写条件:
RewriteEngine on
RewriteCond
%{REMOTE_HOST}
!^.+\.ourdomain\.com$
RewriteRule
http://www.somewhere.com/$1 [R,L]
重定向失败的URL到其他web服务器
如何重写URL以重定向对web服务器A的失败请求到服务器B,是一个常见的问题。一般,可以用Perl写的CGI脚本通过ErrorDocument来解决,此外,还有mod_rewrite方案。但是须注意,这种方法的执行效率不如用ErrorDocument的CGI脚本!
第一种方案,有最好的性能而灵活性欠佳,出错概率小所以安全:
RewriteEngine on
RewriteCond
/your/docroot/%{REQUEST_FILENAME} !-f
RewriteRule
http://webserverB.dom/$1
但是其问题在于,它只对位于DocumentRoot中的页面有效。虽然可以增加更多的条件(比如同时还处理用户主目录,等等),但是还有一个更好的方法:
RewriteEngine on
RewriteCond
%{REQUEST_URI} !-U
RewriteRule
http://webserverB.dom/$1
这种方法使用了mod_rewrite提供的"向前参照"(look-ahead)的功能,是一种对所有URL类型都有效而且安全的方法。但是,对web服务器的性能会有影响,所以如果web服务器有一个强大的CPU,那就用这个方法。而在慢速机器上,可以用第一种方法,或者用性能更好的ErrorDocumentCGI脚本。
扩展的重定向
有时候,我们会需要更多的对重定向URL的(有关字符转义机制方面的)控制。通常,Apache内核中的URL转义函数uri_escape()同时还会对锚(anchor)转义,即类似"url#anchor"的URL,因此,你不能用mod_rewrite对此类URL直接重定向。那么如何实现呢?
必须用NPH-CGI脚本使它自己重定向,因为对NPH(无须解析的HTTP头)不会发生转义操作。首先,在针对服务器的配置中(应该位于所有重写规则的最后),引入一种新的URL类型"xredirect:":
RewriteRule ^xredirect:(.+) /path/to/nph-xredirect.cgi/$1 \
[T=application/x-httpd-cgi,L]
以强制所有带"xredirect:"前缀的URL被传送到如下的nph-xredirect.cgi程序:
#!/path/to/perl
nph-xredirect.cgi -- NPH/CGI script for extended redirects
$url = $ENV{'PATH_INFO'};
print "HTTP/1.0 302 Moved Temporarily\n";
print "Server: $ENV{'SERVER_SOFTWARE'}\n";
print "Location: $url\n";
print "Content-type: text/html\n";
print "\n";
print "&html&\n";
print "&head&\n";
print "&title&302 Moved Temporarily (EXTENDED)&/title&\n";
print "&/head&\n";
print "&body&\n";
print "&h1&Moved Temporarily (EXTENDED)&/h1&\n";
print "The document has moved &a HREF=\"$url\"&here&/a&.&p&\n";
print "&/body&\n";
print "&/html&\n";
这是一种可以重定向所有URL类型的方法,包括不被mod_rewrite直接支持的类型。所以,还可以这样重定向"news:newsgroup":
RewriteRule ^anyurl
xredirect:news:newsgroup
注意:无须对上述规则加[R]或[R,L],因为"xredirect:"需要在稍后被其特殊的"管道传送"规则扩展。
文档访问的多路复用
你知道http://www.perl.com/CPAN的CPAN(综合Perl存档网络)?它实现了一个重定向以提供全世界的CPAN镜像中离访问者最近的一个FTP站点,也可以称之为FTP访问多路复用服务。CPAN是通过CGI脚本实现的,那么用mod_rewrite如何实现呢?
首先,我们注意到mod_rewrite从3.0.0版本开始,还可以重写"ftp:"类型。其次,对客户端顶级域名的路径最近的求取可以用RewriteMap实现。利用链式规则集,并用顶级域名作为查找多路复用地图的键,可以这样做:
RewriteEngine on
RewriteMap
txt:/path/to/map.cxan
RewriteRule
^/CxAN/(.*)
%{REMOTE_HOST}::$1
RewriteRule
^.+\.([a-zA-Z]+)::(.*)$
${multiplex:$1|ftp.default.dom}$2
map.cxan -- Multiplexing Map for CxAN
ftp://ftp.cxan.de/CxAN/
ftp://ftp.cxan.uk/CxAN/
ftp://ftp.cxan.com/CxAN/
依赖于时间的重写
在页面内容按时间不同而变化的场合,比如重定向特定页面,许多网管仍然采用CGI脚本的方法,如何用mod_rewrite来实现呢?
有许多类似TIME_xxx的变量可以用在重写条件中,利用"&STRING", " &STRING"和"=STRING"的类型比较,并加以连接,就可以实现依赖于时间的重写:
RewriteEngine on
RewriteCond
%{TIME_HOUR}%{TIME_MIN} &0700
RewriteCond
%{TIME_HOUR}%{TIME_MIN} &1900
RewriteRule
^foo\.html$
foo.day.html
RewriteRule
^foo\.html$
foo.night.html
此例使URLfoo.html在07:00-19:00时指向foo.day.html ,而在其余时间,则指向foo.night.html ,对主页是一个不错的功能...
对YYYY过渡为XXXX的向前兼容
在转变了大批.html文件为.phtml ,使文档.YYYY过渡成为文档.XXXX后,如何保持URL的向前兼容(仍然虚拟地存在)?
只须按基准文件名重写,并测试带有新的扩展名的文件是否存在,如果存在,则用新的,否则,仍然用原来的。
backward compatibility ruleset for
rewriting document.html to document.phtml
when and only when document.phtml exists
but no longer document.html
RewriteEngine on
RewriteBase
parse out basename, but remember the fact
RewriteRule
^(.*)\.html$
[C,E=WasHTML:yes]
rewrite to document.phtml if exists
RewriteCond
%{REQUEST_FILENAME}.phtml -f
RewriteRule
^(.*)$ $1.phtml
else reverse the previous basename cutout
RewriteCond
%{ENV:WasHTML}
RewriteRule
^(.*)$ $1.html
新旧URL(内部的)
假定已经把文件bar.html改名为foo.html ,需要对老的URL向前兼容,即让用户仍然可以使用老的URL,而感觉不到文件被改名了。
通过以下规则内部地重写老的URL为新的:
RewriteEngine
RewriteBase
RewriteRule
^foo\.html$
新旧URL(外部的)
仍然假定已经把文件bar.html改名为foo.html ,需要对老的URL向前兼容,但是要让用户得到文件被改名的暗示,即浏览器的地址栏中显示的是新的URL。
作一个HTTP的强制重定向以改变浏览器和用户界面上的显示:
RewriteEngine
RewriteBase
RewriteRule
^foo\.html$
依赖于浏览器的内容
至少对重要的顶级页面,有时候有必要提供依赖于浏览器的最佳的内容,即对最新的Netscape提供最大化的版本,对Lynx提供最小化的版本,而对其他的浏览器则提供一个功能一般的版本。
对此,内容协商无能为力,因为浏览器不提供那种形式的类型,所以只能在HTTP头"User-Agent"上想办法。以下规则集可以完成这个操作:如果HTTP头"User-Agent"以"Mozilla/3"开头,则页面foo.html被重写为foo.NS.html ,而后重写操作终止;如果是"Lynx"或者版本号为1和2的"Mozilla",则重写为foo.20.html ;而其他所有的浏览器收到的页面则是foo.32.html
RewriteCond %{HTTP_USER_AGENT}
^Mozilla/3.*
RewriteRule ^foo\.html$
foo.NS.html
RewriteCond %{HTTP_USER_AGENT}
RewriteCond %{HTTP_USER_AGENT}
^Mozilla/[12].*
RewriteRule ^foo\.html$
foo.20.html
RewriteRule ^foo\.html$
foo.32.html
假定,需要在我们的名称空间里加入其他远程主机的页面。对FTP服务器,可以用mirror程序以在本地机器上维持一个对远程数据的最新的拷贝;对web服务器,可以用类似的用于HTTP的webcopy程序。但这两种技术都有一个主要的缺点:此本地拷贝必须通过这个程序的执行来更新。所以,比较好的方法是,不采用静态镜像,而采用动态镜像,即在有数据请求时自动更新(远程主机上更新的数据)。
为此,使用代理吞吐(Proxy Throughput)功能(flag [P]),以映射远程页面甚至整个远程网络区域到我们的名称空间:
RewriteEngine
RewriteBase
RewriteRule
^hotsheet/(.*)$
http://www.tstimpreso.com/hotsheet/$1
RewriteEngine
RewriteBase
RewriteRule
^usa-news\.html$
http://www.quux-corp.com/news/index.html
反向动态镜像
RewriteEngine on
RewriteCond
/mirror/of/remotesite/$1
RewriteRule
^http://www\.remotesite\.com/(.*)$ /mirror/of/remotesite/$1
通过Intranet取得丢失的数据
这是一种在受防火墙保护的(内部)Intranet(www2.quux-corp.dom)上保存和维护实际数据,而虚拟地运行企业级(外部)Internet web服务器(www.quux-corp.dom)的巧妙的方法。这种方法是外部服务器在空闲时间从内部服务器取得被请求的数据。
首先,必须确保防火墙对内部服务器的保护,并只允许此外部服务器取得数据。对包过滤(packet-filtering)防火墙,可以如下制定防火墙规则:
ALLOW Host www.quux-corp.dom Port &1024 --& Host www2.quux-corp.dom Port 80
--& Host www2.quux-corp.dom Port 80
按你的实际配置,只要对上例稍作调整即可。接着,建立通过代理后台获取丢失数据的mod_rewrite规则:
RewriteRule ^/~([^/]+)/?(.*)
/home/$1/.www/$2
RewriteCond %{REQUEST_FILENAME}
RewriteCond %{REQUEST_FILENAME}
RewriteRule ^/home/([^/]+)/.www/?(.*) http://www2.quux-corp.dom/~$1/pub/$2 [P]
负载的均衡
如何均衡www.foo.com的负载到www[0-5].foo.com(一共是6个服务器)?
这个问题有许多可能的解决方案,在此,我们讨论通称为“基于DNS”的方案,和特殊的使用mod_rewrite的方案:
DNS循环(DNS Round-Robin)
最简单的方法是用BIND的DNS循环特性,只要按惯例设置www[0-9].foo.com的DNS的A(地址)记录,如:
然后,增加以下各项:
www0.foo.com.
www1.foo.com.
www2.foo.com.
www3.foo.com.
www4.foo.com.
www5.foo.com.
www6.foo.com.
注意,上述看起来似乎是错误的,但事实上,它的确是BIND中的一个预期的特性,而且也可以这样用。无论如何,现在www.foo.com已经被解析,BIND可以给出www0-www6 ,虽然每次在次序上会有轻微的置换/循环,客户端的请求可以被分散到各个服务器。但这并不是一个优秀的负载均衡方案,因为DNS解析信息可以被网络中其他名称服务器缓冲,而一旦www.foo.com被解析为wwwN.foo.com,则其后继请求都将被送往www.foo.com。但是最终结果是正确的,因为请求的总量的确被分散到各个服务器了
DNS 负载均衡
一种成熟的基于DNS的负载均衡方法是使用http://www.stanford.edu/~schemers/docs/lbnamed/lbnamed.html的lbnamed程序,它是一个Perl5程序,带有若干辅助工具,实现了真正的基于DNS的负载均衡。
代理吞吐循环(Proxy Throughput Round-Robin)
这是一个使用mod_rewrite及其代理吞吐特性的方法。首先,在DNS记录中将www0.foo.com固定为www.foo.com ,如下:
www0.foo.com.
其次,将www0.foo.com转换为一个专职代理服务器,即由这个机器把所有到来的URL通过内部代理分散到另外5个服务器(www1-www5)。为此,必须建立一个规则集,对所有URL调用一个负载均衡脚本lb.pl 。
RewriteEngine on
RewriteMap
prg:/path/to/lb.pl
RewriteRule
^/(.+)$ ${lb:$1}
以下是lb.pl :
#!/path/to/perl
lb.pl -- load balancing script
# the hostname base
# the first server (not 0 here, because 0 is myself)
# the last server in the round-robin
$domain = "foo.dom"; # the domainname
while (&STDIN&) {
$cnt = (($cnt+1) % ($last+1-$first));
$server = sprintf("%s%d.%s", $name, $cnt+$first, $domain);
print "http://$server/$_";
最后的说明:这样有用吗?www0.foo.com似乎也会超载呀?答案是:没错,它的确会超载,但是它超载的仅仅是简单的代理吞吐请求!所有诸如SSI、CGI、ePerl等等的处理完全是由其他机器完成的,这个才是要点。
硬件/TCP循环
还有一个硬件解决方案。Cisco有一个叫LocalDirector的东西,实现了TCP/IP层的负载均衡,事实上,它是一个位于网站集群前端的电路级网关。如果你有足够资金而且的确需要高性能的解决方案,那么可以用这个。
apache-rproxy.conf -- Apache configuration for Reverse Proxy Usage
server type
ServerType
standalone
MinSpareServers
StartServers
MaxSpareServers
MaxClients
MaxRequestsPerChild
server operation parameters
MaxKeepAliveRequests 100
KeepAliveTimeout
IdentityCheck
HostnameLookups
paths to runtime files
/path/to/apache-rproxy.pid
/path/to/apache-rproxy.lock
/path/to/apache-rproxy.elog
/path/to/apache-rproxy.dlog "%{%v/%T}t %h -& %{SERVER}e URL: %U"
unused paths
ServerRoot
DocumentRoot
RewriteLog
TransferLog
TypesConfig
AccessConfig
ResourceConfig
speed up and secure processing
&Directory /&
Options -FollowSymLinks -SymLinksIfOwnerMatch
AllowOverride None
&/Directory&
the status page for monitoring the reverse proxy
&Location /apache-rproxy-status&
SetHandler server-status
&/Location&
enable the URL rewriting engine
RewriteEngine
RewriteLogLevel
define a rewriting map with value-lists where
mod_rewrite randomly chooses a particular value
RewriteMap
rnd:/path/to/apache-rproxy.conf-servers
make sure the status page is handled locally
and make sure no one uses our proxy except ourself
RewriteRule
^/apache-rproxy-status.*
RewriteRule
^(http|ftp)://.*
now choose the possible servers for particular URL types
RewriteRule
^/(.*\.(cgi|shtml))$
to://${server:dynamic}/$1
RewriteRule
to://${server:static}/$1
and delegate the generated URL by passing it
through the proxy module
RewriteRule
^to://([^/]+)/(.*)
http://$1/$2
[E=SERVER:$1,P,L]
and make really sure all other stuff is forbidden
when it should survive the above rules...
RewriteRule
enable the Proxy module without caching
ProxyRequests
setup URL reverse mapping for redirect reponses
ProxyPassReverse
http://www1.foo.dom/
ProxyPassReverse
http://www2.foo.dom/
ProxyPassReverse
http://www3.foo.dom/
ProxyPassReverse
http://www4.foo.dom/
ProxyPassReverse
http://www5.foo.dom/
ProxyPassReverse
http://www6.foo.dom/
apache-rproxy.conf-servers -- Apache/mod_rewrite selection table
list of backend servers which serve static
pages (HTML files and Images, etc.)
www1.foo.dom|www2.foo.dom|www3.foo.dom|www4.foo.dom
list of backend servers which serve dynamically
generated page (CGI programs or mod_perl scripts)
www5.foo.dom|www6.foo.dom
新的MIME类型,新的服务
网上有许多很巧妙的CGI程序,但是用法晦涩,许多网管弃之不用。即使是Apache的MEME类型的动作处理器,也仅仅在CGI程序不需要在其输入中包含特殊URL(PATH_INFO和QUERY_STRINGS)时才很好用。首先,配置一种新的后缀为.scgi(安全CGI)文件类型,其处理器是很常见的cgiwrap程序。问题是:如果使用同类URL规划(见上述),而用户宿主目录中的一个文件的URL是/u/user/foo/bar.scgi ,可是cgiwrap要求的URL的格式是/~user/foo/bar.scgi/ ,以下规则解决了这个问题:
RewriteRule ^/[uge]/([^/]+)/\.www/(.+)\.scgi(.*) ...
... /internal/cgi/user/cgiwrap/~$1/$2.scgi$3
[NS,T=application/x-http-cgi]
另外,假设需要使用其他程序:wwwlog(显示access.log中的一个URL子树)和wwwidx(对一个URL子树运行Glimpse),则必须对这些程序提供URL区域作为其操作对象。比如,对/u/user/foo/执行swwidx程序的超链是这样的:
/internal/cgi/user/swwidx?i=/u/user/foo/
其缺点是,必须同时硬编码超链中的区域和CGI的路径,如果重组了这个区域,就需要花费大量时间来修改各个超链。
方案是用一个特殊的新的URL格式,自动拼装CGI参数:
RewriteRule
^/([uge])/([^/]+)(/?.*)/\*
/internal/cgi/user/wwwidx?i=/$1/$2$3/
RewriteRule
^/([uge])/([^/]+)(/?.*):log /internal/cgi/user/wwwlog?f=/$1/$2$3
现在,这个搜索到/u/user/foo/的超链简化成了:
它会被内部地自动转换为
/internal/cgi/user/wwwidx?i=/u/user/foo/
如此,可以为使用":log"的超链,拼装出调用CGI程序的参数。
从静态到动态
如何无缝转换静态页面foo.html为动态的foo.cgi ,而不为浏览器/用户所察觉。
只须重写此URL为CGI-script ,以强制为可以作为CGI-script运行的正确的MIME类型。如此,对/~quux/foo.html的请求其实会执行/~quux/foo.cgi 。
RewriteEngine
RewriteBase
RewriteRule
^foo\.html$
[T=application/x-httpd-cgi]
传输过程中的内容协商
这是一个很难解的功能:动态生成的静态页面,即它应该作为静态页面发送(从文件系统中读出,然后直接发出去),但是如果它丢失了,则由服务器动态生成。这样,可以静态地提供CGI生成的页面,除非有人(或者是一个cronjob)删除了这些静态页面,而且其内容可以得到更新。
以下规则集实现了这个功能:
RewriteCond %{REQUEST_FILENAME}
RewriteRule ^page\.html$
[T=application/x-httpd-cgi,L]
这样,如果page.html不存在或者文件大小为null ,则对page.html的请求会导致page.cgi的运行。其中奥妙在于page.cgi是一个将输出写入page.html的(同时也写入STDOUT)的常规的CGI脚本,执行完毕,服务器则将page.html的内容发出。如果网管需要强制更新其内容,只须删除page.html即可(通常由一个cronjob完成)。
自动更新的文档
建立一个复杂的页面,能够在用编辑器写了一个更新的版本时自动在浏览器上得到刷新,这不是很好吗?这可能吗?
这是可行的! 这需要综合利用MIME多成分、web服务器的NPH和mod_rewrite的URL操控特性。首先,建立一个新的URL特性:对在文件系统中更新时需要刷新的所有URL加上":refresh" 。
RewriteRule
^(/[uge]/[^/]+/?.*):refresh
/internal/cgi/apache/nph-refresh?f=$1
然后,修改URL
/u/foo/bar/page.html:refresh
以内部地操控此URL
/internal/cgi/apache/nph-refresh?f=/u/foo/bar/page.html
接着就是NPH-CGI脚本部分了。虽然,人们常说"将此作为一个练习留给读者",但我还是给出答案了。
#!/sw/bin/perl
nph-refresh -- NPH/CGI script for auto refreshing pages
Copyright (c) 1997 Ralf S. Engelschall, All Rights Reserved.
split the QUERY_STRING variable
@pairs = split(/&/, $ENV{'QUERY_STRING'});
foreach $pair (@pairs) {
($name, $value) = split(/=/, $pair);
$name =~ tr/A-Z/a-z/;
$name = 'QS_' . $
$value =~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C", hex($1))/
eval "\$$name = \"$value\"";
$QS_s = 1 if ($QS_s eq '');
$QS_n = 3600 if ($QS_n eq '');
if ($QS_f eq '') {
print "HTTP/1.0 200 OK\n";
print "Content-type: text/html\n\n";
print "&b&ERROR&/b&: No file given\n";
if (! -f $QS_f) {
print "HTTP/1.0 200 OK\n";
print "Content-type: text/html\n\n";
print "&b&ERROR&/b&: File $QS_f not found\n";
sub print_http_headers_multipart_begin {
print "HTTP/1.0 200 OK\n";
$bound = "ThisRandomString12345";
print "Content-type: multipart/x-mixed-boundary=$bound\n";
&print_http_headers_multipart_
sub print_http_headers_multipart_next {
print "\n--$bound\n";
sub print_http_headers_multipart_end {
print "\n--$bound--\n";
sub displayhtml {
local($buffer) = @_;
$len = length($buffer);
print "Content-type: text/html\n";
print "Content-length: $len\n\n";
sub readfile {
local($file) = @_;
local(*FP, $size, $buffer, $bytes);
($x, $x, $x, $x, $x, $x, $x, $size) = stat($file);
$size = sprintf("%d", $size);
open(FP, "&$file");
$bytes = sysread(FP, $buffer, $size);
close(FP);
$buffer = &readfile($QS_f);
&print_http_headers_multipart_
&displayhtml($buffer);
sub mystat {
local($file) = $_[0];
local($time);
($x, $x, $x, $x, $x, $x, $x, $x, $x, $mtime) = stat($file);
$mtimeL = &mystat($QS_f);
$mtime = $
for ($n = 0; $n & $QS_n; $n++) {
while (1) {
$mtime = &mystat($QS_f);
if ($mtime ne $mtimeL) {
$mtimeL = $
$buffer = &readfile($QS_f);
&print_http_headers_multipart_
&displayhtml($buffer);
$mtimeL = &mystat($QS_f);
sleep($QS_s);
&print_http_headers_multipart_
大型虚拟主机
Apache的&VirtualHost&功能很强,在有几十个虚拟主机的情况下运行得很好,但是如果你是ISP,需要提供几百个虚拟主机,那么这就不是一个最佳的选择了。
为此,需要用代理吞吐(Proxy Throughput)功能(flag [P])映射远程页面甚至整个远程网络区域到自己的名称空间:
www.vhost1.dom:80
/path/to/docroot/vhost1
www.vhost2.dom:80
/path/to/docroot/vhost2
www.vhostN.dom:80
/path/to/docroot/vhostN
httpd.conf
use the canonical hostname on redirects, etc.
UseCanonicalName on
add the virtual host in front of the CLF-format
/path/to/access_log
"%{VHOST}e %h %l %u %t \"%r\" %&s %b"
enable the rewriting engine in the main server
RewriteEngine on
define two maps: one for fixing the URL and one which defines
the available virtual hosts with their corresponding
DocumentRoot.
RewriteMap
int:tolower
RewriteMap
txt:/path/to/vhost.map
Now do the actual virtual host mapping
via a huge and complicated single rule:
1. make sure we don't map for common locations
RewriteCond
%{REQUEST_URL}
!^/commonurl1/.*
RewriteCond
%{REQUEST_URL}
!^/commonurl2/.*
RewriteCond
%{REQUEST_URL}
!^/commonurlN/.*
2. make sure we have a Host header, because
currently our approach only supports
virtual hosting through this header
RewriteCond
%{HTTP_HOST}
3. lowercase the hostname
RewriteCond
${lowercase:%{HTTP_HOST}|NONE}
4. lookup this hostname in vhost.map and
remember it only when it is a path
(and not "NONE" from above)
RewriteCond
${vhost:%1}
5. finally we can map the URL to its docroot location
and remember the virtual host for logging puposes
RewriteRule
[E=VHOST:${lowercase:%{HTTP_HOST}}]
阻止Robots
如何阻止一个完全匿名的robot取得特定网络区域的页面?一个/robots.txt文件可以包含若干"robot排除协议"的行,但不足以阻止此类robot。
可以用一个规则集以拒绝对网络区域/~quux/foo/arc/(对一个很深的目录区域进行列表可能会使服务器产生很大的负载)的访问。还必须确保仅阻止特定的robot,就是说,仅仅阻止robot访问主机是不够的,这样会同时也阻止了用户访问该主机。为此,就需要对HTTP头的User-Agent信息作匹配。
RewriteCond %{HTTP_USER_AGENT}
^NameOfBadRobot.*
RewriteCond %{REMOTE_ADDR}
^123\.45\.67\.[8-9]$
RewriteRule ^/~quux/foo/arc/.+
阻止内嵌的图片
假设,http://www.quux-corp.de/~quux/有一些内嵌图片的页面,这些图片很好,所以就有人用超链连到他们自己的页面中了。由于这样徒然增加了我们的服务器的流量,因此,我们不愿意这种事情发生。
虽然,我们不能100%地保护这些图片不被写入别人的页面,但至少可以对发出HTTP Referer头的浏览器加以限制。
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://www.quux-corp.de/~quux/.*$ [NC]
RewriteRule .*\.gif$
RewriteCond %{HTTP_REFERER}
RewriteCond %{HTTP_REFERER}
!.*/foo-with-gif\.html$
RewriteRule ^inlined-in-foo\.gif$
对主机的拒绝
如何拒绝一批外部列表中的主机对我们服务器的使用?
RewriteEngine on
RewriteMap
hosts-deny
txt:/path/to/hosts.deny
RewriteCond
${hosts-deny:%{REMOTE_HOST}|NOT-FOUND} !=NOT-FOUND [OR]
RewriteCond
${hosts-deny:%{REMOTE_ADDR}|NOT-FOUND} !=NOT-FOUND
RewriteRule
对代理的拒绝
如何拒绝某个主机或者来自特定主机的用户使用Apache代理?
首先,要确保Apache web服务器在编译时配置文件中mod_rewrite在mod_proxy的下面!使它在mod_proxy之前被调用。然后,如下拒绝某个主机...
RewriteCond %{REMOTE_HOST} ^badhost\.mydomain\.com$
RewriteRule !^http://[^/.]\.mydomain.com.*
...如下拒绝user@host-dependent:
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST}
^badguy@badhost\.mydomain\.com$
RewriteRule !^http://[^/.]\.mydomain.com.*
特殊的认证
有时候,会需要一种非常特殊的认证,即对一组明确指定的用户,允许其访问,而没有(在使用mod_authz_host的基本认证方法时可能会出现的)任何提示。
可是使用一个重写条件列表来排除所有的朋友:
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST} !^friend1@client1.quux-corp\.com$
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST} !^friend2@client2.quux-corp\.com$
RewriteCond %{REMOTE_IDENT}@%{REMOTE_HOST} !^friend3@client3.quux-corp\.com$
RewriteRule ^/~quux/only-for-friends/
基于提交者(Referer)的反射器
如何配置一个基于HTTP头"Referer"的反射器以反射到任意数量的提交页面?
使用这个很巧妙的规则集...
RewriteMap
deflector txt:/path/to/deflector.map
RewriteCond %{HTTP_REFERER} !=""
RewriteCond ${deflector:%{HTTP_REFERER}} ^-$
RewriteRule ^.* %{HTTP_REFERER} [R,L]
RewriteCond %{HTTP_REFERER} !=""
RewriteCond ${deflector:%{HTTP_REFERER}|NOT-FOUND} !=NOT-FOUND
RewriteRule ^.* ${deflector:%{HTTP_REFERER}} [R,L]
... 并结合对应的重写映射地图:
deflector.map
http://www.badguys.com/bad/index.html
http://www.badguys.com/bad/index2.html
http://www.badguys.com/bad/index3.html
http://somewhere.com/
它可以自动将请求(在映射地图中指定了"-"值的时候)反射回其提交页面,或者(在映射地图中URL有第二个参数时)反射到一个特定的URL。
外部重写引擎
一个常见的问题是如何解决似乎无法用mod_rewrite解决的FOO/BAR/QUUX/之类的问题?
可以使用一个与RewriteMap功能相同的外部RewriteMap程序,一旦它在Apache启动时被执行,则从STDIN接收被请求的URL ,并将处理过(通常是重写过的)的URL(以相同顺序)在STDOUT输出。
RewriteEngine on
RewriteMap
prg:/path/to/map.quux.pl
RewriteRule
^/~quux/(.*)$
/~quux/${quux-map:$1}
#!/path/to/perl
disable buffered I/O which would lead
to deadloops for the Apache server
read URLs one per line from stdin and
generate substitution URL on stdout
while (&&) {
s|^foo/|bar/|;
这是一个作演示的例子,只是把所有的URL /~quux/foo/... 重写为 /~quux/bar/... ,而事实上,可以把它修改以获得任何你需要的功能。但是要注意,虽然一般用户都可以使用,可是只有系统管理员才可以定义这样的地图。

我要回帖

更多关于 信息网发布文章url跳转 的文章

 

随机推荐