Posts Tagged rewrite

zen-cart rewrite 地址产品名字挤在一起的解决

发现有个网站,装了ultimate_seo_urls后,不知道什么原因,生成的产品或目录链接地址中,产品名字挤在了一块,就是没有分隔符

而通常来说,装完ultimate_seo_urls后,生成的链接,应该是产品名字如果包括多个单词的话,单词与单词之前是用”-”号连接的

原因是有人在后台seo urls里面设置了这一项为ture:

Remove all non-alphanumeric characters?

这个功能,是将除字数和字母外的其它字符去掉,解决方法:

Remove all non-alphanumeric characters? 改为flase,并Reset SEO URLs Cache

  • Share/Bookmark

Tags: , ,

使用.htaccess将网站首页301重定向到子页面

因为有个网站的首页被Google K掉了,具体体现为site:yourdomain.com时,搜索结果底部有如下提示:

根据我们收到的依据 US Digital Millennium Copyright Act(美国数字千年版权法案)提出的投诉,我们已从此网页上删除了 1 个结果。如果需要,您可以在 ChillingEffects.org 上阅读导致删除搜索结果的 DMCA 投诉。

同事提议弄个子页面和首页类似,然后将首页重定向到这个子页面试试,我真不懂这样有什么好处

具体做法是,在.htaccess里添加这么条规则:

RewriteRule ^$ http://www.yourdomain.com/yourpage.html [L,R=301]

  • Share/Bookmark

Tags: , , , ,

Apache mod_rewrite模块中RewriteCond和RewriteRule的指令格式

RewriteCond指令格式
语法: RewriteCond TestString CondPattern
1) TestString是一个纯文本的字符串,但是可以包含可扩展的成分
2) CondPattern是条件pattern, 即一个应用于当前实例TestString的正则表达式, 即TestString将会被计算然后与CondPattern匹配.
3) 另外,还可以为CondPattern追加特殊的标记[flags] 作为RewriteCond指令的第三个参数。Flags是一个以逗号分隔的以下标记的列表:
‘nocase|NC’  它使测试忽略大小写, 即TestString和CondPattern无大小写检查
‘ornext|OR’  它以OR方式组合若干规则的条件,而不是隐含的AND。

RewriteRule 指令
语法: RewriteRule Pattern Substitution
1) Pattern是一个作用于当前URL的兼容perl的正则表达式. 这里的“当前”是指该规则生效时的URL的值。
2) Substitution是,当原始URL与Pattern相匹配时,用以替代(或替换)的字符串。
3) 此外,Substitution还可以追加特殊标记[flags]  作为RewriteRule指令的第三个参数。 Flags是一个包含以逗号分隔的下列标记的列表:
‘redirect|R [=code]‘ (强制重定向 redirect)
以http://thishost[:thisport]/(使新的URL成为一个URI) 为前缀的Substitution可以强制性执行一个外部重定向。 如果code没有指定,则产生一个HTTP响应代码302(临时性移动)。 如果需要使用在300-400范围内的其他响应代码,只需在此指定这个数值即可, 另外,还可以使用下列符号名称之一: temp (默认的), permanent, seeother. 用它可以把规范化的URL反馈给客户端,如, 重写“/~”为 “/u/”,或对/u/user加上斜杠,等等。

注意: 在使用这个标记时,必须确保该替换字段是一个有效的URL! 否则,它会指向一个无效的位置! 并且要记住,此标记本身只是对URL加上 http://thishost[:thisport]/的前缀,重写操作仍然会继续。 通常,你会希望停止重写操作而立即重定向,则还需要使用’L'标记.

‘forbidden|F’ (强制URL为被禁止的 forbidden)
强制当前URL为被禁止的,即,立即反馈一个HTTP响应代码403(被禁止的)。 使用这个标记,可以链接若干RewriteConds以有条件地阻塞某些URL。
‘gone|G’ (强制URL为已废弃的 gone)
强制当前URL为已废弃的,即,立即反馈一个HTTP响应代码410(已废弃的)。 使用这个标记,可以标明页面已经被废弃而不存在了.
‘proxy|P’ (强制为代理 proxy)
此标记使替换成分被内部地强制为代理请求,并立即(即, 重写规则处理立即中断)把处理移交给代理模块。 你必须确保此替换串是一个有效的(比如常见的以 http://hostname开头的)能够为Apache代理模块所处理的URI。 使用这个标记,可以把某些远程成分映射到本地服务器名称空间, 从而增强了ProxyPass指令的功能。
注意: 要使用这个功能,代理模块必须编译在Apache服务器中。 如果你不能确定,可以检查“httpd -l”的输出中是否有mod_proxy.c。 如果有,则mod_rewrite可以使用这个功能; 如果没有,则必须启用mod_proxy并重新编译“httpd”程序。

‘last|L’ (最后一个规则 last)
立即停止重写操作,并不再应用其他重写规则。 它对应于Perl中的last命令或C语言中的break命令。 这个标记可以阻止当前已被重写的URL为其后继的规则所重写。 举例,使用它可以重写根路径的URL(‘/’)为实际存在的URL, 比如, ‘/e/www/’.
‘next|N’ (重新执行 next round)
重新执行重写操作(从第一个规则重新开始). 这时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理的URL。 它对应于Perl中的next命令或C语言中的continue命令。 此标记可以重新开始重写操作,即, 立即回到循环的头部。
但是要小心,不要制造死循环!
‘chain|C’ (与下一个规则相链接 chained)
此标记使当前规则与下一个(其本身又可以与其后继规则相链接的, 并可以如此反复的)规则相链接。 它产生这样一个效果: 如果一个规则被匹配,通常会继续处理其后继规则, 即,这个标记不起作用;如果规则不能被匹配, 则其后继的链接的规则会被忽略。比如,在执行一个外部重定向时, 对一个目录级规则集,你可能需要删除“.www” (此处不应该出现“.www”的)。
‘type|T=MIME-type’ (强制MIME类型 type)
强制目标文件的MIME类型为MIME-type。 比如,它可以用于模拟mod_alias中的ScriptAlias指令, 以内部地强制被映射目录中的所有文件的MIME类型为“application/x-httpd-cgi”.
‘nosubreq|NS’ (仅用于不对内部子请求进行处理 no internal sub-request)
在当前请求是一个内部子请求时,此标记强制重写引擎跳过该重写规则。 比如,在mod_include试图搜索可能的目录默认文件(index.xxx)时, Apache会内部地产生子请求。对子请求,它不一定有用的,而且如果整个规则集都起作用, 它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。

根据你的需要遵循以下原则: 如果你使用了有CGI脚本的URL前缀,以强制它们由CGI脚本处理, 而对子请求处理的出错率(或者开销)很高,在这种情况下,可以使用这个标记。

‘nocase|NC’ (忽略大小写 no case)
它使Pattern忽略大小写,即, 在Pattern与当前URL匹配时,’A-Z’ 和’a-z’没有区别。
‘qsappend|QSA’ (追加请求串 query string append)
此标记强制重写引擎在已有的替换串中追加一个请求串,而不是简单的替换。 如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。
‘noescape|NE’ (在输出中不对URI作转义 no URI escaping)
此标记阻止mod_rewrite对重写结果应用常规的URI转义规则。 一般情况下,特殊字符(如’%', ‘$’, ‘;’等)会被转义为等值的十六进制编码。 此标记可以阻止这样的转义,以允许百分号等符号出现在输出中,如:
RewriteRule /foo/(.*) /bar?arg=P1\%3d$1 [R,NE]

可以使’/foo/zed’转向到一个安全的请求’/bar?arg=P1=zed’.
‘passthrough|PT’ (移交给下一个处理器 pass through)
此标记强制重写引擎将内部结构request_rec中的uri字段设置为 filename字段的值,它只是一个小修改,使之能对来自其他URI到文件名翻译器的 Alias,ScriptAlias, Redirect 等指令的输出进行后续处理。举一个能说明其含义的例子: 如果要通过mod_rewrite的重写引擎重写/abc为/def, 然后通过mod_alias使/def转变为/ghi,可以这样:
RewriteRule ^/abc(.*) /def$1 [PT]
Alias /def /ghi

如果省略了PT标记,虽然mod_rewrite运作正常, 即, 作为一个使用API的URI到文件名翻译器, 它可以重写uri=/abc/…为filename=/def/…, 但是,后续的mod_alias在试图作URI到文件名的翻译时,则会失效。
注意: 如果需要混合使用不同的包含URI到文件名翻译器的模块时, 就必须使用这个标记。。 混合使用mod_alias和mod_rewrite就是个典型的例子。

For Apache hackers
如果当前Apache API除了URI到文件名hook之外,还有一个文件名到文件名的hook, 就不需要这个标记了! 但是,如果没有这样一个hook,则此标记是唯一的解决方案。 Apache Group讨论过这个问题,并在Apache 2.0 版本中会增加这样一个hook。
‘skip|S=num’ (跳过后继的规则 skip)
此标记强制重写引擎跳过当前匹配规则后继的num个规则。 它可以实现一个伪if-then-else的构造: 最后一个规则是then从句,而被跳过的skip=N个规则是else从句. (它和’chain|C’标记是不同的!)
‘env|E=VAR:VAL’ (设置环境变量 environment variable)
此标记使环境变量VAR的值为VAL, VAL可以包含可扩展的反向引用的正则表达式$N和%N。 此标记可以多次使用以设置多个变量。 这些变量可以在其后许多情况下被间接引用,但通常是在XSSI (via <!–#echo var=”VAR”–>) or CGI (如 $ENV{‘VAR’})中, 也可以在后继的RewriteCond指令的pattern中通过%{ENV:VAR}作引用。 使用它可以从URL中剥离并记住一些信息。
‘cookie|CO=NAME:VAL:domain[:lifetime[:path]]’ (设置cookie)
它在客户端浏览器上设置一个cookie。 cookie的名称是NAME,其值是VAL。 domain字段是该cookie的域,比如’.apache.org’, 可选的lifetime是cookie生命期的分钟数, 可选的path是cookie的路径。

 其实apache手册中有 http://man.chinaunix.net/newsoft/ApacheManual/mod/mod_rewrite.html

  • Share/Bookmark

Tags: , , , , , , , , , , , , , , , , , ,

网站遭遇攻击

一网站受到攻击,看了下,还真有意思

一、攻击时请求的都是子页面,没有请求主页,看来是预先设置或收集了目标站的sitemap

二、攻击来源IP来自全球各地,大约有两百多个,来路域名居然都是http://www.whitehouse.net

这网站像个恶搞白宫的,很早注册,PR值也达到了6,不知道是真来源,还是伪装的,不过基本可以肯定黑客的技术和资源都很不错

三、请求是通过程序处理的,所以CNZZ代码得不到本地执行,无法通过CNZZ得到统计数据

四、最高时每秒并发也只是近百,但足以让服务器响应http 500错误了

五、关了SEO URLS时(主要是去掉.htaccess的rewrite规则),情况好转,因为对方请求的是伪静态子页面,全部404 not found

六、解决办法,收集攻击来源IP,过滤下,在.htaccess里阻止掉,代码如下:

<Files 403.shtml>
order allow,deny
allow from all
</Files>

deny from XXX.XXX.XXX.XXX
……

这样做,这些来源IP的请求全部403了,哈哈

经处理,后来攻击停了,持续了5小时左右,看来对方也累

这次bluehost居然没有主动关闭空间,很是奇怪啊,CPU使用率都超高了,访问日志文件也飙得很快

  • Share/Bookmark

Tags: , , , , , , , , ,

APMServ的rewrite配置

装了张宴的APMServ,发现rewrite功能不能用,查了一下,原来需要修改

E:\APMServ5.2.6\Apache\conf\httpd.conf 文件

找到你所在的虚拟目录修改以下这个地方(如果你有配置虚拟主机的话应修改E:\APMServ5.2.6\Apache\conf\apmserv\vhost.conf 文件)

找到

AllowOverride None

改成

AllowOverride Options FileInfo

重启Apache服务即可

  • Share/Bookmark

Tags: , , , , ,

301重定向进行URL标准化设置

经常会碰到这样的情况,其他网站链接你的站点时,会用下面的链接:

www.crazylemon.net
crazylemon.net
www.crazylemon.net/index.php
crazylemon.net/index.php

而这样导致:你站点主域名的pr值分散到其他几个URLs了。

如果你用301重定向把其他URL转到
www.crazylemon.net
PR也就集中在主域名:www.crazylemon.net了。

301重定向具体办法:

设置.htaccess文件(只适用于linux系统,并需要虚拟主机支持。)

使访问crazylemon.net的时候就会自动转到www.crazylemon.net

在.htaccess文件里写上以下代码即可。

RewriteEngine on
RewriteCond %{http_host} ^mydomain.com [NC]
RewriteRule ^(.*)$ http://www.mydomain.com/$1 [L,R=301]

注意:URL标准化的301重定向(以上代码)需要写在其他URL-rewrite代码之前。

  • Share/Bookmark

Tags: , , , , , , ,

Apache服务器wordpress设置永久连接后怎么去掉INDEX.PHP

在网站根目录下创建.htaccess文件,加入下列内容

# BEGIN WordPres
<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /wordpress
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /wordpress/index.php [L]
</IfModule>
# END WordPress

wordpress需要改为你自己的wordpress文件夹的名字,如果是主目录下,就不必了,直接干掉

即可

原来我错了,从nginx服务器搬过来时,忘了没有.htaccess文件,导致除了主页都无法访问

难怪IP少了好多。。。晕死

  • Share/Bookmark

Tags: , , , , , , , , ,

nginx rewrite 参数

正则表达式匹配,其中:

* ~ 为区分大小写匹配
* ~* 为不区分大小写匹配
* !~和!~*分别为区分大小写不匹配及不区分大小写不匹配

文件及目录匹配,其中:

* -f和!-f用来判断是否存在文件
* -d和!-d用来判断是否存在目录
* -e和!-e用来判断是否存在文件或目录
* -x和!-x用来判断文件是否可执行

flag标记有:

* last 相当于Apache里的[L]标记,表示完成rewrite
* break 终止匹配, 不再匹配后面的规则
* redirect 返回302临时重定向
* permanent 返回301永久重定向

一些可用的全局变量有,可以用做条件判断(待补全)

$args
$content_length
$content_type
$document_root
$document_uri
$host
$http_user_agent
$http_cookie
$limit_rate
$request_body_file
$request_method
$remote_addr
$remote_port
$remote_user
$request_filename
$request_uri
$query_string
$scheme
$server_protocol
$server_addr
$server_name
$server_port
$uri

结合QeePHP的例子

if (!-d $request_filename) {
rewrite ^/([a-z-A-Z]+)/([a-z-A-Z]+)/?(.*)$ /index.php?namespace=user&controller=$1&action=$2&$3 last;
rewrite ^/([a-z-A-Z]+)/?$ /index.php?namespace=user&controller=$1 last;
break;
}

  • Share/Bookmark

Tags: , , , , , , , , , , ,

分析WordPress的Rewrite机制

家都知道,WordPress 可以通过 Apache 的 mod_rewrite 模块,使用 .htaccess 文件来重写URL,生成静态链接(或称永久链接),如 http://example.com/年/月/日/日志名/ ,使URL更加美观也对搜索引擎更友好。但具体是如何实现的,可能有些朋友不是很清楚,因此我在这里稍稍阐述下。而在不支持 .htaccess 的主机环境中,也可以使用 http://example.com/index.php/年/月/日/日志名/ 这种形式的URL,以及使用ISAPI等东东,原理都差不多,本文就不探讨了。

我以 http://www.crazylemon.net/database-dict-for-wordpress-23/2008/02/25/ 为具体例子进行分析。首先我们先来看看WordPress根目录下的 .htaccess 文件,其中有一段如下

RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]

意思是指,当接收到的请求不是一个文件或目录时,则会重写为WordPress根目录下的index.php文件,然后 index.php 就开始处理请求。

index.php 会包含 wp-blog-header.php, wp-blog-header.php 会包含 wp-config.php, wp-config.php 又会包含 wp-settings.php,最后 wp-settings.php 会包含一大堆文件进来,晕了吧。其中, wp-includes/query.php 中的 WP_Query 类和 wp-includes/classes.php 中的 WP 类是Rewrite最主要的,因此我们将对象实例化

$wp_the_query =&amp; new WP_Query();
$wp_query     =&amp; $wp_the_query;
$wp_rewrite   =&amp; new WP_Rewrite();
$wp           =&amp; new WP();

做了这么多准备工作后,WP真正开始处理请求了,在 wp-blog-header.php 中调用wp()函数,在这个函数执行了 WP 类的成员方法main()

function main($query_args = ”) {
    $this-&gt;init(); //初始化,获取当前用户信息
    $this-&gt;parse_request($query_args); //解析请求
    $this-&gt;send_headers(); //发送头信息
    $this-&gt;query_posts(); //查询日志
    $this-&gt;handle_404(); //操作404(URL地址不存在)
    $this-&gt;register_globals(); //注册全局变量
    do_action_ref_array(’wp’, array(&amp;$this));
}

我们进入$this->parse_request()瞧瞧,通过$_SERVER[’REQUEST_URI’]和过滤得到字符串 ‘database-dict-for-wordpress-23/2008/02/25′ 赋值给$request_match,与存储在数据库中的rewrite规则集进行正则匹配,rewrite规则集类似与下面这个样子,当然,比下面的多了很多。

[wp-feed.php$] =&gt; index.php?feed=feed
[wp-commentsrss2.php$] =&gt; index.php?feed=rss2&amp;withcomments=1
[(about)/trackback/?$] =&gt; index.php?pagename=$matches[1]&amp;tb=1
[page/?([0-9]{1,})/?$] =&gt; index.php?&amp;paged=$matches[1]
[comments/(feed|rdf|rss|rss2|atom)/?$] =&gt; index.php?&amp;feed=$matches[1]&amp;withcomments=1
[search/(.+)/?$] =&gt; index.php?s=$matches[1]
[category/(.+?)/?$] =&gt; index.php?category_name=$matches[1]
[tag/(.+?)/?$] =&gt; index.php?tag=$matches[1]

我的请求与 ‘([^/]+)/([0-9]{4})/([0-9]{1,2})/([0-9]{1,2})(/[0-9]+)?/?$’ 这条匹配,所以我的请求被转化为 ‘name=database-dict-for-wordpress-23&year=2008&monthnum=02&day=25&page=’,如果请求都没匹配上那就肯定404了。接着就是通过 $this->query_posts() 来查询日志信息了,查询不到那还是404,废话…

把这些都整完了,回到 wp-blog-header.php,包含 wp-includes/template-loader.php 来加载模板并显示,日志显示日志,页面显示页面,404显示404,总之就是各神归位,OVER

  • Share/Bookmark

Tags: , , , , , , , , , , , , , ,

osCommerce 在 nginx 上的 rewrite 规则

location / {
 if (!-e $request_filename)
 {
rewrite “^(.*)-p-(.*).html” /product_info.php?products_id=$2%1;
rewrite “^(.*)-p-(.*).html” /product_info.php?products_id=$2&% last;
rewrite “^(.*)-c-(.*).html” /index.php?cPath=$2&% last;
rewrite “^(.*)-m-(.*).html” /index.php?manufacturers_id=$2&% last;
rewrite “^(.*)-pi-(.*).html” /popup_image.php?pID=$2&% last;
rewrite “^(.*)-t-(.*).html” /articles.php?tPath=$2&% last;
rewrite “^(.*)-au-(.*).html” /articles.php?authors_id=$2&% last;
rewrite “^(.*)-a-(.*).html” /article_info.php?articles_id=$2&% last;
rewrite “^(.*)-pr-(.*).html” /product_reviews.php?products_id=$2&% last;
rewrite “^(.*)-pri-(.*).html” /product_reviews_info.php?products_id=$2&% last;
rewrite “^(.*)-i-(.*).html” /information.php?info_id=$2&% last;
rewrite “^(.*)-pm-([0-9]+).html” /info_pages.php?pages_id=$2&% last;
rewrite “^(.*)-links-(.*).html” /links.php?lPath=$2&% last;
rewrite “^(.*)-n-(.*).html” /newsdesk_info.php?newsdesk_id=$2&% last;
rewrite “^(.*)-nc-(.*).html” /newsdesk_index.php?newsPath=$2&% last;
rewrite “^(.*)-nri-(.*).html” /newsdesk_reviews_info.php?newsdesk_id=$2&% last;
rewrite “^(.*)-nra-(.*).html” /newsdesk_reviews_article.php?newsdesk_id=$2&% last;
rewrite “^(.*)-f-(.*).html” /faqdesk_info.php?faqdesk_id=$2&% last;
rewrite “^(.*)-fc-(.*).html” /faqdesk_index.php?faqPath=$2&% last;
rewrite “^(.*)-fri-(.*).html” /faqdesk_reviews_info.php?faqdesk_id=$2&% last;
rewrite “^(.*)-fra-(.*).html” /faqdesk_reviews_article.php?faqdesk_id=$2&% last;
 }
}

相应的apache为:

RewriteRule ^(.*)-p-(.*).html$ product_info.php?products_id=$2%1
RewriteRule ^(.*)-p-(.*).html$ product_info.php?products_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-c-(.*).html$ index.php?cPath=$2&%{QUERY_STRING}
RewriteRule ^(.*)-m-(.*).html$ index.php?manufacturers_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-pi-(.*).html$ popup_image.php?pID=$2&%{QUERY_STRING}
RewriteRule ^(.*)-t-(.*).html$ articles.php?tPath=$2&%{QUERY_STRING}
RewriteRule ^(.*)-au-(.*).html$ articles.php?authors_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-a-(.*).html$ article_info.php?articles_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-pr-(.*).html$ product_reviews.php?products_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-pri-(.*).html$ product_reviews_info.php?products_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-i-(.*).html$ information.php?info_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-pm-([0-9]+).html$ info_pages.php?pages_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-links-(.*).html$ links.php?lPath=$2&%{QUERY_STRING}
RewriteRule ^(.*)-n-(.*).html$ newsdesk_info.php?newsdesk_id=$2&%{QUERY_STRING}

RewriteRule ^(.*)-nc-(.*).html$ newsdesk_index.php?newsPath=$2&%{QUERY_STRING}
RewriteRule ^(.*)-nri-(.*).html$ newsdesk_reviews_info.php?newsdesk_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-nra-(.*).html$ newsdesk_reviews_article.php?newsdesk_id=$2&%{QUERY_STRING}

RewriteRule ^(.*)-f-(.*).html$ faqdesk_info.php?faqdesk_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-fc-(.*).html$ faqdesk_index.php?faqPath=$2&%{QUERY_STRING}
RewriteRule ^(.*)-fri-(.*).html$ faqdesk_reviews_info.php?faqdesk_id=$2&%{QUERY_STRING}
RewriteRule ^(.*)-fra-(.*).html$ faqdesk_reviews_article.php?faqdesk_id=$2&%{QUERY_STRING}

  • Share/Bookmark

Tags: , , , , , , , , , ,