這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)nginx 中怎么實現(xiàn)正則匹配,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
創(chuàng)新互聯(lián)是專業(yè)的工布江達(dá)網(wǎng)站建設(shè)公司,工布江達(dá)接單;提供成都做網(wǎng)站、網(wǎng)站設(shè)計,網(wǎng)頁設(shè)計,網(wǎng)站設(shè)計,建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行工布江達(dá)網(wǎng)站開發(fā)網(wǎng)頁制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊,希望更多企業(yè)前來合作!
今天遇到網(wǎng)站之前的url被百度搜索引擎抓取,需要在服務(wù)中進(jìn)行301強(qiáng)制跳轉(zhuǎn),(如訪問:www.baidu.com/kenni-1,www.baidu.com/kenni-1/,兩個統(tǒng)一跳轉(zhuǎn)到www.baidu.com/kenni-1.html,以及www.baidu.com/kenni-1?page=11,跳轉(zhuǎn)到www.baidu.com/kenni-1.html?page=11,kenni-后面接數(shù)字)
因為服務(wù)器使用的是nginx,所以在nginx增加如下配置:
# 訪問 域名/kenni-10 跳轉(zhuǎn)到域名 域名/kenni-10.html
rewrite ^/kenni-([0-9]+)$ /kenni-$1.html permanent;
# 訪問 域名/kenni-10/ 跳轉(zhuǎn)到域名 域名/kenni-10.html
rewrite ^/kenni-([0-9]+)/$ /kenni-$1.html permanent;
其他學(xué)習(xí)參考資料:
1、^: 匹配字符串的開始位置;
2、 $:匹配字符串的結(jié)束位置;
3、.*: .匹配任意字符,*匹配數(shù)量0到正無窮;
4、\. 斜杠用來轉(zhuǎn)義,\.匹配 . 特殊使用方法,記住記性了;
5、(值1|值2|值3|值4):或匹配模式,例:(jpg|gif|png|bmp)匹配jpg或gif或png或bmp
6、i不區(qū)分大小寫
一.正則表達(dá)式匹配,其中:
* ~ 為區(qū)分大小寫匹配
* ~* 為不區(qū)分大小寫匹配
* !~和!~*分別為區(qū)分大小寫不匹配及不區(qū)分大小寫不匹配
二.文件及目錄匹配,其中:
* -f和!-f用來判斷是否存在文件
* -d和!-d用來判斷是否存在目錄
* -e和!-e用來判斷是否存在文件或目錄
* -x和!-x用來判斷文件是否可執(zhí)行
三.rewrite指令的最后一項參數(shù)為flag標(biāo)記,flag標(biāo)記有:
1.last 相當(dāng)于apache里面的[L]標(biāo)記,表示rewrite。
2.break本條規(guī)則匹配完成后,終止匹配,不再匹配后面的規(guī)則。
3.redirect 返回302臨時重定向,瀏覽器地址會顯示跳轉(zhuǎn)后的URL地址。
4.permanent 返回301永久重定向,瀏覽器地址會顯示跳轉(zhuǎn)后的URL地址。
使用last和break實現(xiàn)URI重寫,瀏覽器地址欄不變。而且兩者有細(xì)微差別,使用alias指令必須用last標(biāo)記;使用proxy_pass指令時,需要使用break標(biāo)記。Last標(biāo)記在本條rewrite規(guī)則執(zhí)行完畢后,會對其所在server{......}標(biāo)簽重新發(fā)起請求,而break標(biāo)記則在本條規(guī)則匹配完成后,終止匹配。
例如:如果我們將類似URL/photo/123456 重定向到/path/to/photo/12/1234/123456.png
rewrite "/photo/([0-9]{2})([0-9]{2})([0-9]{2})"/path/to/photo/$1/$1$2/$1$2$3.png ;
四.NginxRewrite 規(guī)則相關(guān)指令
1.break指令
使用環(huán)境:server,location,if;
該指令的作用是完成當(dāng)前的規(guī)則集,不再處理rewrite指令。
2.if指令
使用環(huán)境:server,location
該指令用于檢查一個條件是否符合,如果條件符合,則執(zhí)行大括號內(nèi)的語句。If指令不支持嵌套,不支持多個條件&&和||處理。
3.return指令
語法:returncode ;
使用環(huán)境:server,location,if;
該指令用于結(jié)束規(guī)則的執(zhí)行并返回狀態(tài)碼給客戶端。
示例:如果訪問的URL以".sh"或".bash"結(jié)尾,則返回403狀態(tài)碼
location ~ .*\.(sh|bash)?$
{
return 403;
}
4.rewrite 指令
語法:rewriteregex replacement flag
使用環(huán)境:server,location,if
該指令根據(jù)表達(dá)式來重定向URI,或者修改字符串。指令根據(jù)配置文件中的順序來執(zhí)行。注意重寫表達(dá)式只對相對路徑有效。如果你想配對主機(jī)名,你應(yīng)該使用if語句,示例如下:
if( $host ~* www\.(.*) )
{
set $host_without_www $1;
rewrite ^(.*)$ http://$host_without_www$1permanent;
}
5.Set指令
語法:setvariable value ; 默認(rèn)值:none; 使用環(huán)境:server,location,if;
該指令用于定義一個變量,并給變量賦值。變量的值可以為文本、變量以及文本變量的聯(lián)合。
示例:set$varname "hello world";
6.Uninitialized_variable_warn指令
語法:uninitialized_variable_warnon|off
使用環(huán)境:http,server,location,if
該指令用于開啟和關(guān)閉未初始化變量的警告信息,默認(rèn)值為開啟。
五.Nginx的Rewrite規(guī)則編寫實例
1.當(dāng)訪問的文件和目錄不存在時,重定向到某個php文件
if( !-e $request_filename )
{
rewrite ^/(.*)$ index.php last;
}
2.目錄對換 /123456/xxxx ====> /xxxx?id=123456
rewrite ^/(\d+)/(.+)/ /$2?id=$1 last;
3.如果客戶端使用的是IE瀏覽器,則重定向到/ie目錄下
if( $http_user_agent ~ MSIE)
{
rewrite ^(.*)$ /ie/$1 break;
}
4.禁止訪問多個目錄
location ~ ^/(cron|templates)/
{
deny all;
break;
}
5.禁止訪問以/data開頭的文件
location ~ ^/data
{
deny all;
}
6.禁止訪問以.sh,.flv,.mp3為文件后綴名的文件
location ~ .*\.(sh|flv|mp3)$
{
return 403;
}
7.設(shè)置某些類型文件的瀏覽器緩存時間
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf)$
{
expires 30d;
}
location ~ .*\.(js|css)$
{
expires 1h;
}
8.給favicon.ico和robots.txt設(shè)置過期時間;
這里為favicon.ico為99天,robots.txt為7天并不記錄404錯誤日志
location ~(favicon.ico) {
log_not_found off;
expires 99d;
break;
}
location ~(robots.txt) {
log_not_found off;
expires 7d;
break;
}
9.設(shè)定某個文件的過期時間;這里為600秒,并不記錄訪問日志
location ^~ /html/scripts/loadhead_1.js {
access_log off;
root /opt/lampp/htdocs/web;
expires 600;
break;
}
10.文件反盜鏈并設(shè)置過期時間
這里的return412 為自定義的http狀態(tài)碼,默認(rèn)為403,方便找出正確的盜鏈的請求
“rewrite ^/ /upload/otherpic60/788800.gif;”顯示一張防盜鏈圖片
“access_log off;”不記錄訪問日志,減輕壓力
“expires 3d”所有文件3天的瀏覽器緩存
location ~*^.+\.(jpg|jpeg|gif|png|swf|rar|zip|css|js)$ {
valid_referers none blocked *.linuxidc.com*.linuxidc.net localhost 208.97.167.194;
if ($invalid_referer) {
rewrite ^/ /upload/otherpic60/788800.gif;
return 412;
break;
}
access_log off;
root /opt/lampp/htdocs/web;
expires 3d;
break;
}
11.只允許固定ip訪問網(wǎng)站,并加上密碼
root /opt/htdocs/www;
allow 208.97.167.194;
allow 222.33.1.2;
allow 231.152.49.4;
deny all;
auth_basic “C1G_ADMIN”;
auth_basic_user_file htpasswd;
12將多級目錄下的文件轉(zhuǎn)成一個文件,增強(qiáng)seo效果
/job-123-456-789.html 指向/job/123/456/789.html
rewrite^/job-([0-9]+)-([0-9]+)-([0-9]+)\.html$ /job/$1/$2/jobshow_$3.html last;
13.文件和目錄不存在的時候重定向:
if (!-e $request_filename) {
proxy_pass http://127.0.0.1;
}
14.將根目錄下某個文件夾指向2級目錄
如/shanghaijob/ 指向 /area/shanghai/
如果你將last改成permanent,那么瀏覽器地址欄顯是/location/shanghai/
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
上面例子有個問題是訪問/shanghai時將不會匹配
rewrite ^/([0-9a-z]+)job$ /area/$1/ last;
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
這樣/shanghai 也可以訪問了,但頁面中的相對鏈接無法使用,
如./list_1.html真實地址是/area/shanghia/list_1.html會變成/list_1.html,導(dǎo)至無法訪問。
那我加上自動跳轉(zhuǎn)也是不行咯
(-d $request_filename)它有個條件是必需為真實目錄,而我的rewrite不是的,所以沒有效果
if (-d $request_filename){
rewrite ^/(.*)([^/])$ http://$host/$1$2/permanent;
}
知道原因后就好辦了,讓我手動跳轉(zhuǎn)吧
rewrite ^/([0-9a-z]+)job$ /$1job/permanent;
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
15.域名跳轉(zhuǎn)
server
{
listen 80;
server_name jump.linuxidc.com;
index index.html index.htm index.php;
root /opt/lampp/htdocs/www;
rewrite ^/ http://www.linuxidc.com/;
access_log off;
}
16.多域名轉(zhuǎn)向
server_name www.linuxidc.comwww.linuxidc.net;
index index.html index.htm index.php;
root /opt/lampp/htdocs;
if ($host ~ "linuxidc\.net") {
rewrite ^(.*) http://www.linuxidc.com$1permanent;
}
六.nginx全局變量
arg_PARAMETER #這個變量包含GET請求中,如果有變量PARAMETER時的值。
args #這個變量等于請求行中(GET請求)的參數(shù),如:foo=123&bar=blahblah;
binary_remote_addr #二進(jìn)制的客戶地址。
body_bytes_sent #響應(yīng)時送出的body字節(jié)數(shù)數(shù)量。即使連接中斷,這個數(shù)據(jù)也是精確的。
content_length #請求頭中的Content-length字段。
content_type #請求頭中的Content-Type字段。
cookie_COOKIE #cookie COOKIE變量的值
document_root #當(dāng)前請求在root指令中指定的值。
document_uri #與uri相同。
host #請求主機(jī)頭字段,否則為服務(wù)器名稱。
hostname #Set to themachine’s hostname as returned by gethostname
http_HEADER
is_args #如果有args參數(shù),這個變量等于”?”,否則等于”",空值。
http_user_agent #客戶端agent信息
http_cookie #客戶端cookie信息
limit_rate #這個變量可以限制連接速率。
query_string #與args相同。
request_body_file #客戶端請求主體信息的臨時文件名。
request_method #客戶端請求的動作,通常為GET或POST。
remote_addr #客戶端的IP地址。
remote_port #客戶端的端口。
remote_user #已經(jīng)經(jīng)過Auth Basic Module驗證的用戶名。
request_completion #如果請求結(jié)束,設(shè)置為OK. 當(dāng)請求未結(jié)束或如果該請求不是請求鏈串的最后一個時,為空(Empty)。
request_method #GET或POST
request_filename #當(dāng)前請求的文件路徑,由root或alias指令與URI請求生成。
request_uri #包含請求參數(shù)的原始URI,不包含主機(jī)名,如:”/foo/bar.php?arg=baz”。不能修改。
scheme #HTTP方法(如http,https)。
server_protocol #請求使用的協(xié)議,通常是HTTP/1.0或HTTP/1.1。
server_addr #服務(wù)器地址,在完成一次系統(tǒng)調(diào)用后可以確定這個值。
server_name #服務(wù)器名稱。
server_port #請求到達(dá)服務(wù)器的端口號。
七.Apache和Nginx規(guī)則的對應(yīng)關(guān)系
Apache的RewriteCond對應(yīng)Nginx的if
Apache的RewriteRule對應(yīng)Nginx的rewrite
Apache的[R]對應(yīng)Nginx的redirect
Apache的[P]對應(yīng)Nginx的last
Apache的[R,L]對應(yīng)Nginx的redirect
Apache的[P,L]對應(yīng)Nginx的last
Apache的[PT,L]對應(yīng)Nginx的last
例如:允許指定的域名訪問本站,其他的域名一律轉(zhuǎn)向www.linuxidc.net
Apache:
RewriteCond %{HTTP_HOST} !^(.*?)\.aaa\.com$[NC]
RewriteCond %{HTTP_HOST} !^localhost$
RewriteCond %{HTTP_HOST}!^192\.168\.0\.(.*?)$
RewriteRule ^/(.*)$ http://www.linuxidc.net[R,L]
Nginx:
if( $host ~* ^(.*)\.aaa\.com$ )
{
set $allowHost ‘1’;
}
if( $host ~* ^localhost )
{
set $allowHost ‘1’;
}
if( $host ~* ^192\.168\.1\.(.*?)$ )
{
set $allowHost ‘1’;
}
if( $allowHost !~ ‘1’ )
{
rewrite ^/(.*)$ http://www.linuxidc.netredirect ;
}
上述就是小編為大家分享的nginx 中怎么實現(xiàn)正則匹配了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。