只要中文的,比較難,你確定你的表中沒有韓文,日文,這就好辦?。?/p>
讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領域值得信任、有價值的長期合作伙伴,公司提供的服務項目有:域名申請、網(wǎng)頁空間、營銷軟件、網(wǎng)站建設、江西網(wǎng)站維護、網(wǎng)站推廣。
無論是阿拉伯數(shù)字,還是英文字母,ascii碼最大不超過122
select * from tab where ascii(att1)122; 試試可以嗎
如果不考慮性能的話,可以這么做
select * from tab where substr(trim(attr),1,4)=substrb(trim(attr)1,4);
這需要考慮你的數(shù)據(jù)庫字符集,如何是ZHS16GBK的話,2位中文,如果是AL32UTF8,是3位~4位中文
從表里提取漢字, 需要考慮字符集, 不同的字符集漢字的編碼有所不同
這里以GB2312為例, 寫一函數(shù)準確地從表里提取簡體漢字.
假設數(shù)據(jù)庫字符集編碼是GB2312, 環(huán)境變量(注冊表或其它)的字符集也是GB2312編碼
并且保存到表里的漢字也都是GB2312編碼的
那么也就是漢字是雙字節(jié)的,且簡體漢字的編碼范圍是
B0A1 - F7FE
換算成10進制就是
B0 A1 F7 FE
176,161 - 247,254
我們先看一下asciistr函數(shù)的定義
Non-ASCII characters are converted to the form \xxxx, where xxxx represents a UTF-16 code unit.
但是這并不表示以 "\" 開始的字符就是漢字了
舉例如下
SQL select * from test;
NAME
--------------------
,啊OO10哈
你好aa
大家好aa/
☆大海123
★ABC
這里第5條記錄有一個實心的五角星
然后用asciistr函數(shù)轉(zhuǎn)換一下試試
SQL select name,asciistr(name) from test;
NAME ASCIISTR(NAME)
-------------------- ----------------------
,啊OO10哈 ,\554AOO10\54C8
你好aa \4F60\597Daa
大家好aa/ \5927\5BB6\597Daa/
☆大海123 \2606\5927\6D77123
★ABC \2605ABC
我們看到最后一條記錄的實心五角星也是 "\"開頭的
此時我們就不能用asciistr(字段)是否存在 "\" 來判斷是否含有漢字了.
我的函數(shù)如下,基本思路是判斷字符的編碼是否在GB2312規(guī)定的漢字編碼范圍之內(nèi)
[PHP]
create or replace function get_chinese(p_name in varchar2) return varchar2
as
v_code varchar2(30000) := '';
v_chinese varchar2(4000) := '';
v_comma pls_integer;
v_code_q pls_integer;
v_code_w pls_integer;
begin
if p_name is not null then
select replace(substrb(dump(p_name,1010),instrb(dump(p_name,1010),'ZHS16GBK:')),'ZHS16GBK: ','') into v_code from dual where rownum=1;
for i in 1..length(p_name) loop
if lengthb(substr(p_name,i,1))=2 then
v_comma := instrb(v_code,',');
v_code_q := to_number(substrb(v_code,1,v_comma-1));
v_code_w := to_number(substrb(v_code,v_comma+1,abs(instrb(v_code,',',1,2)-v_comma-1)));
if v_code_q=176 and v_code_q=247 and v_code_w=161 and v_code_w=254 then
v_chinese := v_chinese||substr(p_name,i,1);
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
end loop;
return v_chinese;
else
return '';
end if;
end;
/
.
[/PHP]
好,現(xiàn)在來執(zhí)行一些語句
SQL select * from test;
NAME
--------------------
,啊OO10哈
你好aa
大家好aa/
☆大海123
★ABC
5 rows selected.
1. 列出有漢字的記錄
SQL select name from test where length(get_chinese(name))0;
NAME
--------------------
,啊OO10哈
你好aa
大家好aa/
☆大海123
4 rows selected.
2. 列出有漢字的記錄,并且只列出漢字
SQL select get_chinese(name) from test where length(get_chinese(name))0;
GET_CHINESE(NAME)
---------------------------------------------------------------------------
啊哈
你好
大家好
大海
4 rows selected.
需要說明的是GB2312共有6763個漢字,即72*94-5=6763
我這里是計算72*94,沒有減去那5個,那五個是空的。等查到了再減去
============
改寫這個函數(shù),可以提取非漢字或者漢字
該函數(shù)有兩個參數(shù),第一個表示要提取的字符串,第二個是1,表示提取漢字,是非1,表示提取非漢字
[PHP]
create or replace function get_chinese
(
p_name in varchar2,
p_chinese in varchar2
) return varchar2
as
v_code varchar2(30000) := '';
v_chinese varchar2(4000) := '';
v_non_chinese varchar2(4000) := '';
v_comma pls_integer;
v_code_q pls_integer;
v_code_w pls_integer;
begin
if p_name is not null then
select replace(substrb(dump(p_name,1010),instrb(dump(p_name,1010),'ZHS16GBK:')),'ZHS16GBK: ','') into v_code from dual where rownum=1;
for i in 1..length(p_name) loop
if lengthb(substr(p_name,i,1))=2 then
v_comma := instrb(v_code,',');
v_code_q := to_number(substrb(v_code,1,v_comma-1));
v_code_w := to_number(substrb(v_code,v_comma+1,abs(instrb(v_code,',',1,2)-v_comma-1)));
if v_code_q=176 and v_code_q=247 and v_code_w=161 and v_code_w=254 then
v_chinese := v_chinese||substr(p_name,i,1);
else
v_non_chinese := v_non_chinese||substr(p_name,i,1);
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
else
v_non_chinese := v_non_chinese||substr(p_name,i,1);
end if;
v_code := ltrim(v_code,'1234567890');
v_code := ltrim(v_code,',');
end loop;
if p_chinese = '1' then
return v_chinese;
else
return v_non_chinese;
end if;
else
return '';
end if;
end;
/
.
[/PHP]
SQL select * from a;
NAME
--------------------
我們啊、
他(艾呀)是★們
他的\啊@
SQL select get_chinese(name,1) from a;
GET_CHINESE(NAME,1)
-----------------------------------------
我們啊
他艾呀是們
他的啊
SQL select get_chinese(name,0) from a;
GET_CHINESE(NAME,0)
-----------------------------------------
、
()★
\@
SQL
1、使用ASCIISTR函數(shù)判別
ASCIISTR函數(shù)說明:ASCIISTR返回字符的ASCII形式的字符串。非ASCII的字符被轉(zhuǎn)化為\xxxx的形式。使用ASCIISTR函數(shù)也是根據(jù)非ASCII字符會被轉(zhuǎn)化這個特性來判別中文字符,只要里面包含中文字符,則必定會有\(zhòng)xxx這樣的字符。
使用 ASCIISTR(NAME_ONE) LIKE '%\%' 就能判別那些有中文的記錄。如下所示:
SELECT NAME_ONE FROM TEST WHERE ASCIISTR(NAME_ONE) LIKE?'%\%'
2、使用CONVERT函數(shù)判別
CONVERT函數(shù)說明:
CONVERT(inputstring,dest_charset,source_charset)
inputstring:要轉(zhuǎn)換的字符串
dest_charset:目標字符集
source_charset:原字符集
3、使用函數(shù)length和lengthb來判別
使用函數(shù)length與lengthb來判別,是基于中文字符占用2~4個字節(jié),而ASCII字符占用一個字節(jié),那么對比LENGTH與LENGTHB就會不一樣。這樣就能判別字段中是否包含中文字符,但是跟ASCIISTR一樣,如果里面的非ASCI字符包含非中文,它一樣不能判別。依然有取巧嫌疑。
SELECT NAME_ONE FROM TEST WHERE LENGTH(NAME_ONE) != LENGTHB(NAME_ONE);
擴展資料
Oracle SQL編寫注意事項:
1、SQL語句用大寫的;因為Oracle總是先解析SQL語句,把小寫的字母轉(zhuǎn)換成大寫的再執(zhí)行。
2、數(shù)據(jù)表最好起別名;因為便于sql優(yōu)化器快速分析。
3、盡量不要使用 insert into table value(?,?,?,?,?)格式,要指出具體要賦值的字段。INSERT.....SELECT的效率會有提高。
4、select與from語句之間只定義返回的字段名,除非返回所有的字段,盡量不要使用 * 。
5、select字段名應按照表的字段物理順序編寫,字段提取要按照“需多少、提多少”的原則,原因是大批量數(shù)據(jù)的抽取會影響sql緩存的效率。
6、COUNT(*)也是要避免的,因為Count(*)會對全字段做聚集。但一般的觀點相反, count(*) 比count(1)稍快 , 當然如果可以通過索引檢索,對索引列的計數(shù)仍舊是最快的. 例如 COUNT(EMPNO)。
7、條件中使用or 會引起全表掃描,比較影響查詢效率,盡可能少用或不用,實在不行可以用UNION代替。
兩個方法:
1.用到正則中的regexp_like
個人感覺可能是regexp_like(字段,'[^[:alphanum:]]')
意思是在字段中匹配非0-9,a-z,A-Z的字段,如果能匹配到,那么可以認為是漢字,否則就不是漢字,當然如果字段中還包含符號,比如加減號什么的,那么那么可能更麻煩一些。
2.用lengthb,與length比長度。如果二者長度相等,那么就沒有中文字符(因為中文字符一個占用兩個字節(jié))。如果lengthb長度大于length長度,那么一般就說明里面存在中文字符。
簡單的方法是用排序 如果你非得要用篩選的話,加一列輔助列,比如C列 在C2輸入公式: =IF(LENB(B2)/LEN(B2)=2,"是","否") 篩選出是的結果就是你需要的
一、問題說明
在處理數(shù)據(jù)的時候,需要判斷某個字段字符串中是否有中文,若有則取出中文。
二、解決辦法
首先如何判斷某個字段字符串中是否有中文。這里介紹三種方法:
1、采用ASCIISTR函數(shù)
說明:ASCIISTR函數(shù)用于返回字符的ASCII形式的字符串;非ASCII的字符被轉(zhuǎn)化為\xxxx的形式。換句話說:如果字符中包含中文,則必定會有\(zhòng)xxxx的字符。
所以,我們直接利用ASCIISTR函數(shù)匹配'\'即可判斷。
2、采用length和lengthb的原理
說明:中文下length返回的是字符個數(shù),中文占1字符,lengthb返回的是字節(jié)個數(shù),中文占2字節(jié),根據(jù)中文的特性即可解決。
3、使用CONVERT函數(shù)判別
說明:CONVERT(要轉(zhuǎn)換的字符串,目標字符集,原字符集),CONVERT函數(shù)用于轉(zhuǎn)換字符串的字符集;所以我們可以利用中文的字符集是utf-8來判斷。
上面介紹了如何判斷某個字段字符串中是否有中文,在成功判斷字段中是否有中文之后;那么該如何取出字段中的中文呢?
這里介紹一種快速準確的辦法:
函數(shù)創(chuàng)建成功后,直接傳jldw調(diào)用就可獲取該字符的中文了。
源碼如下:
create or replace function getCustText(custName varchar2) return varchar2 is
Result varchar2(100); ? ?--返回的結果字符串
tmp_custName varchar2(100); ? --臨時變量
count_str number; ? ? --字符串中字符的個數(shù)
i number:=1; ? ? ? ? ?--循環(huán)變量
str_ascii number; ? ?--當前等待判斷字符的ascii碼
current_char varchar2(10); ?--當前等待判斷的字符
begin
select length(custName) into count_str from dual; ? ?--取出待處理字符串的長度
while icount_str loop ? ? ? ? ? ? ? ? ? ? ? ?---根據(jù)待處理字符串長度(counts)?,逐個字符判斷處理
current_char:=substr(custName,i,1);
select ASCII(current_char) into str_ascii from dual;
if str_ascii45216 then
tmp_custName:=tmp_custName||current_char;
end if;
i:=i+1;
end loop;
Result:=tmp_custName;
return(Result);
end getCustText;