真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

oracle如何篩選中文 oracle判斷中文

ORACLE中怎樣用正則表達(dá)式過(guò)濾中文字符

從表里提取漢字, 需要考慮字符集, 不同的字符集漢字的編碼有所不同

創(chuàng)新互聯(lián)專注于陵水黎族企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè),商城系統(tǒng)網(wǎng)站開(kāi)發(fā)。陵水黎族網(wǎng)站建設(shè)公司,為陵水黎族等地區(qū)提供建站服務(wù)。全流程定制網(wǎng)站設(shè)計(jì),專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務(wù)

這里以GB2312為例, 寫(xiě)一函數(shù)準(zhǔn)確地從表里提取簡(jiǎn)體漢字.

假設(shè)數(shù)據(jù)庫(kù)字符集編碼是GB2312, 環(huán)境變量(注冊(cè)表或其它)的字符集也是GB2312編碼

并且保存到表里的漢字也都是GB2312編碼的

那么也就是漢字是雙字節(jié)的,且簡(jiǎn)體漢字的編碼范圍是

B0A1 - F7FE

換算成10進(jìn)制就是

B0 A1 F7 FE

176,161 - 247,254

我們先看一下asciistr函數(shù)的定義

Non-ASCII characters are converted to the form \xxxx, where xxxx represents a UTF-16 code unit.

但是這并不表示以 "\" 開(kāi)始的字符就是漢字了

舉例如下

SQL select * from test;

NAME

--------------------

,啊OO10哈

你好aa

大家好aa/

☆大海123

★ABC

這里第5條記錄有一個(gè)實(shí)心的五角星

然后用asciistr函數(shù)轉(zhuǎn)換一下試試

SQL select name,asciistr(name) from test;

NAME ASCIISTR(NAME)

-------------------- ----------------------

,啊OO10哈 ,\554AOO10\54C8

你好aa \4F60\597Daa

大家好aa/ \5927\5BB6\597Daa/

☆大海123 \2606\5927\6D77123

★ABC \2605ABC

我們看到最后一條記錄的實(shí)心五角星也是 "\"開(kāi)頭的

此時(shí)我們就不能用asciistr(字段)是否存在 "\" 來(lái)判斷是否含有漢字了.

我的函數(shù)如下,基本思路是判斷字符的編碼是否在GB2312規(guī)定的漢字編碼范圍之內(nèi)

[PHP]

create or replace function get_chinese(p_name in varchar2) return varchar2

as

v_code varchar2(30000) := '';

v_chinese varchar2(4000) := '';

v_comma pls_integer;

v_code_q pls_integer;

v_code_w pls_integer;

begin

if p_name is not null then

select replace(substrb(dump(p_name,1010),instrb(dump(p_name,1010),'ZHS16GBK:')),'ZHS16GBK: ','') into v_code from dual where rownum=1;

for i in 1..length(p_name) loop

if lengthb(substr(p_name,i,1))=2 then

v_comma := instrb(v_code,',');

v_code_q := to_number(substrb(v_code,1,v_comma-1));

v_code_w := to_number(substrb(v_code,v_comma+1,abs(instrb(v_code,',',1,2)-v_comma-1)));

if v_code_q=176 and v_code_q=247 and v_code_w=161 and v_code_w=254 then

v_chinese := v_chinese||substr(p_name,i,1);

end if;

v_code := ltrim(v_code,'1234567890');

v_code := ltrim(v_code,',');

end if;

v_code := ltrim(v_code,'1234567890');

v_code := ltrim(v_code,',');

end loop;

return v_chinese;

else

return '';

end if;

end;

/

.

[/PHP]

好,現(xiàn)在來(lái)執(zhí)行一些語(yǔ)句

SQL select * from test;

NAME

--------------------

,啊OO10哈

你好aa

大家好aa/

☆大海123

★ABC

5 rows selected.

1. 列出有漢字的記錄

SQL select name from test where length(get_chinese(name))0;

NAME

--------------------

,啊OO10哈

你好aa

大家好aa/

☆大海123

4 rows selected.

2. 列出有漢字的記錄,并且只列出漢字

SQL select get_chinese(name) from test where length(get_chinese(name))0;

GET_CHINESE(NAME)

---------------------------------------------------------------------------

啊哈

你好

大家好

大海

4 rows selected.

需要說(shuō)明的是GB2312共有6763個(gè)漢字,即72*94-5=6763

我這里是計(jì)算72*94,沒(méi)有減去那5個(gè),那五個(gè)是空的。等查到了再減去

============

改寫(xiě)這個(gè)函數(shù),可以提取非漢字或者漢字

該函數(shù)有兩個(gè)參數(shù),第一個(gè)表示要提取的字符串,第二個(gè)是1,表示提取漢字,是非1,表示提取非漢字

[PHP]

create or replace function get_chinese

(

p_name in varchar2,

p_chinese in varchar2

) return varchar2

as

v_code varchar2(30000) := '';

v_chinese varchar2(4000) := '';

v_non_chinese varchar2(4000) := '';

v_comma pls_integer;

v_code_q pls_integer;

v_code_w pls_integer;

begin

if p_name is not null then

select replace(substrb(dump(p_name,1010),instrb(dump(p_name,1010),'ZHS16GBK:')),'ZHS16GBK: ','') into v_code from dual where rownum=1;

for i in 1..length(p_name) loop

if lengthb(substr(p_name,i,1))=2 then

v_comma := instrb(v_code,',');

v_code_q := to_number(substrb(v_code,1,v_comma-1));

v_code_w := to_number(substrb(v_code,v_comma+1,abs(instrb(v_code,',',1,2)-v_comma-1)));

if v_code_q=176 and v_code_q=247 and v_code_w=161 and v_code_w=254 then

v_chinese := v_chinese||substr(p_name,i,1);

else

v_non_chinese := v_non_chinese||substr(p_name,i,1);

end if;

v_code := ltrim(v_code,'1234567890');

v_code := ltrim(v_code,',');

else

v_non_chinese := v_non_chinese||substr(p_name,i,1);

end if;

v_code := ltrim(v_code,'1234567890');

v_code := ltrim(v_code,',');

end loop;

if p_chinese = '1' then

return v_chinese;

else

return v_non_chinese;

end if;

else

return '';

end if;

end;

/

.

[/PHP]

SQL select * from a;

NAME

--------------------

我們啊、

他(艾呀)是★們

他的\啊@

SQL select get_chinese(name,1) from a;

GET_CHINESE(NAME,1)

-----------------------------------------

我們啊

他艾呀是們

他的啊

SQL select get_chinese(name,0) from a;

GET_CHINESE(NAME,0)

-----------------------------------------

、

()★

\@

SQL

如何判斷oracle數(shù)據(jù)庫(kù)的列中有中文數(shù)據(jù)

用正則表達(dá)式。

select 字段id,字段名 from 表名 t where length(regexp_substr(t.字段名,'[^u2E80-u9FFF]+$'))0

以上的正則可以搜索漢字,包括中日韓等,繁體應(yīng)該也在吧。

如果要搜索整個(gè)數(shù)據(jù)庫(kù),要么用存儲(chǔ)過(guò)程,循環(huán)的把每一張表的每一個(gè)字段都搜索一遍,表名稱,字段名可以從系統(tǒng)表(user_tab_cols)提取。

要么用全文搜索。

oracle sql 判斷 字段是否是漢字

1、使用ASCIISTR函數(shù)判別

ASCIISTR函數(shù)說(shuō)明:ASCIISTR返回字符的ASCII形式的字符串。非ASCII的字符被轉(zhuǎn)化為\xxxx的形式。使用ASCIISTR函數(shù)也是根據(jù)非ASCII字符會(huì)被轉(zhuǎn)化這個(gè)特性來(lái)判別中文字符,只要里面包含中文字符,則必定會(huì)有\(zhòng)xxx這樣的字符。

使用 ASCIISTR(NAME_ONE) LIKE '%\%' 就能判別那些有中文的記錄。如下所示:

SELECT NAME_ONE FROM TEST WHERE ASCIISTR(NAME_ONE) LIKE?'%\%'

2、使用CONVERT函數(shù)判別

CONVERT函數(shù)說(shuō)明:

CONVERT(inputstring,dest_charset,source_charset)

inputstring:要轉(zhuǎn)換的字符串

dest_charset:目標(biāo)字符集

source_charset:原字符集

3、使用函數(shù)length和lengthb來(lái)判別

使用函數(shù)length與lengthb來(lái)判別,是基于中文字符占用2~4個(gè)字節(jié),而ASCII字符占用一個(gè)字節(jié),那么對(duì)比LENGTH與LENGTHB就會(huì)不一樣。這樣就能判別字段中是否包含中文字符,但是跟ASCIISTR一樣,如果里面的非ASCI字符包含非中文,它一樣不能判別。依然有取巧嫌疑。

SELECT NAME_ONE FROM TEST WHERE LENGTH(NAME_ONE) != LENGTHB(NAME_ONE);

擴(kuò)展資料

Oracle SQL編寫(xiě)注意事項(xiàng):

1、SQL語(yǔ)句用大寫(xiě)的;因?yàn)镺racle總是先解析SQL語(yǔ)句,把小寫(xiě)的字母轉(zhuǎn)換成大寫(xiě)的再執(zhí)行。

2、數(shù)據(jù)表最好起別名;因?yàn)楸阌趕ql優(yōu)化器快速分析。

3、盡量不要使用 insert into table value(?,?,?,?,?)格式,要指出具體要賦值的字段。INSERT.....SELECT的效率會(huì)有提高。

4、select與from語(yǔ)句之間只定義返回的字段名,除非返回所有的字段,盡量不要使用 * 。

5、select字段名應(yīng)按照表的字段物理順序編寫(xiě),字段提取要按照“需多少、提多少”的原則,原因是大批量數(shù)據(jù)的抽取會(huì)影響sql緩存的效率。

6、COUNT(*)也是要避免的,因?yàn)镃ount(*)會(huì)對(duì)全字段做聚集。但一般的觀點(diǎn)相反, count(*) 比count(1)稍快 , 當(dāng)然如果可以通過(guò)索引檢索,對(duì)索引列的計(jì)數(shù)仍舊是最快的. 例如 COUNT(EMPNO)。

7、條件中使用or 會(huì)引起全表掃描,比較影響查詢效率,盡可能少用或不用,實(shí)在不行可以用UNION代替。

oracle如何判斷中文名字是否含有字母,數(shù)字,符號(hào)

看看下邊的語(yǔ)句可不可以

select case when regexp_like(字段名,'.([a-z]+|[A-Z])') then '包含字母' else '不包含字母' end

from 表名字

正則表達(dá)式函數(shù):regexp_like

關(guān)鍵的參數(shù)是第二個(gè):'.([a-z]+|[A-Z])'其中.表示匹配任何單字符,換行符除外

[a-z]是小寫(xiě)字母|或[A-Z]大寫(xiě)字母

oracle判斷字段中是否有漢字,并且將漢字轉(zhuǎn)化為唯一的字母或數(shù)字。

簡(jiǎn)單的方法是用排序 如果你非得要用篩選的話,加一列輔助列,比如C列 在C2輸入公式: =IF(LENB(B2)/LEN(B2)=2,"是","否") 篩選出是的結(jié)果就是你需要的

oracle篩選字段的時(shí)候有沒(méi)有什么指令可以選出中文,如圖所示,我希望跑出來(lái)的結(jié)果只有‘你好’,謝謝

只要中文的,比較難,你確定你的表中沒(méi)有韓文,日文,這就好辦??!

無(wú)論是阿拉伯?dāng)?shù)字,還是英文字母,ascii碼最大不超過(guò)122

select * from tab where ascii(att1)122; 試試可以嗎

如果不考慮性能的話,可以這么做

select * from tab where substr(trim(attr),1,4)=substrb(trim(attr)1,4);

這需要考慮你的數(shù)據(jù)庫(kù)字符集,如何是ZHS16GBK的話,2位中文,如果是AL32UTF8,是3位~4位中文


當(dāng)前標(biāo)題:oracle如何篩選中文 oracle判斷中文
網(wǎng)站網(wǎng)址:http://weahome.cn/article/hghscd.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部