import re
創(chuàng)新互聯(lián)專注于網(wǎng)站建設(shè)|成都網(wǎng)站改版|優(yōu)化|托管以及網(wǎng)絡(luò)推廣,積累了大量的網(wǎng)站設(shè)計(jì)與制作經(jīng)驗(yàn),為許多企業(yè)提供了網(wǎng)站定制設(shè)計(jì)服務(wù),案例作品覆蓋成都戶外休閑椅等行業(yè)。能根據(jù)企業(yè)所處的行業(yè)與銷售的產(chǎn)品,結(jié)合品牌形象的塑造,量身設(shè)計(jì)品質(zhì)網(wǎng)站。
s = 'MA5:12.56 MA10:12.69 MA20:12.19'
print(re.findall(r'\d+\.\d+', s))
# ['12.56', '12.69', '12.19']
從字符串“127米”中提取數(shù)字127:
方法一、利用正則表達(dá)式
用法:
##?總結(jié)##?^?匹配字符串的開(kāi)始。##?$?匹配字符串的結(jié)尾。##?\b?匹配一個(gè)單詞的邊界。##?\d?匹配任意數(shù)字。##?\D?匹配任意非數(shù)字字符。##?x??匹配一個(gè)可選的?x?字符?(換言之,它匹配?1?次或者?0?次?x?字符)。##?x*?匹配0次或者多次?x?字符。##?x+?匹配1次或者多次?x?字符。##?x{n,m}?匹配?x?字符,至少?n?次,至多?m?次。##?(a|b|c)?要么匹配?a,要么匹配?b,要么匹配?c。##?(x)?一般情況下表示一個(gè)記憶組?(remembered?group)。你可以利用?re.search?函數(shù)返回對(duì)象的?groups()?函數(shù)獲取它的值。##?正則表達(dá)式中的點(diǎn)號(hào)通常意味著?“匹配任意單字符”
[plain]?view plain?copy
import?re
string?=?u'127米'
print?re.findall(r"\d+\.?\d*",?string)
方法二、利用filter(str.isdigit, iterable)
[plain]?view plain?copy
string?=?u'127米'
print?(filter(str.isdigit,?string))
bug:TypeError: descriptor 'isdigit' requires a 'str' object but received a 'unicode'
原因:string不是str類型
修改為:
[plain]?view plain?copy
string?=?u'127米'
string2?=?string.encode('gbk')
print?(type(str))
print?(filter(str.isdigit,?string2))
結(jié)果:
type 'str'
127
注意:要提取的字符串不能命名為str,否則會(huì)出現(xiàn)TypeError: isdigit() takes no arguments (1 given)
因?yàn)閟tr和filter里的str重名了。
loc中的數(shù)據(jù)是列名,是字符串,所以前后都要??;iloc中數(shù)據(jù)是int整型,所以是Python默認(rèn)的前閉后開(kāi)
構(gòu)建數(shù)據(jù)集df
loc函數(shù)主要通過(guò)行標(biāo)簽索引行數(shù)據(jù) ,劃重點(diǎn), 標(biāo)簽!標(biāo)簽!標(biāo)簽!
loc[1] 選擇行標(biāo)簽是1的(從0、1、2、3這幾個(gè)行標(biāo)簽中)
loc[0:1] 和 loc[0,1]的區(qū)別,其實(shí)最重要的是loc[0:1]和iloc[0:1]
索引某一列數(shù)據(jù),loc[:,0:1],還是標(biāo)簽,注意,如果列標(biāo)簽是個(gè)字符,比如'a',loc['a']是不行的,必須為loc[:,'a']。
但如果行標(biāo)簽是'a',選取這一行,用loc['a']是可以的。
iloc 主要是通過(guò)行號(hào)獲取行數(shù)據(jù),劃重點(diǎn),序號(hào)!序號(hào)!序號(hào)!
iloc[0:1],由于Python默認(rèn)是前閉后開(kāi),所以,這個(gè)選擇的只有第一行!
如果想用標(biāo)簽索引,如iloc['a'],就會(huì)報(bào)錯(cuò),它只支持int型。
ix——結(jié)合前兩種的混合索引,即可以是行序號(hào),也可以是行標(biāo)簽。
如選擇prize10(prize為一個(gè)標(biāo)簽)的,即 df.loc[df.prize10]
還有并或等操作
python選取特定列——pandas的iloc和loc以及icol使用
pandas入門——loc與iloc函數(shù)
pandas中l(wèi)oc、iloc、ix的區(qū)別
pandas基礎(chǔ)之按行取數(shù)(DataFrame)
可以參考下面的代碼:
#!/usr/bin/python
# encoding: utf-8
# filename: baiduzhidao.py
ln = "4564612131856+654654654654"
print ln.split("+")
#~ Result:
#~ python -u "baiduzhidao.py"
#~ ['4564612131856', '654654654654']
#~ Exit code: 0? ? Time: 0.052
Python在設(shè)計(jì)上堅(jiān)持了清晰劃一的風(fēng)格,這使得Python成為一門易讀、易維護(hù),并且被大量用戶所歡迎的、用途廣泛的語(yǔ)言,設(shè)計(jì)者開(kāi)發(fā)時(shí)總的指導(dǎo)思想是,對(duì)于一個(gè)特定的問(wèn)題,只要有一種最好的方法來(lái)解決就好了。
Python本身被設(shè)計(jì)為可擴(kuò)充的。并非所有的特性和功能都集成到語(yǔ)言核心。Python提供了豐富的API和工具,以便程序員能夠輕松地使用C語(yǔ)言、C++、Cython來(lái)編寫(xiě)擴(kuò)充模塊。
Python是完全面向?qū)ο蟮恼Z(yǔ)言。函數(shù)、模塊、數(shù)字、字符串都是對(duì)象。并且完全支持繼承、重載、派生、多繼承,有益于增強(qiáng)源代碼的復(fù)用性。
擴(kuò)展資料:
python參考函數(shù)
vars(obj) 返回一個(gè)object的name space。用dictionary表示
locals() 返回一個(gè)局部name space,用dictionary表示
globals() 返回一個(gè)全局name space,用dictionary表示
type(obj) 查看一個(gè)obj的類型
isinstance(obj,cls) 查看obj是不是cls的instance
issubclass(subcls,supcls) 查看subcls是不是supcls的子類
參考資料來(lái)源:百度百科-Python (計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言)
1、如下圖,要提取#后面的字符,也即紅色的“SDK”到B列。
2、首先,在B2中輸入公式:
=FIND("#",A2)
返回#在字符串中的位置,#在A2單元格文本中是第6個(gè)字符。
3、知識(shí)點(diǎn)說(shuō)明:
FIND()函數(shù)查找第一參數(shù)在第二參數(shù)中的位置。如下圖,查找“B”在“ABCD”中是第幾個(gè)字符。第一參數(shù)是要查找的字符“B”,第二參數(shù)是被查找的字符串。最終返回“B”在“ABCD”中是第2個(gè)字符。
4、然后,在B2中輸入公式:
=MID(A2,FIND("#",A2)+1,99)
這樣,就提取出了#后的字符。
5、知識(shí)點(diǎn)說(shuō)明:
MID()函數(shù)返回從字符串中制定字符開(kāi)始若干個(gè)字符的字符串。如下圖,MID()函數(shù)返回“ABCDE”字符串中從第2個(gè)字符開(kāi)始的連續(xù)3個(gè)字符,也就是返回“BCD”。
6、綜上,=MID(A2,FIND("#",A2)+1,99)的意思就是從A2單元格#字符后面的一個(gè)字符起,取長(zhǎng)度為99的字符串。其中的99是一個(gè)較大的數(shù)字,能涵蓋#后字符的最大長(zhǎng)度即可。