比如你定義了一個函數(shù)fun()
創(chuàng)新互聯(lián)建站為企業(yè)級客戶提高一站式互聯(lián)網(wǎng)+設(shè)計(jì)服務(wù),主要包括做網(wǎng)站、網(wǎng)站制作、app軟件開發(fā)、微信小程序開發(fā)、宣傳片制作、LOGO設(shè)計(jì)等,幫助客戶快速提升營銷能力和企業(yè)形象,創(chuàng)新互聯(lián)各部門都有經(jīng)驗(yàn)豐富的經(jīng)驗(yàn),可以確保每一個作品的質(zhì)量和創(chuàng)作周期,同時每年都有很多新員工加入,為我們帶來大量新的創(chuàng)意。
def?fun():
print("run24pro")
那么你在主程序入口可以像這樣調(diào)用
if?__name__=="__main__":
fun()
用selenium就可以了,它模擬打開瀏覽器,打開網(wǎng)頁。
通過頁面元素的特征,定位到要點(diǎn)擊的元素,click()方法就可以完成點(diǎn)擊
比如
self.driver.find_element_by_xpath('//ul[@class="uhomeTagList-ul"]/li[2]').click()
稍微說一下背景,當(dāng)時我想研究蛋白質(zhì)與小分子的復(fù)合物在空間三維結(jié)構(gòu)上的一些規(guī)律,首先得有數(shù)據(jù)啊,數(shù)據(jù)從哪里來?就是從一個涵蓋所有已經(jīng)解析三維結(jié)構(gòu)的蛋白質(zhì)-小分子復(fù)合物的數(shù)據(jù)庫里面下載。這時候,手動一個個去下顯然是不可取的,我們需要寫個腳本,能從特定的網(wǎng)站選擇性得批量下載需要的信息。python是不錯的選擇。
import urllib #python中用于獲取網(wǎng)站的模塊
import urllib2, cookielib
有些網(wǎng)站訪問時需要cookie的,python處理cookie代碼如下:
cj = cookielib.CookieJar ( )
opener = urllib2.build_opener( urllib2.HttpCookieProcessor(cj) )
urllib2.install_opener (opener)
通常我們需要在網(wǎng)站中搜索得到我們需要的信息,這里分為二種情況:
1. 第一種,直接改變網(wǎng)址就可以得到你想要搜索的頁面:
def GetWebPage( x ): #我們定義一個獲取頁面的函數(shù),x 是用于呈遞你在頁面中搜索的內(nèi)容的參數(shù)
url = ';' + ‘你想要搜索的參數(shù)’ # 結(jié)合自己頁面情況適當(dāng)修改
page = urllib2.urlopen(url)
pageContent = page.read( )
return pageContent #返回的是HTML格式的頁面信息
2.第二種,你需要用到post方法,將你搜索的內(nèi)容放在postdata里面,然后返回你需要的頁面
def GetWebPage( x ): #我們定義一個獲取頁面的函數(shù),x 是用于呈遞你在頁面中搜索的內(nèi)容的參數(shù)
url = '' #這個網(wǎng)址是你進(jìn)入搜索界面的網(wǎng)址
postData = urllib.urlencode( { 各種‘post’參數(shù)輸入 } ) #這里面的post參數(shù)輸入需要自己去查
req= urllib2.Request (url, postData)
pageContent = urllib2.urlopen (req). read( )
return pageContent #返回的是HTML格式的頁面信息
在獲取了我們需要的網(wǎng)頁信息之后,我們需要從獲得的網(wǎng)頁中進(jìn)一步獲取我們需要的信息,這里我推薦使用 BeautifulSoup 這個模塊, python自帶的沒有,可以自行百度谷歌下載安裝。 BeautifulSoup 翻譯就是‘美味的湯’,你需要做的是從一鍋湯里面找到你喜歡吃的東西。
import re # 正則表達(dá)式,用于匹配字符
from bs4 import BeautifulSoup # 導(dǎo)入BeautifulSoup 模塊
soup = BeautifulSoup(pageContent) #pageContent就是上面我們搜索得到的頁面
soup就是 HTML 中所有的標(biāo)簽(tag)BeautifulSoup處理格式化后的字符串,一個標(biāo)準(zhǔn)的tag形式為:
hwkobe24
通過一些過濾方法,我們可以從soup中獲取我們需要的信息:
(1) find_all ( name , attrs , recursive , text , **kwargs)
這里面,我們通過添加對標(biāo)簽的約束來獲取需要的標(biāo)簽列表, 比如 soup.find_all ('p') 就是尋找名字為‘p’的 標(biāo)簽,而soup.find_all (class = "tittle") 就是找到所有class屬性為"tittle" 的標(biāo)簽,以及soup.find_all ( class = re.compile('lass')) 表示 class屬性中包含‘lass’的所有標(biāo)簽,這里用到了正則表達(dá)式(可以自己學(xué)習(xí)一下,非常有用滴)
當(dāng)我們獲取了所有想要標(biāo)簽的列表之后,遍歷這個列表,再獲取標(biāo)簽中你需要的內(nèi)容,通常我們需要標(biāo)簽中的文字部分,也就是網(wǎng)頁中顯示出來的文字,代碼如下:
tagList = soup.find_all (class="tittle") #如果標(biāo)簽比較復(fù)雜,可以用多個過濾條件使過濾更加嚴(yán)格
for tag in tagList:
print tag.text
f.write ( str(tag.text) ) #將這些信息寫入本地文件中以后使用
(2)find( name , attrs , recursive , text , **kwargs )
它與 find_all( ) 方法唯一的區(qū)別是 find_all() 方法的返回結(jié)果是值包含一個元素的列表,而 find() 方法直接返回結(jié)果
(3)find_parents( ) find_parent( )
find_all() 和 find() 只搜索當(dāng)前節(jié)點(diǎn)的所有子節(jié)點(diǎn),孫子節(jié)點(diǎn)等. find_parents() 和 find_parent() 用來搜索當(dāng)前節(jié)點(diǎn)的父輩節(jié)點(diǎn),搜索方法與普通tag的搜索方法相同,搜索文檔搜索文檔包含的內(nèi)容
(4)find_next_siblings() find_next_sibling()
這2個方法通過 .next_siblings 屬性對當(dāng) tag 的所有后面解析的兄弟 tag 節(jié)點(diǎn)進(jìn)代, find_next_siblings() 方法返回所有符合條件的后面的兄弟節(jié)點(diǎn),find_next_sibling() 只返回符合條件的后面的第一個tag節(jié)點(diǎn)
(5)find_previous_siblings() find_previous_sibling()
這2個方法通過 .previous_siblings 屬性對當(dāng)前 tag 的前面解析的兄弟 tag 節(jié)點(diǎn)進(jìn)行迭代, find_previous_siblings()方法返回所有符合條件的前面的兄弟節(jié)點(diǎn), find_previous_sibling() 方法返回第一個符合條件的前面的兄弟節(jié)點(diǎn)
(6)find_all_next() find_next()
這2個方法通過 .next_elements 屬性對當(dāng)前 tag 的之后的 tag 和字符串進(jìn)行迭代, find_all_next() 方法返回所有符合條件的節(jié)點(diǎn), find_next() 方法返回第一個符合條件的節(jié)點(diǎn)
(7)find_all_previous() 和 find_previous()
這2個方法通過 .previous_elements 屬性對當(dāng)前節(jié)點(diǎn)前面的 tag 和字符串進(jìn)行迭代, find_all_previous() 方法返回所有符合條件的節(jié)點(diǎn), find_previous()方法返回第一個符合條件的節(jié)點(diǎn)
具體的使用方法還有很多,用到這里你應(yīng)該可以解決大部分問題了,如果要更深入了解可以參考官方的使用說明哈!
content是個Response對象的屬性 (有點(diǎn)類似變量), 而decode是bytes的一個方法
方法在使用(調(diào)用/執(zhí)行)的時候是需要加括號的, 如果不加括號就會返回這個方法本身(類似函數(shù)指針), 而變量/成員字段/屬性是不能加括號的(除非它實(shí)現(xiàn)了__call__()方法)
用Beautiful Soup這類解析模塊:
Beautiful Soup 是用Python寫的一個HTML/XML的解析器,它可以很好的處理不規(guī)范標(biāo)記并生成剖析樹(parse tree);
它提供簡單又常用的導(dǎo)航(navigating),搜索以及修改剖析樹的操作;
用urllib或者urllib2(推薦)將頁面的html代碼下載后,用beautifulsoup解析該html;
然后用beautifulsoup的查找模塊或者正則匹配將你想獲得的內(nèi)容找出來,就可以進(jìn)行相關(guān)處理了,例如:
from?BeautifulSoup?import?BeautifulSoup
html?=?'htmlheadtitletest/title/headbodyptest?body/p/body/html'
soup?=?BeautifulSoup(html)
soup.contents[0].name
#?u'html'
soup.comtents[0].contents[0].name
#?u'head'
head?=?soup.comtents[0].contents[0]
head.parent.name
#?u'html'
head.next
#?u'titletest/title
在python中,除了調(diào)用下載的擴(kuò)展庫之外,還可以自定義函數(shù),方便自己。把基礎(chǔ)模塊放在固定文件夾(或相對固定文件夾),使用sys.append(r’自定義的模塊路徑’)實(shí)例如下:
1、在E:pycharm新建hello.py實(shí)現(xiàn)基礎(chǔ)功能函數(shù)(定義一個hello()函數(shù))
2、 調(diào)用自定義的函數(shù)
3、 運(yùn)行結(jié)果為:
更多Python相關(guān)技術(shù)文章,請?jiān)L問Python教程欄目進(jìn)行學(xué)習(xí)!以上就是小編分享的關(guān)于python中如何調(diào)用自己寫的函數(shù)的詳細(xì)內(nèi)容希望對大家有所幫助,更多有關(guān)python教程請關(guān)注環(huán)球青藤其它相關(guān)文章!