下面介紹一下BeautifulSoup
和Parsel
的用法
現(xiàn)在我想要得到img
標(biāo)簽里的data-src
屬性
把上面這些獲取到的內(nèi)容用json_data
保存
第一種方式先用BeautifulSoup
soup = BeautifulSoup(json_data, 'html.parser')
clearfix = soup.select('ul[]')
for i in clearfix:
for ii in i.find_all('img'):
data_src = ii.get('data-src')
print(data_src)
第二種方式Parsel
# Parsel的用法, 使用Selector類結(jié)合re
selector = Selector(json_data)
clearfix = selector.css(
'ul[]').re('data-src="(.*?)"')
兩種方式都可以拿到html中的數(shù)據(jù)
據(jù)說第二種更快一些
如果是獲取標(biāo)簽內(nèi)的內(nèi)容
新款現(xiàn)貨Apple/蘋果 iPhone 14 Pro Max官方正品手機(jī)14Pro靈動(dòng)島
tbRmbNum = selector.css('h3[] ::text').get()
你是否還在尋找穩(wěn)定的海外服務(wù)器提供商?創(chuàng)新互聯(lián)www.cdcxhl.cn海外機(jī)房具備T級流量清洗系統(tǒng)配攻擊溯源,準(zhǔn)確流量調(diào)度確保服務(wù)器高可用性,企業(yè)級服務(wù)器適合批量采購,新人活動(dòng)首月15元起,快前往官網(wǎng)查看詳情吧