真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

python爬蟲中selenium怎么登錄微博

這篇文章將為大家詳細講解有關python爬蟲中selenium怎么登錄微博,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

創(chuàng)新互聯(lián)從2013年開始,是專業(yè)互聯(lián)網(wǎng)技術服務公司,擁有項目網(wǎng)站設計、網(wǎng)站制作網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元鄧州做網(wǎng)站,已為上家服務,為鄧州各地企業(yè)和個人服務,聯(lián)系電話:13518219792

selenium是一個用于Web應用程序測試的工具,同時我們也可以通過 selenium 實現(xiàn)登錄功能。以微博為例

from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://weibo.com/")
username = driver.find_element_by_css_selector("input#loginname")
username.clear()
username.send_keys('your_username')
password = driver.find_element_by_css_selector('span.enter_psw')
password.clear()
password.send_keys('your_password')

在輸入賬號和密碼后,最大的問題來了,驗證碼都是圖片,一般我們要借助圖像識別才能識別驗證碼,但是由于驗證碼的種類非常多(英文、數(shù)字、中文或者它們的混合),而且驗證碼還可能被一定的旋轉、扭曲甚至互相粘連,以至于人眼也不能很好的辨認,因此大多數(shù)模型的通用性和準確率并不是很高。因此效率最高的方法就是在selenium打開瀏覽器之后手動登錄(過程中調用time.sleep()暫停程序)。因為對于爬蟲來說最重要的不是解決登錄問題,因此這么做可以節(jié)約大量的時間以及代碼量,雖然很蠢,但是很有用。

完成登錄后,用一下代碼即可獲取cookie,并把cookie_dict傳給pyspider全局參數(shù)中的cookies即可

cookies_dict = {}
cookies = driver.get_cookies()for cookie in cookies:
    cookies_dict[cookie['name']] = cookie['value']

關于python爬蟲中selenium怎么登錄微博就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。


網(wǎng)站欄目:python爬蟲中selenium怎么登錄微博
分享網(wǎng)址:http://weahome.cn/article/ipccec.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部