真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

如何使用python爬取網(wǎng)站文章將圖片保存到本地并將HTML的src屬性更改到本地

這篇文章主要為大家展示了“如何使用python爬取網(wǎng)站文章將圖片保存到本地并將HTML的src屬性更改到本地”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“如何使用python爬取網(wǎng)站文章將圖片保存到本地并將HTML的src屬性更改到本地”這篇文章吧。

我們提供的服務(wù)有:網(wǎng)站制作、網(wǎng)站設(shè)計(jì)、微信公眾號(hào)開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、亳州ssl等。為上千多家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的亳州網(wǎng)站制作公司

        每次當(dāng)你爬取一篇文章時(shí),不管是從csdn或者其他網(wǎng)站,基本內(nèi)容都是保存在一個(gè)富文本編輯器中,將內(nèi)容提取出來還是一個(gè)html,保存之后圖片還在別人的圖片服務(wù)器上。我今天要說的就是將圖片保存之后并將它的src屬性替換成本地的地址。并且以次替換,按照原文章排版順序替換。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2018/11/5 15:06
# @Author  : jia.zhao
# @Desc    :
# @File    : img_test.py
# @Software: PyCharm

import urllib.request
import re


def getHtml(url):
   # 通過urllib去請求
   page = urllib.request.urlopen(url)
   # 讀取頁面內(nèi)容
   html = page.read()
   return html


def getImg(html):

   reg = r'src="(.+?\.jpg)" pic_ext'
   imgre = re.compile(reg)
   # Python3需要加的
   html = html.decode('utf-8')
   # 找到所有匹配項(xiàng)
   imglist = re.findall(imgre, html)

   x = 0
   # 循環(huán)
   for i in range(len(imglist)):
       # 保存圖片
       # urllib.request.urlretrieve(imgurl, 'img/%s.jpg' % x)
       # 根據(jù)每個(gè)圖片的src的內(nèi)容進(jìn)行替換
       html = re.sub(imglist[i], "G:/pachong/img/%s.jpg" % str(i), html)
       x += 1
   print(html)


html = getHtml("http://tieba.baidu.com/p/2460150866")

print(getImg(html))

這個(gè)demo知識(shí)貼吧的一個(gè)帖子里的圖片,大家可以依據(jù)自己的需求去更改此代碼。

以上是“如何使用python爬取網(wǎng)站文章將圖片保存到本地并將HTML的src屬性更改到本地”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!


文章名稱:如何使用python爬取網(wǎng)站文章將圖片保存到本地并將HTML的src屬性更改到本地
URL地址:http://weahome.cn/article/iggceh.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部