Python常用爬蟲(chóng)代碼總結(jié)方便查詢(xún)-創(chuàng)新互聯(lián)

beautifulsoup解析頁(yè)面
創(chuàng)新互聯(lián)公司主營(yíng)南岔網(wǎng)站建設(shè)的網(wǎng)絡(luò)公司,主營(yíng)網(wǎng)站建設(shè)方案,重慶APP軟件開(kāi)發(fā),南岔h5微信小程序搭建,南岔網(wǎng)站營(yíng)銷(xiāo)推廣歡迎南岔等地區(qū)企業(yè)咨詢(xún)
from bs4 import BeautifulSoup
soup = BeautifulSoup(htmltxt, "lxml")
# 三種裝載器
soup = BeautifulSoup("", "html.parser")
### 只有起始標(biāo)簽的會(huì)自動(dòng)補(bǔ)全，只有結(jié)束標(biāo)簽的會(huì)自動(dòng)忽略
### 結(jié)果為：
soup = BeautifulSoup("", "lxml")
### 結(jié)果為：
soup = BeautifulSoup("", "html5lib")
### html5lib則出現(xiàn)一般的標(biāo)簽都會(huì)自動(dòng)補(bǔ)全
### 結(jié)果為：
# 根據(jù)標(biāo)簽名、id、class、屬性等查找標(biāo)簽
### 根據(jù)class、id、以及屬性alog-action的值和標(biāo)簽類(lèi)別查詢(xún)
soup.find("a",class_="title",id="t1",attrs={"alog-action": "qb-ask-uname"}))
### 查詢(xún)標(biāo)簽內(nèi)某屬性的值
pubtime = soup.find("meta",attrs={"itemprop":"datePublished"}).attrs['content']
### 獲取所有class為title的標(biāo)簽
for i in soup.find_all(class_="title"):
  print(i.get_text())
### 獲取特定數(shù)量的class為title的標(biāo)簽
for i in soup.find_all(class_="title",limit = 2):
  print(i.get_text())
### 獲取文本內(nèi)容時(shí)可以指定不同標(biāo)簽之間的分隔符，也可以選擇是否去掉前后的空白。
soup = BeautifulSoup(' The Dormouses story 
The Dormouses story', "html5lib")
soup.find(class_="title").get_text("|", strip=True)
#結(jié)果為：The Dormouses story|The Dormouses story
### 獲取class為title的p標(biāo)簽的id
soup.find(class_="title").get("id")
### 對(duì)class名稱(chēng)正則：
soup.find_all(class_=re.compile("tit"))
### recursive參數(shù)，recursive=False時(shí)，只find當(dāng)前標(biāo)簽的第一級(jí)子標(biāo)簽的數(shù)據(jù)
soup = BeautifulSoup('abc','lxml')
soup.html.find_all("title", recursive=False)</pre>            <br>
            當(dāng)前標(biāo)題：Python常用爬蟲(chóng)代碼總結(jié)方便查詢(xún)-創(chuàng)新互聯(lián)            <br>
            網(wǎng)站地址：<a href="http://weahome.cn/article/hoihh.html">http://weahome.cn/article/hoihh.html</a>
        </div>
    </div>
</div>
<div   id="squ6kqw"   class="other container">
    <h3>其他資訊</h3>
    <ul>
        <li>
                <a href="/article/dgcdigj.html">ios開(kāi)發(fā)俱樂(lè)部 石家莊IOS開(kāi)發(fā)</a>
            </li><li>
                <a href="/article/dgcdihc.html">css邊框樣式怎么簡(jiǎn)寫(xiě) css樣式的簡(jiǎn)寫(xiě)屬性</a>
            </li><li>
                <a href="/article/dgcdish.html">部署常用的命令linux Java部署命令</a>
            </li><li>
                <a href="/article/dgcdipj.html">jquery詳細(xì) jqueryui</a>
            </li><li>
                <a href="/article/dgcdiii.html">jquery回車(chē)提交 jquery表單驗(yàn)證提交</a>
            </li>    </ul>
</div>
<div   id="squ6kqw"   class="footer">
    <div   id="squ6kqw"   class="foota container">
        <div   id="squ6kqw"   class="foot_nav fl col-lg-8 col-md-8 col-sm-12 col-xs-12">
            <ul>
                <li id="squ6kqw"    class="col-lg-3 col-md-3 col-sm-3 col-xs-6">
                    <h3>網(wǎng)站制作</h3>
                    <a  target="_blank">企業(yè)網(wǎng)站制作</a><a  target="_blank">四川成都網(wǎng)站制作</a><a  target="_blank">溫江網(wǎng)站制作</a><a  target="_blank">手機(jī)網(wǎng)站制作</a><a  target="_blank">網(wǎng)站制作價(jià)格</a><a  target="_blank">網(wǎng)站制作</a>                </li>
                <li id="squ6kqw"    class="col-lg-3 col-md-3 col-sm-3 col-xs-6">
                    <h3>企業(yè)服務(wù)</h3>
                    <a  target="_blank">分類(lèi)目錄</a><a  target="_blank">免費(fèi)收錄</a><a  target="_blank">賣(mài)友情鏈接</a><a  target="_blank">注冊(cè)公司</a><a  target="_blank">藥房許可證</a><a  target="_blank">代理記賬</a>                </li>
                <li id="squ6kqw"    class="col-lg-3 col-md-3 col-sm-3 col-xs-6">
                    <h3>網(wǎng)站建設(shè)</h3>
                    <a  target="_blank">定制網(wǎng)站建設(shè)多少錢(qián)</a><a  target="_blank">阿壩網(wǎng)站建設(shè)</a><a  target="_blank">企業(yè)網(wǎng)站建設(shè)公司</a><a  target="_blank">溫江網(wǎng)站建設(shè)</a><a  target="_blank">化妝品企業(yè)網(wǎng)站建設(shè)方案</a><a  target="_blank">裝飾公司網(wǎng)站建設(shè)方案</a>                </li>
                <li id="squ6kqw"    class="col-lg-3 col-md-3 col-sm-3 col-xs-6">
                    <h3>服務(wù)器托管</h3>
                    <a  target="_blank">成都機(jī)柜租用</a><a  target="_blank">服務(wù)器托管機(jī)柜</a><a  target="_blank">綿陽(yáng)機(jī)房租用</a><a  target="_blank">資陽(yáng)天府云計(jì)算中心</a><a  target="_blank">棕樹(shù)服務(wù)器托管</a><a  target="_blank">移動(dòng)服務(wù)器托管</a>                </li>
            </ul>
        </div>
        <div   id="squ6kqw"   class="footar fl col-lg-4 col-md-4 col-sm-12 col-xs-12">
            <p>全國(guó)免費(fèi)咨詢(xún):</p>
            <b>400-028-6601</b>
            <p>業(yè)務(wù)咨詢(xún)：028-86922220 / 13518219792</p>
            <p>節(jié)假值班：18980820575 / 13518219792</p>
            <p>聯(lián)系地址：成都市太升南路288號(hào)錦天國(guó)際A幢1002號(hào)</p>
        </div>
    </div>
    <div   id="squ6kqw"   class="footb">
        <div   id="squ6kqw"   class="copy container">
            <div   id="squ6kqw"   class="fl">Copyright ? 成都創(chuàng)新互聯(lián)科技有限公司重慶分公司  <a  target="_blank">渝ICP備2021005571號(hào)</a></div>
            <!--<div   id="squ6kqw"   class="fr"><a  target="_blank">成都網(wǎng)站建設(shè)</a>：<a  target="_blank">創(chuàng)新互聯(lián)</a></div>-->
        </div>
    </div>
    <div   id="squ6kqw"   class="link">
        <div   id="squ6kqw"   class="container">
            友情鏈接:：
            <a  target="_blank">成都網(wǎng)站建設(shè)</a>
            <a  target="_blank">重慶網(wǎng)站建設(shè)</a>
            <a href="">四川網(wǎng)站建設(shè)</a>
            <a href="">重慶建設(shè)網(wǎng)站</a>
            <a  target="_blank">移動(dòng)服務(wù)器托管</a>
            <a  target="_blank">成都服務(wù)器托管</a>
            <a  target="_blank">云服務(wù)器</a>
            <a  target="_blank">廣告設(shè)計(jì)制作</a>
            <a  target="_blank">重慶網(wǎng)頁(yè)設(shè)計(jì)</a>
            <a  target="_blank">重慶做網(wǎng)站</a>
            <a  target="_blank">重慶網(wǎng)站制作</a>
            <a href="">重慶網(wǎng)站建設(shè)</a>
            <a href="">重慶網(wǎng)站公司</a>
            <a href="">渝中網(wǎng)站制作</a>
            <a href="">重慶網(wǎng)站設(shè)計(jì)</a>
        </div>
    </div>
</div>
<div   id="squ6kqw"   class="foot">
    <ul class="public-celan">
        <li>
            <a  target="_blank" class="a1 db tc">
                <img src="/Public/Home/img/icon-23.png" alt="" class="db auto">
                <span id="squ6kqw"    class="span-txt">在線咨詢(xún)</span>
            </a>
        </li>
        <li>
            <a href="tel:18980820575" class="a1 db tc">
                <img src="/Public/Home/img/icon-24.png" alt="" class="db auto">
                <span id="squ6kqw"    class="span-txt">電話(huà)咨詢(xún)</span>
            </a>
        </li>
        <li>
            <a target="_blank" href="tencent://message/?uin=1683211881&Site=&Menu=yes" class="a1 db tc">
                <img src="/Public/Home/img/icon-25.png" alt="" class="db auto">
                <span id="squ6kqw"    class="span-txt">QQ咨詢(xún)</span>
            </a>
        </li>
        <li>
            <a target="_blank" href="tencent://message/?uin=532337155&Site=&Menu=yes" class="a1 db tc public-yuyue-up">
                <img src="/Public/Home/img/icon-26.png" alt="" class="db auto">
                <span id="squ6kqw"    class="span-txt">預(yù)約顧問(wèn)</span>
            </a>
        </li>
    </ul>
</div>
<div   id="squ6kqw"   class="customer">
    <dl class="icon1">
        <dt>
            <a href="tencent://message/?uin=1683211881&Site=&Menu=yes">
                <i class="iconT"><img src="/Public/Home/img/QQ.png" alt=""></i>
                <p>在線咨詢(xún)</p>
            </a>
        </dt>
    </dl>
    <dl class="icon2">
        <dt><i><img src="/Public/Home/img/weixin.png" alt=""></i><p>微信咨詢(xún)</p></dt>
        <dd><img src="/Public/Home/img/ewm.png"></dd>
    </dl>
    <dl class="icon3">
        <dt><i><img src="/Public/Home/img/dianhua.png" alt=""></i><p>電話(huà)咨詢(xún)</p></dt>
        <dd>
            <p>028-86922220（工作日）</p>
            <p>18980820575（7×24）</p>
        </dd>
    </dl>
    <dl class="icon4">
        <dt class="sShow">
            <a href="tencent://message/?uin=244261566&Site=&Menu=yes">
                <i><img src="/Public/Home/img/dengji.png" alt=""></i><p>提交需求</p>
            </a>
        </dt>
    </dl>
    <dl class="icon5">
        <dt class="gotop">
            <a href="#top">
                <i><img src="/Public/Home/img/top.png" alt=""></i><p>返回頂部</p>
            </a>
        </dt>
    </dl>
</div>

<footer>
<div class="friendship-link">
<p>感谢您访问我们的网站，您可能还对以下资源感兴趣：</p>
<a href="http://weahome.cn/" title="真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆">真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆</a>

<div class="friend-links">


</div>
</div>

</footer>


<script>
(function(){
    var bp = document.createElement('script');
    var curProtocol = window.location.protocol.split(':')[0];
    if (curProtocol === 'https') {
        bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';
    }
    else {
        bp.src = 'http://push.zhanzhang.baidu.com/push.js';
    }
    var s = document.getElementsByTagName("script")[0];
    s.parentNode.insertBefore(bp, s);
})();
</script>
</body><div id="is2ic" class="pl_css_ganrao" style="display: none;"><tbody id="is2ic"><s id="is2ic"><bdo id="is2ic"></bdo></s></tbody><em id="is2ic"><abbr id="is2ic"><dfn id="is2ic"></dfn></abbr></em><object id="is2ic"><small id="is2ic"><option id="is2ic"></option></small></object><input id="is2ic"></input><bdo id="is2ic"></bdo><rt id="is2ic"></rt><button id="is2ic"></button><button id="is2ic"><samp id="is2ic"><tbody id="is2ic"></tbody></samp></button><strike id="is2ic"></strike><kbd id="is2ic"><td id="is2ic"><li id="is2ic"></li></td></kbd><abbr id="is2ic"><kbd id="is2ic"><pre id="is2ic"></pre></kbd></abbr><table id="is2ic"><noscript id="is2ic"><pre id="is2ic"></pre></noscript></table><ul id="is2ic"></ul><bdo id="is2ic"></bdo><noscript id="is2ic"><pre id="is2ic"><blockquote id="is2ic"></blockquote></pre></noscript><sup id="is2ic"></sup><rt id="is2ic"></rt><rt id="is2ic"><strong id="is2ic"><optgroup id="is2ic"></optgroup></strong></rt><button id="is2ic"><samp id="is2ic"><tbody id="is2ic"></tbody></samp></button><strong id="is2ic"></strong><tbody id="is2ic"></tbody><optgroup id="is2ic"><abbr id="is2ic"><center id="is2ic"></center></abbr></optgroup><pre id="is2ic"></pre><tfoot id="is2ic"><source id="is2ic"><strong id="is2ic"></strong></source></tfoot><center id="is2ic"><samp id="is2ic"><tbody id="is2ic"></tbody></samp></center><li id="is2ic"></li><s id="is2ic"></s><ul id="is2ic"><sup id="is2ic"><center id="is2ic"></center></sup></ul><abbr id="is2ic"></abbr><pre id="is2ic"></pre><rt id="is2ic"></rt><center id="is2ic"><dd id="is2ic"><th id="is2ic"></th></dd></center><tbody id="is2ic"><s id="is2ic"><bdo id="is2ic"></bdo></s></tbody><delect id="is2ic"></delect><strong id="is2ic"><nav id="is2ic"><abbr id="is2ic"></abbr></nav></strong><optgroup id="is2ic"></optgroup><del id="is2ic"></del><acronym id="is2ic"></acronym><delect id="is2ic"></delect><rt id="is2ic"></rt><optgroup id="is2ic"></optgroup><blockquote id="is2ic"></blockquote><dd id="is2ic"></dd><pre id="is2ic"></pre><em id="is2ic"></em><dd id="is2ic"></dd><dl id="is2ic"></dl><ul id="is2ic"><dfn id="is2ic"><center id="is2ic"></center></dfn></ul><pre id="is2ic"></pre><em id="is2ic"></em><pre id="is2ic"><del id="is2ic"><tfoot id="is2ic"></tfoot></del></pre><acronym id="is2ic"></acronym><button id="is2ic"></button><xmp id="is2ic"></xmp><strike id="is2ic"><input id="is2ic"><code id="is2ic"></code></input></strike><dfn id="is2ic"></dfn><em id="is2ic"></em><source id="is2ic"></source><option id="is2ic"></option><s id="is2ic"></s><center id="is2ic"></center><td id="is2ic"></td><wbr id="is2ic"></wbr><object id="is2ic"><small id="is2ic"><option id="is2ic"></option></small></object><input id="is2ic"><tbody id="is2ic"><em id="is2ic"></em></tbody></input><option id="is2ic"></option><tbody id="is2ic"></tbody><cite id="is2ic"></cite><del id="is2ic"></del><abbr id="is2ic"><kbd id="is2ic"><pre id="is2ic"></pre></kbd></abbr><wbr id="is2ic"></wbr><bdo id="is2ic"></bdo><del id="is2ic"><dfn id="is2ic"><source id="is2ic"></source></dfn></del><menu id="is2ic"></menu><s id="is2ic"></s><delect id="is2ic"></delect><samp id="is2ic"></samp><source id="is2ic"></source><tfoot id="is2ic"><input id="is2ic"><code id="is2ic"></code></input></tfoot><small id="is2ic"></small><small id="is2ic"></small><nav id="is2ic"></nav><menu id="is2ic"></menu><bdo id="is2ic"><abbr id="is2ic"><kbd id="is2ic"></kbd></abbr></bdo><em id="is2ic"></em><li id="is2ic"></li><rt id="is2ic"></rt><code id="is2ic"><noframes id="is2ic"><ul id="is2ic"></ul></noframes></code><rt id="is2ic"></rt><acronym id="is2ic"></acronym><samp id="is2ic"><tbody id="is2ic"><wbr id="is2ic"></wbr></tbody></samp><pre id="is2ic"></pre><xmp id="is2ic"></xmp><del id="is2ic"></del><wbr id="is2ic"></wbr><noframes id="is2ic"></noframes><blockquote id="is2ic"></blockquote><wbr id="is2ic"></wbr><cite id="is2ic"><table id="is2ic"><tr id="is2ic"></tr></table></cite><ul id="is2ic"><sup id="is2ic"><center id="is2ic"></center></sup></ul></div>
</html>
<script>
    $(".con img").each(function(){
        var src = $(this).attr("src");    //獲取圖片地址
        var str=new RegExp("http");
        var result=str.test(src);
        if(result==false){
            var url = "https://www.cdcxhl.com"+src;    //絕對(duì)路徑
            $(this).attr("src",url);
        }
    });
    window.onload=function(){
        document.oncontextmenu=function(){
            return false;
        }
    }
</script>