真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

成都創(chuàng)新互聯(lián)網(wǎng)站制作重慶分公司

nodejs單頁面爬蟲(二)--解決編碼問題-創(chuàng)新互聯(lián)

上次寫的爬蟲雖然數(shù)據(jù)爬下來了,但是有亂碼問題。查了相關的書之后,找到解決辦法。重新寫了一下,好像比之前更簡潔了。

在繁昌等地區(qū),都構建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產品創(chuàng)新能力,以專注、極致的服務理念,為客戶提供成都網(wǎng)站制作、成都做網(wǎng)站 網(wǎng)站設計制作定制制作,公司網(wǎng)站建設,企業(yè)網(wǎng)站建設,品牌網(wǎng)站建設,營銷型網(wǎng)站建設,外貿營銷網(wǎng)站建設,繁昌網(wǎng)站建設費用合理。

    解決辦法是:引入iconv-lite模塊,用來轉換編碼的網(wǎng)頁內容。

這次跟著書上用了request模塊,而不是用原來的http模塊。

var request = require('request');
var cheerio = require('cheerio');
var iconv = require('iconv-lite');


//博客標題
request({
	url:'http://qmkkd.blog.51cto.com/',
	encoding:null
	},function(err,res,body){
	
	if(err) return console.log(err);

	body = iconv.decode(body,'gbk');

	//根據(jù)網(wǎng)頁內容創(chuàng)建DOM操作對象
	var $ = cheerio.load(body);

	//讀取博文類別列表
	var bloglist = [];
	$('.blogList .artHead h4 a').each(function(){
		var $me = $(this);
		var name = $me.text().trim();
		bloglist.push(name);
	});

	//輸出結果
	console.log(bloglist);
});

結果如下:

nodejs單頁面爬蟲(二)--解決編碼問題

另外有需要云服務器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內外云服務器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務器、裸金屬服務器、高防服務器、香港服務器、美國服務器、虛擬主機、免備案服務器”等云主機租用服務以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應用場景需求。


網(wǎng)站題目:nodejs單頁面爬蟲(二)--解決編碼問題-創(chuàng)新互聯(lián)
瀏覽路徑:http://weahome.cn/article/dhdepg.html

其他資訊

在線咨詢

微信咨詢

電話咨詢

028-86922220(工作日)

18980820575(7×24)

提交需求

返回頂部