這選擇顯然是因人而異的。。至于怎么選,要看你是初學(xué)者,還是老手?。。對性能有要求,還是沒要求?
我們注重客戶提出的每個要求,我們充分考慮每一個細節(jié),我們積極的做好成都做網(wǎng)站、成都網(wǎng)站建設(shè)服務(wù),我們努力開拓更好的視野,通過不懈的努力,創(chuàng)新互聯(lián)贏得了業(yè)內(nèi)的良好聲譽,這一切,也不斷的激勵著我們更好的服務(wù)客戶。 主要業(yè)務(wù):網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)站設(shè)計,微信平臺小程序開發(fā),網(wǎng)站開發(fā),技術(shù)開發(fā)實力,DIV+CSS,PHP及ASP,ASP.Net,SQL數(shù)據(jù)庫的技術(shù)開發(fā)工程師。
如果是完全沒有基礎(chǔ),我建議哪個都不選,如果非要選一個,那就選PYTHON。。如果你是初學(xué)者,把網(wǎng)上的教程看個遍,再買上幾本書。。。你所學(xué)會的也僅僅是語法,而根本不會編程。。。因為這些教程,也僅僅是教你語法,而沒有教你編程。。你甚至把網(wǎng)上的教程看個精光,卻連個最基本的OA系統(tǒng)都做不出來。。。只能在一個黑乎乎的控制臺上,打印一堆破字符。。
-------網(wǎng)上的所有教程都會教你的:
怎么定義一個變量?怎么在控制臺打印變量?
怎么寫一個循環(huán)?怎么在控制臺打印一堆變量?
怎么寫一個函數(shù)?怎么在控制臺打印返回值?
怎么創(chuàng)建一個對象?怎么在控制臺打印對象屬性?
------高級一點的教程,會教你的:
怎么用PYTHON的模塊,寫一個爬蟲?
怎么用RUBY的ROR框架,獲取一個表單?
怎么用GO的beego,寫一個博客?
-------而這些的教程,從來不教你的:
面向?qū)ο笥惺裁从茫?委托是什么?事件是什么? 工廠模式,單例模式,觀察者模式,這些都是啥?套接字是啥?UDP是啥?TCP/IP是啥?二叉樹是什么玩意?狀態(tài)機又是什么玩意?啥叫逆變?啥叫協(xié)變?啥叫異步?啥叫反射?
---------------------------------------------------------------------------------------------
如果一套教程,要把這些都講明白。。??赡苄枰锨Ъ?。。。所以這些教程,都跳過了這些內(nèi)容。。但如果你不明白這些,就根本學(xué)不會編程。。。如果你打算學(xué)一門語言,而手上只有幾十集教程,外加三五本書。。。那你只能學(xué)會玩控制臺。。。
所以初學(xué)者選擇一門語言,首先要保證這門語言作為主要開發(fā)語言,常年被公司使用,這樣才能真正學(xué)會編程。然而這三門語言都不具備這樣的特點。它們通常都是被當成第二語言,做一些輔助開發(fā)的工作。其中Python只在極少數(shù)情況下,才被用來作為主要開發(fā)語言。至于Go與Ruby,我目前還沒聽說過它們有被當作主要開發(fā)語言的例子。我所推薦的是從C#和JAVA兩者之間,二選一。。。學(xué)精其中一門之后,再來考慮PYTHON或GO作為第二語言。。。不然無論你選哪個,都幾乎不可能靠一門語言找到工作。
選擇Python作為實現(xiàn)爬蟲的語言,其主要考慮因素在于:
(1) 抓取網(wǎng)頁本身的接口
相比其他動態(tài)腳本語言(如Perl、Shell),Python的urllib2包提供了較為完整的訪問網(wǎng)頁文檔的API;相比與其他靜態(tài)編程語言(如Java、C#、C++),Python抓取網(wǎng)頁文檔的接口更簡潔。
此外,抓取網(wǎng)頁有時候需要模擬瀏覽器的行為,很多網(wǎng)站對于生硬的爬蟲抓取都是封殺的。這時我們需要模擬User Agent的行為構(gòu)造合適的請求,譬如模擬用戶登錄、模擬Session/Cookie的存儲和設(shè)置。在Python里都有非常優(yōu)秀的第三方包幫你搞定,如Requests或Mechanize。
(2) 網(wǎng)頁抓取后的處理
抓取的網(wǎng)頁通常需要處理,比如過濾Html標簽,提取文本等。Python的Beautiful Soup提供了簡潔的文檔處理功能,能用極短的代碼完成大部分文檔的處理。
其實以上功能很多語言和工具都能做,但是用Python能夠干得最快、最干凈,正如這句“Life is short,you need Python”。
(3) 開發(fā)效率高
因為爬蟲的具體代碼根據(jù)網(wǎng)站不同而修改的,而Python這種靈活的腳本語言特別適合這種任務(wù)。
(4) 上手快
網(wǎng)絡(luò)上Python的教學(xué)資源很多,便于大家學(xué)習(xí),出現(xiàn)問題也很容易找到相關(guān)資料。另外,Python還有強大的成熟爬蟲框架的支持,比如Scrapy。
Go沒有泄露,并發(fā)原生支持,速度快。Python如果用代理IP,如果代理IP失效,會莫名其妙使用本地IP。且Go寫爬蟲可以和很多的數(shù)據(jù)庫如mongo,redis,hbase,mysql集成。
Go開發(fā)效率還高,半個小時就寫了個爬蟲,看,寫分布式爬蟲也是Go的優(yōu)勢,因為Go協(xié)程比Python和Java都容易寫。
最后,如果你用Go寫爬蟲,還可以直接用Go來寫網(wǎng)站,三句代碼就可以建立一個Web服務(wù)器和Python差不多,但包管理機制簡單,只需go get –u –v 包
Go語言由Google公司開發(fā),并于2009年開源,相比Java/Python/C等語言,Go尤其擅長并發(fā)編程,性能堪比C語言,開發(fā)效率肩比Python,被譽為“21世紀的C語言”。
Go語言在云計算、大數(shù)據(jù)、微服務(wù)、高并發(fā)領(lǐng)域應(yīng)用應(yīng)用非常廣泛。BAT大廠正在把Go作為新項目開發(fā)的首選語言。
Go語言能干什么?
1、服務(wù)端開發(fā):以前你使用C或者C++做的那些事情,用Go來做很合適,例如日志處理、文件系統(tǒng)、監(jiān)控系統(tǒng)等;
2、DevOps:運維生態(tài)中的Docker、K8s、prometheus、grafana、open-falcon等都是使用Go語言開發(fā);
3、網(wǎng)絡(luò)編程:大量優(yōu)秀的Web框架如Echo、Gin、Iris、beego等,而且Go內(nèi)置的 net/http包十分的優(yōu)秀;
4、Paas云平臺領(lǐng)域:Kubernetes和Docker Swarm等;
5、分布式存儲領(lǐng)域:etcd、Groupcache、TiDB、Cockroachdb、Influxdb等;
6、區(qū)塊鏈領(lǐng)域:區(qū)塊鏈里面有兩個明星項目以太坊和fabric都使用Go語言;
7、容器虛擬化:大名鼎鼎的Docker就是使用Go語言實現(xiàn)的;
8、爬蟲及大數(shù)據(jù):Go語言天生支持并發(fā),所以十分適合編寫分布式爬蟲及大數(shù)據(jù)處理。