java后端 java和python在爬蟲方面的優(yōu)勢和劣勢是什么?
java和python在爬蟲方面的優(yōu)勢和劣勢是什么?python網(wǎng)絡(luò)功能強大,模擬登陸、解析javascript,短處是網(wǎng)頁解析python寫起程序來真的很便捷,著名的python爬蟲有scrapy等
java和python在爬蟲方面的優(yōu)勢和劣勢是什么?
python
網(wǎng)絡(luò)功能強大,模擬登陸、解析javascript,短處是網(wǎng)頁解析python寫起程序來真的很便捷,著名的python爬蟲有scrapy等
java
java有很多解析器,對網(wǎng)頁的解析支持很好,缺點是網(wǎng)絡(luò)部分java開源爬蟲非常多,著名的如 nutch 國內(nèi)有webmagicjava優(yōu)秀的解析器有htmlparser、jsoup對于一般性的需求無論java還是python都可以勝任。如需要模擬登陸、對抗防采集選擇python更方便些,如果需要處理復(fù)雜的網(wǎng)頁,解析網(wǎng)頁內(nèi)容生成結(jié)構(gòu)化數(shù)據(jù)或者對網(wǎng)頁內(nèi)容精細的解析則可以選擇java。
Java爬蟲問題,網(wǎng)頁核心文案是js動態(tài)獲取的,如何使用java獲?。?/h2>
即使js動態(tài)獲取,他也是有一個請求地址的,你可以通過chrome或fireFox的調(diào)試功能把他找到!按F12,然后在控制臺打開后刷新頁面!控制臺會顯示所有的網(wǎng)絡(luò)調(diào)用地址!你找一下就有了!然后你按他的格式get或post到這個地址就能拿到數(shù)據(jù)了?。ǖ卿浻脩舻脑捰浀脦蟘ookie)