python爬取京東商品信息 js注入和selenium的優(yōu)缺點(diǎn)?
js注入和selenium的優(yōu)缺點(diǎn)?靜態(tài)爬網(wǎng)方法太多,而且非常簡單。但動(dòng)態(tài)抓取不一樣,普通網(wǎng)站抓包也能找到接口文件,但大型網(wǎng)站不那么容易找到,所以在數(shù)據(jù)量小的情況下還是乖乖使用selenium來抓取。
js注入和selenium的優(yōu)缺點(diǎn)?
靜態(tài)爬網(wǎng)方法太多,而且非常簡單。
但動(dòng)態(tài)抓取不一樣,普通網(wǎng)站抓包也能找到接口文件,但大型網(wǎng)站不那么容易找到,所以在數(shù)據(jù)量小的情況下還是乖乖使用selenium來抓取。
硒的優(yōu)點(diǎn):好像沒有它就爬不上去,操作簡單。
硒的缺點(diǎn):耗時(shí),效率低,模仿手動(dòng)點(diǎn)擊。
python爬蟲怎么寫循環(huán)爬取多個(gè)頁面?
動(dòng)態(tài)加載的數(shù)據(jù)是在用戶通過鼠標(biāo)或鍵盤執(zhí)行某些操作后加載的。
所以我們使用selenium提供的webdriver工具調(diào)用本地瀏覽器,讓程序代替人類行為,滾動(dòng)頁面,單擊按鈕,提交表單等等。從而得到所需的數(shù)據(jù)。所以我認(rèn)為使用selenium方法抓取動(dòng)態(tài)頁面的中心思想是模擬人類行為。