java 如何用python爬取ajax網(wǎng)頁的內(nèi)容?
如何用python爬取ajax網(wǎng)頁的內(nèi)容?我直接看JS源代碼,分析,然后爬。例如,如果我查看一個(gè)頁面并使用Ajax請求一個(gè)JSON文件,我將首先爬升該頁面以獲取Ajax所需的參數(shù),然后直接請求JSON
如何用python爬取ajax網(wǎng)頁的內(nèi)容?
我直接看JS源代碼,分析,然后爬。例如,如果我查看一個(gè)頁面并使用Ajax請求一個(gè)JSON文件,我將首先爬升該頁面以獲取Ajax所需的參數(shù),然后直接請求JSON頁面,然后對其進(jìn)行解碼,然后處理數(shù)據(jù)并將其放入數(shù)據(jù)庫。如果直接在頁面上運(yùn)行所有JS(就像瀏覽器那樣),然后得到最終的htmldom樹,性能非常差,因此不建議使用這種方法。因?yàn)镻ython和JS的性能非常差,如果這樣做的話,會消耗大量的CPU資源,最終只能得到非常低的效率。