如何快速提取網(wǎng)頁上所有的URL鏈接
當(dāng)工作需要批量化獲取網(wǎng)頁上所有的URL鏈接時(shí),如果一個(gè)個(gè)去打開復(fù)制,那不累死才怪,比如小說網(wǎng),那么有沒有一個(gè)快速批量化獲取網(wǎng)頁上所有的URL鏈接。答案是有的,這里我們以博客為例子。步驟一:保存網(wǎng)頁1.
當(dāng)工作需要批量化獲取網(wǎng)頁上所有的URL鏈接時(shí),如果一個(gè)個(gè)去打開復(fù)制,那不累死才怪,比如小說網(wǎng),那么有沒有一個(gè)快速批量化獲取網(wǎng)頁上所有的URL鏈接。答案是有的,這里我們以博客為例子。
步驟一:保存網(wǎng)頁
1. 打開你所要提取URL鏈接的網(wǎng)頁,點(diǎn)擊“網(wǎng)頁另存為”(Google瀏覽器)。這里選擇將其保存為網(wǎng)頁格式,例如“”。
步驟二:使用文本編輯器打開網(wǎng)頁
2. 使用文本編輯器(例如Notepad )打開保存的網(wǎng)頁文件“”。
步驟三:提取URL鏈接
3. 找到你所要提取的URL鏈接的共同部分,并根據(jù)共同部分進(jìn)行提取??梢允褂梦谋舅阉鞴δ埽–trl F),輸入共同部分并點(diǎn)擊“在當(dāng)前文件中查找”。編輯頁面下方會(huì)顯示所有符合規(guī)則的下載地址,以行為單位。選中并復(fù)制這些URL鏈接。
步驟四:整理數(shù)據(jù)
4. 將復(fù)制的URL鏈接粘貼到Excel表格中,并對其進(jìn)行整理和調(diào)整。選中URL鏈接所在的表格列,然后選擇“數(shù)據(jù)”菜單欄中的“分列”選項(xiàng)。
步驟五:設(shè)置分隔符
5. 彈出的對話框中,選擇第一個(gè)選項(xiàng)“分隔符號(hào)”,然后點(diǎn)擊下一步。
步驟六:提取URL鏈接
6. 根據(jù)內(nèi)容所含特征,設(shè)置能夠提取想要的URL鏈接的分隔符。例如,如果URL鏈接被包含在單引號(hào)(')中,則在“分隔符號(hào)”的最后一項(xiàng)“其他(o)”中輸入('),然后點(diǎn)擊完成。
步驟七:整理數(shù)據(jù)
7. 數(shù)據(jù)已經(jīng)被分割到不同的單元格中。根據(jù)需要整理數(shù)據(jù),刪除不需要的內(nèi)容,最后得到我們所需的“URL鏈接”。