WebScraper是一款強大的網(wǎng)站內(nèi)容信息提取工具,WebScraper能夠快速提取與某個網(wǎng)頁相關的信息,支持從網(wǎng)頁提取的信息類型分別為URL,標題,描述,與其他類或ID關聯(lián)的內(nèi)容,標題,各種格式(純文本,HTML或Markdown)。
WebScraper 是一款Mac系統(tǒng)平臺的網(wǎng)站內(nèi)容采集工具,可以幫助我們采集網(wǎng)站內(nèi)容,指定好采集地址以及內(nèi)容采集規(guī)則,就可以將網(wǎng)頁內(nèi)容全部采集下來,并且導出為容易處理的CSV或是JSON文件。
使用Web Scraper,您可以構建將導航站點并提取數(shù)據(jù)的站點地圖。使用不同的類型選擇器,Web Scraper將導航站點并提取多種類型的數(shù)據(jù) - 文本,表格,圖像,鏈接等。
與其他僅從HTML Web提取數(shù)據(jù)的抓取工具不同,Scraper還可以提取使用Javascript動態(tài)加載或生成的數(shù)據(jù)。
Web Scrapper是一個獨立的chrome擴展。站點地圖構建,數(shù)據(jù)提取和導出都在瀏覽器中完成。在抓取您的網(wǎng)站后,您可以下載CSV格式的數(shù)據(jù)。對于高級用例,您可能希望嘗試將數(shù)據(jù)保存到CouchDB中。