前一段時間公司需要爬取部分web頁面的數(shù)據(jù)使用。但是頁面中的主要數(shù)據(jù)是ajax load出來的,傳統(tǒng)的抓取方法是拿不到數(shù)據(jù)的。后來在網(wǎng)上發(fā)現(xiàn)了phantomjs,在無界面的情況下運行js,渲染dom。用這個工具抓取ajax load出來的數(shù)據(jù)再方便不過啦。 系統(tǒng)環(huán)境:CentOS release 6.5 (Final) phantomjs版本:1.9.8
分享到
|
|