一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

使用python+phantomjs抓取動態(tài)頁面

 看見就非常 2015-09-18

前一段時間公司需要爬取部分web頁面的數(shù)據(jù)使用。但是頁面中的主要數(shù)據(jù)是ajax load出來的,傳統(tǒng)的抓取方法是拿不到數(shù)據(jù)的。后來在網(wǎng)上發(fā)現(xiàn)了phantomjs,在無界面的情況下運行js,渲染dom。用這個工具抓取ajax load出來的數(shù)據(jù)再方便不過啦。

系統(tǒng)環(huán)境:CentOS release 6.5 (Final)

phantomjs版本:1.9.8

  • phantomjs抓取加載完整的dom結(jié)構(gòu)。說到phantomjs怎么把數(shù)據(jù)傳遞給處理程序,我看到網(wǎng)上很多人是寫一個本地文件,然后具體的處理程序再讀取那個文件進(jìn)行處理。感覺這種方式太麻煩了,干脆將數(shù)據(jù)打印到到標(biāo)準(zhǔn)輸出中,然后處理程序從標(biāo)準(zhǔn)輸出中讀取數(shù)據(jù)。

  • 用python獲取數(shù)據(jù)。然后就開始處理了。具體的處理邏輯就不展示了。

分享到

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    日韩少妇人妻中文字幕| 日本高清中文精品在线不卡| 亚洲高清中文字幕一区二三区| 亚洲精品有码中文字幕在线观看 | 国产日韩久久精品一区| 日本福利写真在线观看| 日韩一区二区三区四区乱码视频| 国产精品内射视频免费| 在线观看中文字幕91| 日韩欧美国产精品中文字幕| 国产又黄又猛又粗又爽的片| 视频一区二区黄色线观看| 少妇肥臀一区二区三区| 免费在线播放一区二区| 激情五月综五月综合网| 麻豆视传媒短视频在线看| 大香蕉久草网一区二区三区| 亚洲中文字幕熟女丝袜久久| 中文字幕无线码一区欧美| 国产毛片av一区二区三区小说| 男女激情视频在线免费观看| 欧美熟妇喷浆一区二区| 人妻乱近亲奸中文字幕| 欧美乱妇日本乱码特黄大片 | 九九热这里有精品20| 精品视频一区二区不卡| 国产毛片不卡视频在线| 亚洲精品一二三区不卡| 国产主播精品福利午夜二区| 日本加勒比在线观看一区| 91精品国产综合久久精品| 国产在线成人免费高清观看av| 国产一区二区在线免费| 一本久道久久综合中文字幕| 国产又粗又猛又大爽又黄同志| 国产成人精品国产成人亚洲| 色婷婷日本视频在线观看| 日韩成人高清免费在线| 九九热最新视频免费观看| 国产内射一级一片内射高清视频| 国产又大又猛又粗又长又爽|