一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

Python爬蟲:爬取需要登錄的網(wǎng)站

 千鋒Python學堂 2020-11-05

不少伙伴學爬蟲,這就出一期Python爬蟲教程,文末總結(jié)的有視頻教程,自己按需學習哈!

爬蟲在采集網(wǎng)站的過程中,部分數(shù)據(jù)價值較高的網(wǎng)站,會限制訪客的訪問行為。這種時候建議通過登錄的方式,獲取目標網(wǎng)站的cookie,然后再使用cookie配合代理IP進行數(shù)據(jù)采集分析。

1 使用表單登陸

這種情況屬于post請求,即先向服務(wù)器發(fā)送表單數(shù)據(jù),服務(wù)器再將返回的cookie存入本地。

    #! -*- encoding:utf-8 -*-    import requests

    import random

    import requests.adapters

 

    # 要訪問的目標頁面    targetUrlList = [

        "https:///ip",

        "https:///headers",

        "https:///user-agent",

    ]

 

    # 代理服務(wù)器(產(chǎn)品官網(wǎng) www.16yun.cn)    proxyHost = "t.16yun.cn"    proxyPort = "31111" 

    # 代理隧道驗證信息    proxyUser = "username"    proxyPass = "password" 

    proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {

        "host": proxyHost,

        "port": proxyPort,

        "user": proxyUser,

        "pass": proxyPass,

    }

 

    # 設(shè)置 http和https訪問都是用HTTP代理    proxies = {

        "http": proxyMeta,

        "https": proxyMeta,

    }

 

    # 訪問三次網(wǎng)站,使用相同的Session(keep-alive),均能夠保持相同的外網(wǎng)IP    s = requests.session()

 

    # 設(shè)置cookie    cookie_dict = {"JSESSION":"123456789"}

    cookies = requests.utils.cookiejar_from_dict(cookie_dict, cookiejar=None, overwrite=True)

    s.cookies = cookies

 

    for i in range(3):

        for url in targetUrlList:

            r = s.get(url, proxies=proxies)

            print r.text

Python爬蟲:爬取需要登錄的網(wǎng)站(附爬蟲視頻教程)

2 使用cookie登陸

使用cookie登陸,服務(wù)器會認為你是一個已登陸的用戶,所以就會返回給你一個已登陸的內(nèi)容。因此,需要驗證碼的情況可以使用帶驗證碼登陸的cookie解決。

response_captcha = requests_session.get(url=url_login, cookies=cookies)response1 = requests.get(url_login) # 未登陸response2 = requests_session.get(url_login) # 已登陸,因為之前拿到了Response Cookie!response3 = requests_session.get(url_results) # 已登陸,因為之前拿到了Response Cookie!

若存在驗證碼,此時采用response = requests_session.post(url=url_login, data=data)是不行的,做法應(yīng)該如下:

response_captcha = requests_session.get(url=url_login, cookies=cookies)response1 = requests.get(url_login) # 未登陸response2 = requests_session.get(url_login) # 已登陸,因為之前拿到了Response Cookie!response3 = requests_session.get(url_results) # 已登陸,因為之前拿到了Response Cookie!

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    国产免费操美女逼视频| 国产精品一区二区三区欧美| 中国黄色色片色哟哟哟哟哟哟| 日本亚洲欧美男人的天堂| 色综合久久超碰色婷婷| 免费精品一区二区三区 | 久久人人爽人人爽大片av| 中文字幕日韩精品人一妻| 在线日韩中文字幕一区| 精品欧美国产一二三区| 91精品国自产拍老熟女露脸| 欧洲自拍偷拍一区二区| 国产麻豆成人精品区在线观看| 欧洲偷拍视频中文字幕| 99视频精品免费视频| 国内尹人香蕉综合在线| 亚洲国产丝袜一区二区三区四| 亚洲午夜av久久久精品| 日韩精品视频香蕉视频| 亚洲中文在线男人的天堂| 91偷拍视频久久精品| 久久本道综合色狠狠五月| 男女午夜福利院在线观看| 日韩熟妇人妻一区二区三区| 国产亚洲精品久久久优势| 人妻久久这里只有精品| 美女黄片大全在线观看| 手机在线观看亚洲中文字幕| 大香蕉大香蕉手机在线视频| 国产精品自拍杆香蕉视频| 蜜桃av人妻精品一区二区三区| 91亚洲熟女少妇在线观看| 中文字幕亚洲人妻在线视频| 亚洲欧美天堂精品在线| 中文字幕精品一区二区年下载| 欧美人妻少妇精品久久性色| 激情中文字幕在线观看| 精品国产一区二区欧美| 日韩成人高清免费在线| 狠狠干狠狠操亚洲综合| 欧美不雅视频午夜福利|