我們已經(jīng)獲取了cookies,本來按照劇情發(fā)展,我們下一步應(yīng)該是使用這個(gè)cookies模擬登錄了,但是偏偏我是一個(gè)比較欠的人,我想要弄清楚我們前面三種方法獲取到的cookies是不是一樣的,哦,不。其實(shí)應(yīng)該是四種方法,那么我們現(xiàn)在就來看看這四個(gè)cookies有什么區(qū)別吧 1. 從本地文件獲取的cookies 我們前面說過,我們找到的存放cookies的文件是一個(gè)叫 cookies.sqlite 的文件,這是一個(gè)數(shù)據(jù)庫文件,我使用的linux系統(tǒng)要查看這個(gè)文件還需要安裝別的程序,但是我想,既然這個(gè)是瀏覽器生成的文件,那么為了安全起見,它很可能會(huì)對(duì)數(shù)據(jù)進(jìn)行各種處理,等到調(diào)用的時(shí)候,再按照自己的規(guī)則來進(jìn)行解碼,如果是這樣的話,我覺得我們沒有必要去深入的研究這個(gè)文件,而且它相對(duì)于其他兩種方法來說也不是那么好用,所以對(duì)這種情況不予討論 2. 使用瀏覽器的調(diào)試工具 這里其實(shí)可以獲取到的有兩個(gè)cookies,這也就是我前面為什么說一共有4個(gè)cookies的原因 我使用的是火狐瀏覽器,在爬蟲的學(xué)習(xí)或者linux系統(tǒng)中,我覺得這款瀏覽器相對(duì)好用一些,其他的瀏覽器或許也有這樣的功能但是我不是很熟悉,所以這里就以火狐瀏覽器來說明,為了便于對(duì)比,我這里用百度首頁作為例子,好了,首先登錄百度首頁,然后按F12調(diào)出控制臺(tái),你會(huì)看到這樣的界面 我們發(fā)現(xiàn)這里的cookies有很多的名稱和內(nèi)容,我們暫且不考慮這里的cookies是否全部都要使用到,我們先來看看另一種獲取cookies的方法,就在Cookies稍左邊的網(wǎng)絡(luò)選項(xiàng)卡里面 我們可以看到這里有個(gè)響應(yīng)頭信息,也有請(qǐng)求頭信息,我們前面在討論瀏覽網(wǎng)頁的流程這個(gè)問題時(shí)提到,客戶端向服務(wù)器端發(fā)送請(qǐng)求,然后服務(wù)器端響應(yīng)請(qǐng)求并發(fā)回?cái)?shù)據(jù),我們在網(wǎng)絡(luò)選項(xiàng)卡這里看到有很多的 GET+xxxxxxxx之類的東西,可見,在我們打開一個(gè)網(wǎng)站的時(shí)候,所有的網(wǎng)頁并不是一下子全部顯示出來的,而是一部分一部分內(nèi)容的請(qǐng)求響應(yīng)然后發(fā)送接收數(shù)據(jù),然后再把整個(gè)網(wǎng)頁的內(nèi)容慢慢的顯示出來。在請(qǐng)求頭信息這里我們也看到有一個(gè)cookies,那么這跟前面的cookies是不是一樣的呢? 我對(duì)比了很多網(wǎng)站,發(fā)現(xiàn)有的是一樣的有的是不一樣的,如果感興趣的話可以自己去嘗試一下 3. 通過代碼獲取的cookies #!/uer/bin/env python |
|