在本文中,我們將簡要回顧 HTTP 協(xié)議的發(fā)展歷史。對 HTTP 不同語義的完整討論超出了本文的范圍,但理解 HTTP 的關鍵設計變更以及每個變更背后的動機將為我們討論 HTTP 性能提供必要的背景
-- Ilya Grigorik
譯注:本文來源于 2013 年出版的《 High Performance Browser Networking 》的第九章,因此有些信息略有過時。事實上,現(xiàn)在 HTTP/2 已經(jīng)有相當?shù)牟皇?,而新?HTTP/3 也在設計和標準制定當中。
介紹
超文本傳輸協(xié)議(Hypertext Transfer Protocol)(HTTP)是互聯(lián)網(wǎng)上最普遍和廣泛采用的應用程序協(xié)議之一。它是客戶端和服務器之間的通用語言,支持現(xiàn)代 Web。從最初作為單個的關鍵字和文檔路徑開始,它已成為不僅僅是瀏覽器的首選協(xié)議,而且?guī)缀跏撬羞B接互聯(lián)網(wǎng)硬件和軟件應用程序的首選協(xié)議。
在本文中,我們將簡要回顧 HTTP 協(xié)議的發(fā)展歷史。對 HTTP 不同語義的完整討論超出了本文的范圍,但理解 HTTP 的關鍵設計變更以及每個變更背后的動機將為我們討論 HTTP 性能提供必要的背景,特別是在 HTTP/2 中即將進行的許多改進。
HTTP 0.9: 單行協(xié)議
蒂姆·伯納斯·李(Tim Berners-Lee) 最初的 HTTP 提案在設計時考慮到了簡單性,以幫助他采用他的另一個新想法: 萬維網(wǎng)(World Wide Web)。這個策略看起來奏效了:注意,他是一個有抱負的協(xié)議設計者。
1991 年,伯納斯·李概述了這個新協(xié)議的動機,并列出了幾個高級設計目標:文件傳輸功能、請求超文檔存檔索引搜索的能力,格式協(xié)商以及將客戶端引用到另一個服務器的能力。為了證明該理論的實際應用,構建了一個簡單原型,它實現(xiàn)了所提議功能的一小部分。
客戶端請求是一個 ASCII 字符串。
客戶端請求以回車符(CRLF)終止。
服務器響應是 ASCII 字符流。
服務器響應是一種超文本標記語言(HTML)。
文檔傳輸完成后連接終止。
然而,即使這聽起來也比實際復雜得多。這些規(guī)則支持的是一種非常簡單的,對 Telnet 友好的協(xié)議,一些 Web 服務器至今仍然支持這種協(xié)議:
$> telnet google.com 80
Connected to 74.125.xxx.xxx
GET /about/
(hypertext response)
(connection closed)
請求包含這樣一行:GET 方法和請求文檔的路徑。響應是一個超文本文檔,沒有標題或任何其他元數(shù)據(jù),只有 HTML。真的是再簡單不過了。此外,由于之前的交互是預期協(xié)議的子集,因此它獲得了一個非官方的 HTTP 0.9 標簽。其余的,就像他們所說的,都是歷史。
從 1991 年這些不起眼的開始,HTTP 就有了自己的生命,并在接下來幾年里迅速發(fā)展。讓我們快速回顧一下 HTTP 0.9 的特性:
采用客戶端-服務器架構,是一種請求-響應協(xié)議。
采用 ASCII 協(xié)議,運行在 TCP/IP 鏈路上。
旨在傳輸超文本文檔(HTML)。
每次請求后,服務器和客戶端之間的連接都將關閉。
流行的 Web 服務器,如 Apache 和 Nginx,仍然支持 HTTP 0.9 協(xié)議,部分原因是因為它沒有太多功能!如果你感興趣,打開 Telnet 會話并嘗試通過 HTTP 0.9 訪問 google.com 或你最喜歡的網(wǎng)站,并檢查早期協(xié)議的行為和限制。
HTTP/1.0: 快速增長和 Informational RFC
1991 年至 1995 年期間,HTML 規(guī)范和一種稱為 “web 瀏覽器”的新型軟件快速發(fā)展,面向消費者的公共互聯(lián)網(wǎng)基礎設施也開始出現(xiàn)并快速增長。
完美風暴:1990 年代初的互聯(lián)網(wǎng)熱潮
基于蒂姆·伯納斯·李最初的瀏覽器原型,美國國家超級計算機應用中心(NCSA)的一個團隊決定實現(xiàn)他們自己的版本。就這樣,第一個流行的瀏覽器誕生了:NCSA Mosaic。1994 年 10 月,NCSA 團隊的一名程序員 Marc Andreessen 與 Jim Clark 合作創(chuàng)建了 Mosaic Communications,該公司后來改名為 Netscape(網(wǎng)景),并于 1994 年 12 月發(fā)布了 Netscape Navigator 1.0。從這一點來說,已經(jīng)很清楚了,萬維網(wǎng)已經(jīng)不僅僅是學術上的好奇心了。
實際上,同年在瑞士日內瓦組織了第一次萬維網(wǎng)會議,這導致 萬維網(wǎng)聯(lián)盟(World Wide Web Consortium)(W3C)的成立,以幫助指導 HTML 的發(fā)展。同樣,在 IETF 內部建立了一個并行的 HTTP 工作組(HTTP Working Group)(HTTP-WG),專注于改進 HTTP 協(xié)議。后來這兩個團體一直對 Web 的發(fā)展起著重要作用。
最后,完美風暴來臨,CompuServe,AOL 和 Prodigy 在 1994-1995 年的同一時間開始向公眾提供撥號上網(wǎng)服務。憑借這股迅速的浪潮,Netscape 在 1995 年 8 月 9 日憑借其成功的 IPO 創(chuàng)造了歷史。這預示著互聯(lián)網(wǎng)熱潮已經(jīng)到來,人人都想分一杯羹!
不斷增長的新 Web 所需功能及其在公共網(wǎng)站上的應用場景很快暴露了 HTTP 0.9 的許多基礎限制:我們需要一種能夠提供超文本文檔、提供關于請求和響應的更豐富的元數(shù)據(jù),支持內容協(xié)商等等的協(xié)議。相應地,新興的 Web 開發(fā)人員社區(qū)通過一個特殊的過程生成了大量實驗性的 HTTP 服務器和客戶端實現(xiàn)來回應:實現(xiàn),部署,并查看其他人是否采用它。
從這些急速增長的實驗開始,一系列最佳實踐和常見模式開始出現(xiàn)。1996 年 5 月, HTTP 工作組(HTTP Working Group)(HTTP-WG)發(fā)布了 RFC 1945,它記錄了許多被廣泛使用的 HTTP/1.0 實現(xiàn)的“常見用法”。請注意,這只是一個信息性 RFC:HTTP/1.0,如你所知的,它不是一個正式規(guī)范或 Internet 標準!
話雖如此,HTTP/1.0 請求看起來應該是:
$> telnet 80
Connected to xxx.xxx.xxx.xxx
GET /rfc/rfc1945.txt HTTP/1.0 ?
User-Agent: CERN-LineMode/2.15 libwww/2.17b3
Accept: */*
HTTP/1.0 200 OK ?
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 01 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 1 May 1996 12:45:26 GMT
Server: Apache 0.84
(plain-text response)
(connection closed)
? 請求行有 HTTP 版本號,后面跟請求頭
? 響應狀態(tài),后跟響應頭
前面的交互并不是 HTTP/1.0 功能的詳盡列表,但它確實說明了一些關鍵的協(xié)議更改:
請求可能多個由換行符分隔的請求頭字段組成。
響應對象的前綴是響應狀態(tài)行。
響應對象有自己的一組由換行符分隔的響應頭字段。
響應對象不限于超文本。
每次請求后,服務器和客戶端之間的連接都將關閉。
請求頭和響應頭都保留為 ASCII 編碼,但響應對象本身可以是任何類型:HTML 文件、純文本文件、圖像或任何其他內容類型。因此,HTTP 的“超文本傳輸”部分在引入后不久就變成了用詞不當。實際上,HTTP 已經(jīng)迅速發(fā)展成為一種超媒體傳輸,但最初的名稱沒有改變。
除了媒體類型協(xié)商之外,RFC 還記錄了許多其他常用功能:內容編碼、字符集支持、多部分類型、授權、緩存、代理行為、日期格式等。
今天,幾乎所有 Web 上的服務器都可以并且仍將使用 HTTP/1.0。不過,現(xiàn)在你應該更加清楚了!每個請求都需要一個新的 TCP 連接,這會對 HTTP/1.0 造成嚴重的性能損失。參見 三次握手 ,接著會 慢啟動 。
HTTP/1.1: Internet 標準
將 HTTP 轉變?yōu)楣俜?IETF 互聯(lián)網(wǎng)標準的工作與圍繞 HTTP/1.0 的文檔工作并行進行,并計劃從 1995 年至 1999 年完成。事實上,第一個正式的 HTTP/1.1 標準定義于 RFC 2068,它在 HTTP/1.0 發(fā)布大約六個月后,即 1997 年 1 月正式發(fā)布。兩年半后,即 1999 年 6 月,一些新的改進和更新被納入標準,并作為 RFC 2616 發(fā)布。
HTTP/1.1 標準解決了早期版本中發(fā)現(xiàn)的許多協(xié)議歧義,并引入了一些關鍵的性能優(yōu)化:保持連接,分塊編碼傳輸,字節(jié)范圍請求,附加緩存機制,傳輸編碼和請求管道。
有了這些功能,我們現(xiàn)在可以審視一下由任何現(xiàn)代 HTTP 瀏覽器和客戶端執(zhí)行的典型 HTTP/1.1 會話:
$> telnet 80
Connected to xxx.xxx.xxx.xxx
GET /index.html HTTP/1.1 ?
Host:
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4)... (snip)
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-US,en;q=0.8
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3
Cookie: __qca=P0-800083390... (snip)
HTTP/1.1 200 OK ?
Server: nginx/1.0.11
Connection: keep-alive
Content-Type: text/html; charset=utf-8
Via: HTTP/1.1 GWA
Date: Wed, 25 Jul 2012 20:23:35 GMT
Expires: Wed, 25 Jul 2012 20:23:35 GMT
Cache-Control: max-age=0, no-cache
Transfer-Encoding: chunked
100 ?
<!doctype html>
(snip)
100
(snip)
0 ?
GET /favicon.ico HTTP/1.1 ?
Host: www.
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4)... (snip)
Accept: */*
Referer: http:///
Connection: close ?
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-US,en;q=0.8
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3
Cookie: __qca=P0-800083390... (snip)
HTTP/1.1 200 OK ?
Server: nginx/1.0.11
Content-Type: image/x-icon
Content-Length: 3638
Connection: close
Last-Modified: Thu, 19 Jul 2012 17:51:44 GMT
Cache-Control: max-age=315360000
Accept-Ranges: bytes
Via: HTTP/1.1 GWA
Date: Sat, 21 Jul 2012 21:35:22 GMT
Expires: Thu, 31 Dec 2037 23:55:55 GMT
Etag: W/PSA-GAu26oXbDi
(icon data)
(connection closed)
? 請求的 HTML 文件,包括編、字符集和 cookie 元數(shù)據(jù)
? 原始 HTML 請求的分塊響應
? 以 ASCII 十六進制數(shù)字(256 字節(jié))表示塊中的八位元的數(shù)量
? 分塊流響應結束
? 在相同的 TCP 連接上請求一個圖標文件
? 通知服務器不再重用連接
? 圖標響應后,然后關閉連接
哇,這里發(fā)生了很多事情!第一個也是最明顯的區(qū)別是我們有兩個對象請求,一個用于 HTML 頁面,另一個用于圖像,它們都通過一個連接完成。這就是保持連接的實際應用,它允許我們重用現(xiàn)有的 TCP 連接到同一個主機的多個請求,提供一個更快的最終用戶體驗。參見 TCP 優(yōu)化 。
要終止持久連接,注意第二個客戶端請求通過 Connection 請求頭向服務器發(fā)送顯示的 close。類似地,一旦傳輸響應,服務器就可以通知客戶端關閉當前 TCP 連接。從技術上講,任何一方都可以在沒有此類信號的情況下終止 TCP 連接,但客戶端和服務器應盡可能提供此類信號,以便雙方都啟用更好的連接重用策略。
HTTP/1.1 改變了 HTTP 協(xié)議的語義,默認情況下使用保持連接。這意味著,除非另有說明(通過 Connection:close 頭),否則服務器應默認保持連接打開。
但是,同樣的功能也被反向移植到 HTTP/1.0 上,通過 Connection:keep-Alive 頭啟用。因此,如果你使用 HTTP/1.1,從技術上講,你不需要 Connection:keep-Alive 頭,但許多客戶端仍然選擇提供它。
此外,HTTP/1.1 協(xié)議還添加了內容、編碼、字符集,甚至語言協(xié)商、傳輸編碼、緩存指令、客戶端 cookie,以及可以針對每個請求協(xié)商的十幾個其他功能。
我們不打算詳細討論每個 HTTP/1.1 特性的語義。這個主題可以寫一本專門的書了,已經(jīng)有了很多很棒的書。相反,前面的示例很好地說明了 HTTP 的快速進展和演變,以及每個客戶端-服務器交換的錯綜復雜的過程,里面發(fā)生了很多事情!
要了解 HTTP 協(xié)議所有內部工作原理,參考 David Gourley 和 Brian Totty 共同撰寫的權威指南: The Definitive Guide。
HTTP/2: 提高傳輸性能
RFC 2616 自發(fā)布以來,已經(jīng)成為互聯(lián)網(wǎng)空前增長的基礎:數(shù)十億各種形狀和大小的設備,從臺式電腦到我們口袋里的小型網(wǎng)絡設備,每天都在使用 HTTP 來傳送新聞,視頻,在我們生活中的數(shù)百萬的其他網(wǎng)絡應用程序都在依靠它。
一開始是一個簡單的,用于檢索超文本的簡單協(xié)議,很快演變成了一種通用的超媒體傳輸,現(xiàn)在十年過去了,它幾乎可以為你所能想象到的任何用例提供支持。可以使用協(xié)議的服務器無處不在,客戶端也可以使用協(xié)議,這意味著現(xiàn)在許多應用程序都是專門在 HTTP 之上設計和部署的。
需要一個協(xié)議來控制你的咖啡壺?RFC 2324 已經(jīng)涵蓋了超文本咖啡壺控制協(xié)議(HTCPCP/1.0)- 它原本是 IETF 在愚人節(jié)開的一個玩笑,但在我們這個超鏈接的新世界中,它不僅僅意味著一個玩笑。
超文本傳輸協(xié)議(HTTP)是一個應用程序級的協(xié)議,用于分布式、協(xié)作、超媒體信息系統(tǒng)。它是一種通用的、無狀態(tài)的協(xié)議,可以通過擴展請求方法、錯誤碼和頭,用于超出超文本之外的許多任務,比如名稱服務器和分布式對象管理系統(tǒng)。HTTP 的一個特性是數(shù)據(jù)表示的類型和協(xié)商,允許獨立于傳輸?shù)臄?shù)據(jù)構建系統(tǒng)。
RFC 2616: HTTP/1.1, June 1999
HTTP 協(xié)議的簡單性是它最初被采用和快速增長的原因。事實上,現(xiàn)在使用 HTTP 作為主要控制和數(shù)據(jù)協(xié)議的嵌入式設備(傳感器,執(zhí)行器和咖啡壺)并不罕見。但在其自身成功的重壓下,隨著我們越來越多地繼續(xù)將日?;愚D移到網(wǎng)絡 —— 社交、電子郵件、新聞和視頻,以及越來越多的個人和工作空間,它也開始顯示出壓力的跡象。用戶和 Web 開發(fā)人員現(xiàn)在都要求 HTTP/1.1 提供近乎實時的響應能力和協(xié)議 性能,如果不進行一些修改,就無法滿足這些要求。
為了應對這些新挑戰(zhàn),HTTP 必須繼續(xù)發(fā)展,因此 HTTPbis 工作組在 2012 年初宣布了一項針對 HTTP/2 的新計劃:
已經(jīng)有一個協(xié)議中出現(xiàn)了新的實現(xiàn)經(jīng)驗和興趣,該協(xié)議保留了 HTTP 的語義,但是沒有保留 HTTP/1.x 的消息框架和語法,這些問題已經(jīng)被確定為妨礙性能和鼓勵濫用底層傳輸。
工作組將使用有序的雙向流中生成 HTTP 當前語義的新表達式的規(guī)范。與 HTTP/1.x 一樣,主要傳輸目標是 TCP,但是應該可以使用其他方式傳輸。
HTTP/2 charter, January 2012
HTTP/2 的主要重點是提高傳輸性能并支持更低的延遲和更高的吞吐量。主要的版本增量聽起來像是一個很大的步驟,但就性能而言,它將是一個重大的步驟,但重要的是要注意,沒有任何高級協(xié)議語義收到影響:所有的 HTTP 頭,值和用例是相同的。
任何現(xiàn)有的網(wǎng)站或應用程序都可以并且將通過 HTTP/2 傳送而無需修改。你無需修改應用程序標記來利用 HTTP/2。HTTP 服務器將來一定會使用 HTTP/2,但這對大多數(shù)用戶來說應該是透明的升級。如果工作組實現(xiàn)目標,唯一的區(qū)別應該是我們的應用程序以更低的延遲和更好的網(wǎng)絡連接利用率來傳送數(shù)據(jù)。
話雖如此,但我們不要走的太遠了。在討論新的 HTTP/2 協(xié)議功能之前,有必要回顧一下我們現(xiàn)有的 HTTP/1.1 部署和性能最佳實踐。HTTP/2 工作組正在新規(guī)范上取得快速的進展,但即使最終標準已經(jīng)完成并準備就緒,在可預見的未來,我們仍然必須支持舊的 HTTP/1.1 客戶端,實際上,這得十年或更長時間。
via: https:///brief-history-of-http/#http-09-the-one-line-protocol
作者: Ilya Grigorik 選題: lujun9972 譯者: MjSeven 校對: wxy
本文由 LCTT 原創(chuàng)編譯, Linux中國 榮譽推出