<li draggable='ow9knrh'></li>

      <code lang='vt8gej6'><sub dir='3c1u05m'></sub></code>

      • <tr dir='mkyum7q'><optgroup dropzone='nah8jsu'></optgroup></tr>

        1. <li lang='wxs02jm'></li><td id='39vf5oy3'></td>

          1. 文章熱詞:TCP

            日期:2019-10-11 09:26 by 楊國偉 1882 0 收藏
            我要分享

            摘要:從 URL 在浏覽器被被輸入到頁面展現的過程中發生了什麽?收到的 HTML 如果包含幾十個圖片标簽,這些圖片是以什麽方式、什麽順序、建立了多少連接、使用什麽協議被下載下來的呢?

            曾經有這麽一道經典面試題:從 URL 在浏覽器被被輸入到頁面展現的過程中發生了什麽?
            相信大多數準備過的同學都能回答出來,但是如果繼續問:收到的 HTML 如果包含幾十個圖片标簽,這些圖片是以什麽方式、什麽順序、建立了多少連接、使用什麽協議被下載下來的呢?
            要搞懂這個問題,我們需要先解決下面五個問題:
            1. 現代浏覽器在與服務器建立了一個 TCP 連接後是否會在一個 HTTP 請求完成後斷開?什麽情況下會斷開?

            2. 一個 TCP 連接可以對應幾個 HTTP 請求?

            3. 一個 TCP 連接中 HTTP 請求發送可以一起發送麽(比如一起發三個請求,再三個響應一起接收)?

            4. 爲什麽有的時候刷新頁面不需要重新建立 SSL 連接?

            5. 浏覽器對同一 Host 建立 TCP 連接到數量有沒有限制?

            第一個問題

            現代浏覽器在與服務器建立了一個 TCP 連接後是否會在一個 HTTP 請求完成後斷開?什麽情況下會斷開?

            在 HTTP/1.0 中,一個服務器在發送完一個 HTTP 響應後,會斷開 TCP 鏈接。但是這樣每次請求都會重新建立和斷開 TCP 連接,代價過大。所以雖然标準中沒有設定,某些服務器對 Connection: keep-alive 的 Header 進行了支持。意思是說,完成這個 HTTP 請求之後,不要斷開 HTTP 請求使用的 TCP 連接。這樣的好處是連接可以被重新使用,之後發送 HTTP 請求的時候不需要重新建立 TCP 連接,以及如果維持連接,那麽 SSL 的開銷也可以避免,兩張圖片是我短時間内兩次訪問 https://www.github.com 的時間統計:

            640_wps圖片.jpg

            頭一次訪問,有初始化連接和 SSL 開銷

            640 (1)_wps圖片.jpg

            初始化連接和 SSL 開銷消失了,說明使用的是同一個 TCP 連接
            持久連接:既然維持 TCP 連接好處這麽多,HTTP/1.1 就把 Connection 頭寫進标準,并且默認開啓持久連接,除非請求中寫明 Connection: close,那麽浏覽器和服務器之間是會維持一段時間的 TCP 連接,不會一個請求結束就斷掉。

            所以第一個問題的答案是:默認情況下建立 TCP 連接不會斷開,隻有在請求報頭中聲明 Connection: close 才會在請求完成後關閉連接。

            第二個問題

            一個 TCP 連接可以對應幾個 HTTP 請求?

            了解了第一個問題之後,其實這個問題已經有了答案,如果維持連接,一個 TCP 連接是可以發送多個 HTTP 請求的。

            第三個問題

            一個 TCP 連接中 HTTP 請求發送可以一起發送麽(比如一起發三個請求,再三個響應一起接收)?
            HTTP/1.1 存在一個問題,單個 TCP 連接在同一時刻隻能處理一個請求,意思是說:兩個請求的生命周期不能重疊,任意兩個 HTTP 請求從開始到結束的時間在同一個 TCP 連接裏不能重疊。
            雖然 HTTP/1.1 規範中規定了 Pipelining 來試圖解決這個問題,但是這個功能在浏覽器中默認是關閉的。
            先來看一下 Pipelining 是什麽,RFC 2616 中規定了:
            A client that supports persistent connections MAY "pipeline" its requests (i.e., send multiple requests without waiting for each response). A server MUST send its responses to those requests in the same order that the requests were received. 一個支持持久連接的客戶端可以在一個連接中發送多個請求(不需要等待任意請求的響應)。收到請求的服務器必須按照請求收到的順序發送響應。
            至于标準爲什麽這麽設定,我們可以大概推測一個原因:由于 HTTP/1.1 是個文本協議,同時返回的内容也并不能區分對應于哪個發送的請求,所以順序必須維持一緻。比如你向服務器發送了兩個請求 GET/query?q=A 和 GET/query?q=B,服務器返回了兩個結果,浏覽器是沒有辦法根據響應結果來判斷響應對應于哪一個請求的。
            Pipelining 這種設想看起來比較美好,但是在實踐中會出現許多問題:
            所以現代浏覽器默認是不開啓 HTTP Pipelining 的。
            但是,HTTP2 提供了 Multiplexing 多路傳輸特性,可以在一個 TCP 連接中同時完成多個 HTTP 請求。至于 Multiplexing 具體怎麽實現的就是另一個問題了。我們可以看一下使用 HTTP2 的效果。

            640 (2)_wps圖片.jpg

            綠色是發起請求到請求返回的等待時間,藍色是響應的下載時間,可以看到都是在同一個 Connection,并行完成的
            所以這個問題也有了答案:在 HTTP/1.1 存在 Pipelining 技術可以完成這個多個請求同時發送,但是由于浏覽器默認關閉,所以可以認爲這是不可行的。在 HTTP2 中由于 Multiplexing 特點的存在,多個 HTTP 請求可以在同一個 TCP 連接中并行進行。
            那麽在 HTTP/1.1 時代,浏覽器是如何提高頁面加載效率的呢?主要有下面兩點:
            1. 維持和服務器已經建立的 TCP 連接,在同一連接上順序處理多個請求。

            2. 和服務器建立多個 TCP 連接。

            第四個問題

            爲什麽有的時候刷新頁面不需要重新建立 SSL 連接?

            在第一個問題的讨論中已經有答案了,TCP 連接有的時候會被浏覽器和服務端維持一段時間。TCP 不需要重新建立,SSL 自然也會用之前的。

            第五個問題

            浏覽器對同一 Host 建立 TCP 連接到數量有沒有限制?
            假設我們還處在 HTTP/1.1 時代,那個時候沒有多路傳輸,當浏覽器拿到一個有幾十張圖片的網頁該怎麽辦呢?肯定不能隻開一個 TCP 連接順序下載,那樣用戶肯定等的很難受,但是如果每個圖片都開一個 TCP 連接發 HTTP 請求,那電腦或者服務器都可能受不了,要是有 1000 張圖片的話總不能開 1000 個TCP 連接吧,你的電腦同意 NAT 也不一定會同意。
            所以答案是:有。Chrome 最多允許對同一個 Host 建立六個 TCP 連接。不同的浏覽器有一些區别。
            https://developers.google.com/web/tools/chrome-devtools/network/issues#queued-or-stalled-requestsdevelopers.google.com
            那麽回到最開始的問題,收到的 HTML 如果包含幾十個圖片标簽,這些圖片是以什麽方式、什麽順序、建立了多少連接、使用什麽協議被下載下來的呢?
            如果圖片都是 HTTPS 連接并且在同一個域名下,那麽浏覽器在 SSL 握手之後會和服務器商量能不能用 HTTP2,如果能的話就使用 Multiplexing 功能在這個連接上進行多路傳輸。不過也未必會所有挂在這個域名的資源都會使用一個 TCP 連接去獲取,但是可以确定的是 Multiplexing 很可能會被用到。
            如果發現用不了 HTTP2 呢?或者用不了 HTTPS(現實中的 HTTP2 都是在 HTTPS 上實現的,所以也就是隻能使用 HTTP/1.1)。那浏覽器就會在一個 HOST 上建立多個 TCP 連接,連接數量的最大限制取決于浏覽器設置,這些連接會在空閑的時候被浏覽器用來發送新的請求,如果所有的連接都正在發送請求呢?那其他的請求就隻能等等了。

            上一篇:php的鈎子(hook),你有沒有用過?

            下一篇:PHP如何防止XSS攻擊與XSS攻擊原理


            評論