HTTP协议是如何运行的?海外代理IP原理介绍

HTTP协议,全称为HyperText Transfer Protocol,即为超文本传输协议,是互联网应用最为广泛的一种网络协议,所有的www文件都必须遵守这个标准。接下来就以使用Chrome浏览器访问百度为例来了解一下HTTP协议的运行过程吧:


image.png


1.首先Chrome搜索自身的DNS缓存。(如果DNS缓存中找到百度的IP地址,就跳过了接下来查找IP地址步骤,直接访问该IP地址。)


2.搜索操作系统自身的DNS缓存。(浏览器没有找到缓存或者缓存已经失效)


3.读取硬盘中的host文件,里面记录着域名到 IP 地址的映射关系,如果使用的是Mac电脑的话则位于/etc/hosts当中。


4.浏览器向宽带运营商服务器或者域名服务器发起一个DNS解析请求,之后浏览器获得了百度首页的IP地址。


5.拿到IP地址后,浏览器就会向该IP所在的服务器建立TCP连接(即三次握手)。


6.连接建立起来后,浏览器就可以向服务器发起HTTP请求。(比如访问百度首页,就向服务器发起HTTP中的GET请求)


7.服务器接受到这个请求后,会根据路径参数经过后台处理把处理后的结果返回给浏览器,如果是百度首页,就可以把完整的HTML页面代码返回给浏览器。


8.浏览器拿到了百度首页的完整HTML页面代码、内核和JS引擎就会解析和渲染这个页面,将里面的Json,CSS,图片等静态资源通过一个个HTTP请求进行加载。


9.浏览器根据拿到的资源对页面进行渲染,最终把完整的页面呈现给用户。


10.如果浏览器没有后续的请求,那么就会跟服务器端发起TCP断开(即四次挥手)。


IPIDEA已向众多互联网知名企业提供服务,对提高爬虫的抓取效率提供帮助,支持API批量使用,支持多线程高并发使用。欢迎访问www.ipidea.net

 

 


热门资讯