http协议下载文件

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

竭诚为您提供优质文档/双击可除
http协议下载文件
篇一：http协议
http协议详解
引言
http是一个属于应用层的面向对象的协议，由于其简捷、快速的方式，适用于分布式超媒体信息系统。

它于1990年
提出，经过几年的使用与发展，得到不断地完善和扩展。

目前在www中使用的是http/1.0的第六版，http/1.1的规范
化工作正在进行之中，而且http-ng(nextgenerationofhttp)的建议已经提出。

http协议的主要特点可概括如下：
1.支持客户/服务器模式。

2.简单快速：客户向服务器请求服务时，只需传送请求方法和路径。

请求方法常用的有get、head、post。

每种方
法规定了客户与服务器联系的类型不同。

由于http协议简单，使得http服务器的程序规模小，因而通信速度很快。

3.灵活：http允许传输任意类型的数据对象。

正在传输
的类型由content-type加以标记。

4.无连接：无连接的含义是限制每次连接只处理一个请求。

服务器处理完客户的请求，并收到客户的应答后，即断开连接。

采用这种方式可以节省传输时间。

5.无状态：http协议是无状态协议。

无状态是指协议对于事务处理没有记忆能力。

缺少状态意味着如果后续处理需要前面的信息，则它必须重传，这样可能导致每次连接传送的数据量增大。

另一方面，在服务器不需要先前信息时它的应答就较快。

一、http协议详解之uRl篇
http（超文本传输协议）是一个基于请求与响应模式的、无状态的、应用层的协议
，常基于tcp的连接方式，http1.1版本中给出一种持续连接的机制，绝大多数的web开发，都是构建在http协议之上的web应用。

httpuRl(uRl是一种特殊类型的uRi，包含了用于查找某个资源的足够的信息)的格式如下：
http://host[":"port][abs_path]
http表示要通过http协议来定位网络资源；host表示合法的internet主机域名或者ip地址；port指定一个端口号，为空则使用缺省端口80；abs_path指定请求资源的uRi；如果uRl中没有给出abs_path，那么当它作为请求uRi时，
必须以“/”的形式给出，通常这个工作浏览器自动帮我们完成。

eg:
1、输入：
浏览器自动转换成：http:///
2、http:192.168.0.116:8080/index.jsp
二、http协议详解之请求篇
http请求由三部分组成，分别是：请求行、消息报头、请求正文
1、请求行以一个方法符号开头，以空格分开，后面跟着请求的uRi和协议的版本，格式如下：
methodRequest-uRihttp-VersioncRlF
其中method表示请求方法；Request-uRi是一个统一资源标识符；http-Version表示请求的http协议版本；cRlF 表示回车和换行（除了作为结尾的cRlF外，不允许出现单独的cR或lF字符）。

请求方法（所有方法全为大写）有多种，各个方法的解释如下：
get请求获取Request-uRi所标识的资源
post在Request-uRi所标识的资源后附加新的数据
head请求获取由Request-uRi所标识的资源的响应消息报头
put请求服务器存储一个资源，并用Request-uRi作为
其标识delete请求服务器删除Request-uRi所标识的资源tRace请求服务器回送收到的请求信息，主要用于测试或诊断
connect保留将来使用
options请求查询服务器的性能，或者查询与资源相关的选项和需求
应用举例：
get方法：在浏览器的地址栏中输入网址的方式访问网页时，浏览器采用get方法向服务器获取资源，
eg:get/form.htmlhttp/1.1(cRlF)
post方法要求被请求服务器接受附在请求后面的数据，常用于提交表单。

eg：post/reg.jsphttp/(cRlF) accept:image/gif,image/x-xbit,...(cRlF)
...
host:(cRlF)
content-length:22(cRlF)
connection:keep-alive(cRlF)
cache-control:no-cache(cRlF)
(cRlF)//该cRlF表示消息报头已经结束，在此之前为消息报头
user=jeffrey
响应时的缓存指令包括：public、private、no-cache、
no-store、no-transform、must-revalidate、
proxy-revalidate、max-age、s-maxage.
eg：为了指示ie浏览器（客户端）不要缓存页面，服务器端的jsp程序可以编写如下：
response.sehheader("cache-control","no-cache");
//response.setheader("pragma","no-cache");作用相当于上述代码，通常两者//合用
这句代码将在发送的响应消息中设置普通报头域：cache-control:no-cache
date普通报头域表示消息产生的日期和时间
connection普通报头域允许发送指定连接的选项。

例如指定连接是连续，或者指定“close”选项，通知服务器，在响应完成后，关闭连接
2、请求报头
请求报头允许客户端向服务器端传递请求的附加信息以及客户端自身的信息。

常用的请求报头
accept
accept请求报头域用于指定客户端接受哪些类型的信息。

eg：accept：image/gif，表明客户端希望接受giF图象格式的资源；accept：text/html，表明客户端希望接受html文本。

accept-charset
accept-charset请求报头域用于指定客户端接受的字符集。

eg：
accept-charset:iso-8859-1,gb2312.如果在请求消息中没有设置这个域，缺省是任何字符集都可以接受。

accept-encoding
accept-encoding请求报头域类似于accept，但是它是用于指定可接受的内容编码。

eg：
accept-encoding:gzip.deflate.如果请求消息中没有设置这个域服务器假定客户端对各种内容编码都可以接受。

accept-language
accept-language请求报头域类似于accept，但是它是用于指定一种自然语言。

eg：accept-language:zh-cn.如果请求消息中没有设置这个报头域，服务器假定客户端对各种语言都可以接受。

authorization
authorization请求报头域主要用于证明客户端有权查看某个资源。

当浏览器访问一个页面时，如果收到服务器的响应代码为401（未授权），可以发送一个包
含authorization请求报头域的请求，要求服务器对其进行验证。

host（发送请求时，该报头域是必需的）
host请求报头域主要用于指定被请求资源的internet
主机和端口号，它通常从httpuRl中提取出来的，eg：我们在浏览器中输入：http:///index.html
浏览器发送的请求消息中，就会包含host请求报头域，如下：
host：
此处使用缺省端口号80，若指定了端口号，则变成：host：:指定端口号
user-agent
我们上网登陆论坛的时候，往往会看到一些欢迎信息，其中列出了你的操作系统的名称和版本，你所使用的浏览器的名称和版本，这往往让很多人感到很神奇，实际上，服务器应用程序就是从user-agent这个请求报头域中获取到这
些信息。

user-agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器。

不过，这个报头域不是必需的，如果我们自己编写一个浏览器，不使用user-agent请
求报头域，那么服务器端就无法得知我们的信息了。

请求报头举例：
get/form.htmlhttp/1.1(cRlF)
accept:image/gif,image/x-xbitmap,image/jpeg,applica tion/x-shockwave-flash,application/vnd.ms-excel,app lication/vnd.ms-powerpoint,application/msword,*/*(c
RlF)
accept-language:zh-cn(cRlF)
accept-encoding:gzip,deflate(cRlF)
if-modified-since:wed,05jan20xx11:21:25gmt(cRlF) if-none-match:w/"80b1a4c018f3c41:8317"(cRlF)
user-agent:mozilla/4.0(compatible;msie6.0;windowsnt 5.0)(cRlF)host:(cRlF)
connection:keep-alive(cRlF)
(cRlF)
3、响应报头
响应报头允许服务器传递不能放在状态行中的附加响
应信息，以及关于服务器的信息和对Request-uRi所标识的资源进行下一步访问的信息。

常用的响应报头
location
location响应报头域用于重定向接受者到一个新的位置。

location响应报头域常用在更换域名的时候。

server
server响应报头域包含了服务器用来处理请求的软件
信息。

与user-agent请求报头域是相对应的。

下面是server响应报头域的一个例子：
server：apache-coyote/1.1
www-authenticate
www-authenticate响应报头域必须被包含在401（未授权的）响应消息中，客户
篇二：http协议
什么是http协议
协议是指计算机通信网络中两台计算机之间进行通信
所必须共同遵守的规定或规则，超文本传输协议(http)是一种通信协议，它允许将超文本标记语言(html)文档从web服务器传送到客户端的浏览器
web服务器，浏览器,代理服务器
实际上我们输入uRl后，我们的浏览器给web服务器发送了一个Request,web服务器接到Request后进行处理，生成相应的Response，然后发送给浏览器，浏览器解析Response中的html,这样我们就看到了网页，我们的Request 有可能是经过了代理服务器，最后才到达web服务器的。

过程如下图所示
代理服务器就是网络信息的中转站，有什么功能呢？
1.提高访问速度，大多数的代理服务器都有缓存功能。

2.突破限制，也就是Fq了
3.隐藏身份。

uRl详解
uRl(uniformResourcelocator)地址用于描述一个网络上的资源,基本格式如下
schema://host[:port#]/path/.../[query-string][#anch or]scheme指定低层使用的协议(例如：http,https,ftp) hosthttp服务器的ip地址或者域名
port#http服务器的默认端口是80，这种情况下端口号可以省略。

如果使用了别的端口，必须指明，例如:8080/ path访问资源的路径
query-string发送给http服务器的数据
anchor-锚
uRl的一个例子
/sj/test/test.aspxname=sviergn&x=true#stuffschema:h ttp
host:
path:/sj/test/test.aspx
querystring:name=sviergn&x=true
anchor:stuff
http协议是无状态的
http协议是无状态的，同一个客户端的这次请求和上次请求是没有对应关系，对http服务器来说，它并不知道这两个请求来自同一个客户端。

为了解决这个问题，web 程序引入了cookie机制来维护状态.打开一个网页需要浏览
器发送很多次Request
1.当你在浏览器输入uRl的时候，浏览器发送一个Request去获取的html.服务器把Response发送回给浏览器.
2.浏览器分析Response中的html，发现其中引用了很
多其他文件，比如图片，css文件，js文件。

3.浏览器会自动再次发送Request去获取图片，css文件，或者js文件。

4.等所有的文件都下载成功后。

网页就被显示出来了。

http消息的结构
先看Request消息的结构,Request消息分为3部分，第一部分叫Requestline,第二部分叫Requestheader,第三部
分是body.header和body之间有个空行，结构如下图第一行中的method表示请求方法,比如"post","get",path-to-resoure表示请求的资源，
http/version-number表示http协议的版本号
当使用的是"get"方法的时候，body是为空的
比如我们打开博客园首页的request如下
get/http/1.1
host:
抽象的东西，难以理解，老感觉是虚的，所谓眼见为实,实际见到的东西，我们才能理解和记忆。

我们今天用Fiddler，实际的看看Request和Response.
下面我们打开Fiddler捕捉一个博客园登录的Request 然后分析下它的结构,在inspectorstab下以Raw的方式可以看到完整的Request的消息，如下图
我们再看Response
消息的结构,和Request消息的结构基本一样。

同样也分为三部分,第一部分叫Responseline,第二部分叫Responseheader，第三部分是body.header和body之间也有个空行,结构如下图
http/version-number表示http协议的版本号，status-code和message请看下节[状态代码]的详细解释.我们用Fiddler捕捉一个博客园首页的Response然后分析下它的结构,在inspectorstab下以Raw的方式可以看到完整的Response的消息，
get和post方法的区别
http协议定义了很多与服务器交互的方法，最基本的有4种，分别是get,post,put,delete.一个uRl地址用于描述一个网络上的资源，而http中的get,post,put,delete就对应着对这个资源的查，改，增，删4个操作。

我们最常见的就是get和post了。

get一般用于获取/查询资源信息，而post一般用于更新资源信息.
我们看看get和post的区别
1.get提交的数据会放在uRl之后，以分割uRl和传输
数据，参数之间以&相连，如
editposts.aspxname=test1&id=123456.post方法是把提交的数据放在http包的body中.
2.get提交的数据大小有限制（因为浏览器对uRl的长度有限制），而post方法提交的数据没有限制.
3.get方式需要使用Request.querystring来取得变量的值，而post方式通过Request.Form来获取变量的值。

4.get方式提交数据，会带来安全问题，比如一个登录页面，通过get方式提交数据时，用户名和密码将出现在uRl 上，如果页面可以被缓存或者其他人可以访问这台机器，就可以从历史记录获得该用户的账号和密码.状态码
Response消息中的第一行叫做状态行，由http协议版本号，状态码，状态消息三部分组成。

状态码用来告诉http客户端,http服务器是否产生了预期的Response.
http/1.1中定义了5类状态码，状态码由三位数字组成，第一个数字定义了响应的类别
1xx提示信息-表示请求已被成功接收，继续处理
2xx成功-表示请求已被成功接收，理解，接受
3xx重定向
-要完成请求必须进行更进一步的处理
4xx客户端错误-请求有语法错误或请求无法实现
5xx服务器端错误-服务器未能实现合法的请求
常见状态码：
1.200ok
最常见的就是成功响应状态码200了，这表明该请求被成功地完成，所请求的资源发送回客户端
2.302Found
重定向，新的uRl会在response中的location中返回，浏览器将会自动使用新的uRl发出新的Request例如在ie
中输入，.http服务器会返回302，ie取到Response中locationheader的新uRl,又重新发送了一个Request.
304notmodified
代表上次的文档已经被缓存了，还可以继续使用，
例如打开博客园首页,发现很多Response的statuscode 都是304
篇三：http协议
http协议基础概念http协议（hypertexttransferprotocol，超文本传输协议）是互联网上应用最为广泛的一种网络协议。

它是一个应用层协议，由请求和响应构成，是一个标准的客户端服务器模型。

所有的www文件都必须遵守这个标准。

它是客户端浏览器或其他程序与web服务器之间的应用层通信协议。

在internet上的web服务器上存放的都是超文本信息，客户机需要通过
http协议传输所要访问的超文本信息。

http包含命令和传输信息，不仅可用于web访问，也可以用于其他因特网/内联网应用系统之间的通信，从而实现各类应用资源超媒体访问的集成。

它可以使浏览器更加高效，使网络传输减少。

它不仅保证计算机正确快速地传输超文本文档，还确定传输文档中的哪一部分，以及哪部分内容首先显示(如文本先于图形)等
默认
http的端口号为80，https的端口号为443
http
协议工作流程
一次http操作称为一个事务
，其工作过程可分为四步：
1）首先客户机与服务器需要建立连接。

只要单击某个超级链接，http的工作开始。

2）建立连接后，客户机发送一个请求给服务器，请求方式的格式为：统一资源标识符（uRl）、协议版本号，后边是mime信息包括请求修饰符、客户机信息和可能的内容。

3）服务器接到请求后，给予相应的响应信息，其格式为一个状态行，包括信息的协议版本号、一个成功或错误的代码，后边是mime信息包括服务器信息、实体信息和可能的内容。

4）客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上，然后客户机与服务器断开连接。

（3）http协议请求响应信息：
http协议永远都是客户端发起请求，服务器回送响应。

http协议是一个无状态的协议，同一个客户端的这次请求和上次请求是没有对应关系。

请求行=方法+uRl+http版本号+cRlF
方法=get|head|post|，请求类型是对大小写敏感的，下面简要叙
述这几种方法的功能：
1.get方法表示取回由Request-uRi标识的信息。

2.head方法也表示取回由Request-uRi标识的信息，只是可以在响应时，不返回消息体。

3.post方法可以请求服务器接收包含在请求中的实体
信息，可以用于提交表单，向新闻组、bbs、邮件群组和数据库发送消息。

http响应报文信息
http响应报文格式为：
，
状态码表示服务器发回的响
状态码
有三位数字组成，第一个数字定义了响应的类别，
且有五种可能
取值：
1xx：指示信息--表示请求已接收，继续处理
2xx：成功--表示请求已被成功接收、理解、接受
3xx：重定向--要完成请求必须进行更进一步的操作4xx：客户端错误--请求有语法错误或请求无法实现5xx：服务器端错误--服务器未能实现合法的请求。