Web基本工作原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16
Web(新)技术的三个方面(3)
HTML, HyperText Markup Language, 网 页编写语言,向浏览器提供Web document的“排版”信息和hypermedia 文档的链接关系。它使得在网页中
不仅有<A HREF=“http://…”> … </A> 还有<IMG SRC=“http://…/nice.gif”>, 等等 What’s the difference ?
26
More attractive—adding headings and paragraphs
<h1>An important heading</h1> < h2>A slightly less important heading</h2> <p>This is the first paragraph.</p> <p>This is the second paragraph.</p>
Байду номын сангаас
HTTP请求示例
method location ver. HTTP/1.0 user-agent: if-modified-since: accept: … application/postscript accept: authorization GET /funny/silly.html user-agent: NCSA Mosaic accept: text/plain accept: text/html accept: accept: image/gif
22
HTTP请求的方法
GET:返回所指对象 HEAD:返回关于对象的信息,例如它已 存在的时间等 POST:将某种信息送给服务器/对象 PUT:用一个新拷贝将对象替换 DELETE:删除对象 other
23
HTTP回答的四个组成部分
状态行:版本号,状态码,解释
200 Document follows 404 Not found 401 Unauthorized, 等等
8
MIME — Multipurpose Internet Mail Extension
一个开放的多语言、多媒体电子邮件标准, 规定了不 同数据类型的名字. Web仅用到它的一个子集 IANA (Internet Assigned Numbers Authority)负责 不同类型电子邮件规范的注册登记 基本形式: Type/subtype text message image audio video
这 不 是 全 部 还 有 许 多 !
10
,
服务器通常支持这种对应关系的设置
例如html, htm都可以是text/html 设置通常在服务器的配置文件中
11
Web是“站”在TCP/IP之上的
12
Web是TCP/IP上的一个应用
从TCP/IP来看, WEB (HTTP)和TELNET, FTP, GOPHER, WAIS等没什么区别 MAC地址, IP地址, 服务地址(port number). Web的缺省服务地址是80. 服务地址可以设置, 于是我们可能有时看 到http://www.abc.edu:8800/之类. 什么叫一次TCP/IP连接 ?
27
More attractive—adding a bit of emphsis
<em>interesting </em>
28
More attractive—adding images
<img src=“cs.gif” width=500 height=88> <img src=“http://www.cs.pku.edu.cn/cs.gif” width=500 height=88 alt=“CSTD”>
17
从一次“click”到一张webpage
浏览器用URL查询DNS, DNS访回IP地址. 浏览器用这个IP地址建立一次TCP/IP连接. 浏览器通过该连接向服务器发一HTTP请求. 基于该请求的内容, 服务器找到相应的文件, 并根 据该文件的扩展名, 形成一个MIME类型的HTTP 回答消息, 发送给浏览器. 关闭本次连接. 根据消息头, 浏览器按某种方式显示该文件内容. 如果本文件中有<… SRC=url>之类,浏览器将 随时发出新的请求(可能对不同的服务器),以 获得有关内容。
9
extensions application
文件的扩展名和MIME类型的对应(例)
.html .txt .ps .ra .gif .jpeg .mpeg .wrl .class HTML文本, text/html 纯文本 PostScript RealAudio格式的语音 GIF 图像, image/gif JPEG 图像 MPEG VRML Java applet
关于返回内容的描述:MIME类型, 长度, 等. 空格 返回内容
24
HTTP回答的格式
版本 状态码 原因 follows 服务器: 日期: 19:17:05 GMT 内容长度: 内容类型: 内容语言: 1996. 内容编码: 最后修改日期: (空一行) 实际信息 HTTP/1.0 status 200 Doc Server: NCSA/1.4 Date: Tue, 4 Jul, 1996, Content-length: 5280 Content-type: text/html Last-modified: Wed, 1 Jan (这里必须空一行) 文件的实际内容
5
Hypertext
通过“anchor”实现非线性文档
<A HREF=“http://www.pku.edu.cn”> Peking University </A>
1945年Vannevar Bush提出概念 1960年Douglas Engelbart做出一系统 (当时 并没有Internet) Web是Hypertext在Internet上的应用.
4
Web Document
multimedia: 多种数据类型共存于一个文档 中, text, image, sound, movie, .... 含有anchor/hyperlinks, 形成hypertext: “a mesh of documents tied by hyperlinks”. hypermedia:hypertext + multimedia active web pages: 含有在浏览器方可以执行 的程序,Java applet, JavaScript, …
Web基本工作原理
参考书: Web Server Technology, Nancy J. Yeager, Morgan Kaufmann Publishers, 1996
1
Web是Internet发展的产物
Internet --> 现代Internet = Web 继承:TCP/IP, MIME, Hypertext, … 发展:HTTP, HTML, URL (Tim BernersLee) (为方便起见,本讲区别Internet和Web)
15
Web(新)技术的三个方面(2)
HTTP, HyperText Transfer Protocol, “The lingua franca” of Web browsers and servers.
请求/响应(request-response)工作方式 利用TCP/IP实现浏览器和服务器之间的连接 为社么常听人们说“HTTP是无连接的协 议”?(connectionless) 还有说“HTTP是无状态的”?(stateless)
20
HTTP请求的四个组成部分
方法:指定对所请求对象的操作。 URI, Universal Resource Identifier, 标识 所请求的对象。URL的一个超集(HTTP实 际用的只是URL). [还有所谓URN, 试图将 信息资源的名字和位置分别开来] 协议版本号 其它信息(选项)
21
29
More attractive-adding links to other pages
<a href=“http://www.pku.edu.cn”>Peking University</a> 定义锚:
<a name=”anchor-one”>这是锚一所在位置</a>
引用锚:
详细内容请参阅<a href=”./one.html#anchorone”>锚一</a> 详细内容请参阅<a href=”#anchor-one”>锚一 </a>
25
一个例子:10钟速成HTML
< ! DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN" > <HTML> <HEAD> <TITLE>My first HTML document</TITLE> </HEAD> <BODY> <P>Hello world! </BODY> </HTML>
6
Web文档的分类(生成时间)
静态文档 动态文档 活动文档
7
Web多媒体文档在浏览器方的展现
浏览器事先对文档的内容一无所知, 为什么 能够将它显示成如文档编写者所设计的样子? 可能的做法之一: 让文档的编写者在文档头 部给出描述. Web的设计比这稍微进了一步: Web服务器 根据文件的扩展名来给出文档类型的宏观描 述, 这种描述借用了MIME标准.
18
Web服务器(软件)“很简单”!
它不懂HTML(浏览器必须懂!) 它对web文件的内容一概不关心(除后面 要讲到的特殊情况外) 它也不知道是否有别的文件指向它所管 辖的文件 它也不知道自己所给出的文件MIME类型 正确与否
19
HTTP: 请求与应答
规定了请求与应答的格式 没有规定网络连接的方式(通常采用 TCP/IP) 纯文本,没有特殊编码
3
什么是Web ?
运行在Internet之上的所有HTTP服务器软件 和它们所管理的对象(及其作用)的集合 不算浏览器软件?! 对象:Web page/Web document, 程序
web document: multimedia/active, 含有 hyperlinks/anchors 程序,动态生成web document. (dynamic document不同于active document)
13
Web(新)技术的三个方面(1)
(这里的“新”指的是web从无到有的“enabling technology”,即Tim Berners-Lee的最初贡献)
URL, Uniform Resource Locator. Web信息的 寻址系统(address system).
借用了DNS, Domain Name Service, 的mapping功 能
30
Three kinds of lists-unordered list
<ul> <li>the first list item</li> <li>the second list item</li> <li>the third list item</li> </ul>
31
Three kinds of lists-ordered list
http://arch.cs.pku.edu.cn --> http://162.105.181.215
协助HTTP将各种信息服务统一在浏览器中 ftp://162.105.181.215 --> 162.105.181.215:port
14
URL-- Web(新)技术的三个 方面(1)
格式: <scheme>:<scheme-specific-part> <scheme>指所用的URL方案名 <scheme-specific-part>意义的解释与 所用方案有关。 mailto:wangsq@net.cs.pku.edu.cn
2
什么是Internet ? (如何界定 Internet包含的所有计算机)
所有在DNS中有登记的计算机的集合 ? 所有具有IP地址的计算机的集合 ?(internet vs Internet) “公理”:总可以找到一台在Internet上的计算机. 那么,Internet即为从任何一台已在Internet中的计算 机可以用IP地址ping到的所有计算机的集合. 拨号上网的计算机算不算 ?
Web(新)技术的三个方面(3)
HTML, HyperText Markup Language, 网 页编写语言,向浏览器提供Web document的“排版”信息和hypermedia 文档的链接关系。它使得在网页中
不仅有<A HREF=“http://…”> … </A> 还有<IMG SRC=“http://…/nice.gif”>, 等等 What’s the difference ?
26
More attractive—adding headings and paragraphs
<h1>An important heading</h1> < h2>A slightly less important heading</h2> <p>This is the first paragraph.</p> <p>This is the second paragraph.</p>
Байду номын сангаас
HTTP请求示例
method location ver. HTTP/1.0 user-agent: if-modified-since: accept: … application/postscript accept: authorization GET /funny/silly.html user-agent: NCSA Mosaic accept: text/plain accept: text/html accept: accept: image/gif
22
HTTP请求的方法
GET:返回所指对象 HEAD:返回关于对象的信息,例如它已 存在的时间等 POST:将某种信息送给服务器/对象 PUT:用一个新拷贝将对象替换 DELETE:删除对象 other
23
HTTP回答的四个组成部分
状态行:版本号,状态码,解释
200 Document follows 404 Not found 401 Unauthorized, 等等
8
MIME — Multipurpose Internet Mail Extension
一个开放的多语言、多媒体电子邮件标准, 规定了不 同数据类型的名字. Web仅用到它的一个子集 IANA (Internet Assigned Numbers Authority)负责 不同类型电子邮件规范的注册登记 基本形式: Type/subtype text message image audio video
这 不 是 全 部 还 有 许 多 !
10
,
服务器通常支持这种对应关系的设置
例如html, htm都可以是text/html 设置通常在服务器的配置文件中
11
Web是“站”在TCP/IP之上的
12
Web是TCP/IP上的一个应用
从TCP/IP来看, WEB (HTTP)和TELNET, FTP, GOPHER, WAIS等没什么区别 MAC地址, IP地址, 服务地址(port number). Web的缺省服务地址是80. 服务地址可以设置, 于是我们可能有时看 到http://www.abc.edu:8800/之类. 什么叫一次TCP/IP连接 ?
27
More attractive—adding a bit of emphsis
<em>interesting </em>
28
More attractive—adding images
<img src=“cs.gif” width=500 height=88> <img src=“http://www.cs.pku.edu.cn/cs.gif” width=500 height=88 alt=“CSTD”>
17
从一次“click”到一张webpage
浏览器用URL查询DNS, DNS访回IP地址. 浏览器用这个IP地址建立一次TCP/IP连接. 浏览器通过该连接向服务器发一HTTP请求. 基于该请求的内容, 服务器找到相应的文件, 并根 据该文件的扩展名, 形成一个MIME类型的HTTP 回答消息, 发送给浏览器. 关闭本次连接. 根据消息头, 浏览器按某种方式显示该文件内容. 如果本文件中有<… SRC=url>之类,浏览器将 随时发出新的请求(可能对不同的服务器),以 获得有关内容。
9
extensions application
文件的扩展名和MIME类型的对应(例)
.html .txt .ps .ra .gif .jpeg .mpeg .wrl .class HTML文本, text/html 纯文本 PostScript RealAudio格式的语音 GIF 图像, image/gif JPEG 图像 MPEG VRML Java applet
关于返回内容的描述:MIME类型, 长度, 等. 空格 返回内容
24
HTTP回答的格式
版本 状态码 原因 follows 服务器: 日期: 19:17:05 GMT 内容长度: 内容类型: 内容语言: 1996. 内容编码: 最后修改日期: (空一行) 实际信息 HTTP/1.0 status 200 Doc Server: NCSA/1.4 Date: Tue, 4 Jul, 1996, Content-length: 5280 Content-type: text/html Last-modified: Wed, 1 Jan (这里必须空一行) 文件的实际内容
5
Hypertext
通过“anchor”实现非线性文档
<A HREF=“http://www.pku.edu.cn”> Peking University </A>
1945年Vannevar Bush提出概念 1960年Douglas Engelbart做出一系统 (当时 并没有Internet) Web是Hypertext在Internet上的应用.
4
Web Document
multimedia: 多种数据类型共存于一个文档 中, text, image, sound, movie, .... 含有anchor/hyperlinks, 形成hypertext: “a mesh of documents tied by hyperlinks”. hypermedia:hypertext + multimedia active web pages: 含有在浏览器方可以执行 的程序,Java applet, JavaScript, …
Web基本工作原理
参考书: Web Server Technology, Nancy J. Yeager, Morgan Kaufmann Publishers, 1996
1
Web是Internet发展的产物
Internet --> 现代Internet = Web 继承:TCP/IP, MIME, Hypertext, … 发展:HTTP, HTML, URL (Tim BernersLee) (为方便起见,本讲区别Internet和Web)
15
Web(新)技术的三个方面(2)
HTTP, HyperText Transfer Protocol, “The lingua franca” of Web browsers and servers.
请求/响应(request-response)工作方式 利用TCP/IP实现浏览器和服务器之间的连接 为社么常听人们说“HTTP是无连接的协 议”?(connectionless) 还有说“HTTP是无状态的”?(stateless)
20
HTTP请求的四个组成部分
方法:指定对所请求对象的操作。 URI, Universal Resource Identifier, 标识 所请求的对象。URL的一个超集(HTTP实 际用的只是URL). [还有所谓URN, 试图将 信息资源的名字和位置分别开来] 协议版本号 其它信息(选项)
21
29
More attractive-adding links to other pages
<a href=“http://www.pku.edu.cn”>Peking University</a> 定义锚:
<a name=”anchor-one”>这是锚一所在位置</a>
引用锚:
详细内容请参阅<a href=”./one.html#anchorone”>锚一</a> 详细内容请参阅<a href=”#anchor-one”>锚一 </a>
25
一个例子:10钟速成HTML
< ! DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN" > <HTML> <HEAD> <TITLE>My first HTML document</TITLE> </HEAD> <BODY> <P>Hello world! </BODY> </HTML>
6
Web文档的分类(生成时间)
静态文档 动态文档 活动文档
7
Web多媒体文档在浏览器方的展现
浏览器事先对文档的内容一无所知, 为什么 能够将它显示成如文档编写者所设计的样子? 可能的做法之一: 让文档的编写者在文档头 部给出描述. Web的设计比这稍微进了一步: Web服务器 根据文件的扩展名来给出文档类型的宏观描 述, 这种描述借用了MIME标准.
18
Web服务器(软件)“很简单”!
它不懂HTML(浏览器必须懂!) 它对web文件的内容一概不关心(除后面 要讲到的特殊情况外) 它也不知道是否有别的文件指向它所管 辖的文件 它也不知道自己所给出的文件MIME类型 正确与否
19
HTTP: 请求与应答
规定了请求与应答的格式 没有规定网络连接的方式(通常采用 TCP/IP) 纯文本,没有特殊编码
3
什么是Web ?
运行在Internet之上的所有HTTP服务器软件 和它们所管理的对象(及其作用)的集合 不算浏览器软件?! 对象:Web page/Web document, 程序
web document: multimedia/active, 含有 hyperlinks/anchors 程序,动态生成web document. (dynamic document不同于active document)
13
Web(新)技术的三个方面(1)
(这里的“新”指的是web从无到有的“enabling technology”,即Tim Berners-Lee的最初贡献)
URL, Uniform Resource Locator. Web信息的 寻址系统(address system).
借用了DNS, Domain Name Service, 的mapping功 能
30
Three kinds of lists-unordered list
<ul> <li>the first list item</li> <li>the second list item</li> <li>the third list item</li> </ul>
31
Three kinds of lists-ordered list
http://arch.cs.pku.edu.cn --> http://162.105.181.215
协助HTTP将各种信息服务统一在浏览器中 ftp://162.105.181.215 --> 162.105.181.215:port
14
URL-- Web(新)技术的三个 方面(1)
格式: <scheme>:<scheme-specific-part> <scheme>指所用的URL方案名 <scheme-specific-part>意义的解释与 所用方案有关。 mailto:wangsq@net.cs.pku.edu.cn
2
什么是Internet ? (如何界定 Internet包含的所有计算机)
所有在DNS中有登记的计算机的集合 ? 所有具有IP地址的计算机的集合 ?(internet vs Internet) “公理”:总可以找到一台在Internet上的计算机. 那么,Internet即为从任何一台已在Internet中的计算 机可以用IP地址ping到的所有计算机的集合. 拨号上网的计算机算不算 ?