每个应用层协议都是为了解决某一类应用问题,而问题的解决又往往是通过位于不同主机中的多个应用进程之间的通信和协同工作来完成的。应用层的具体内容就是规定应用进程在通信时所遵循的协议。
应用层的许多协议都是基于客户服务器方式。客户(client)和服务器(server)都是指通信中所涉及的两个应用进程。客户服务器方式所描述的是进程之间服务和被服务的关系。客户是服务请求方,服务器是服务提供方。
许多应用层软件经常直接使用域名系统DNS(DomainNameSystem),但计算机的用户只是间接而不是直接使用域名系统。
互联网采用层次结构的命名树作为主机的名字,并使用分布式的域名系统DNS。
名字到IP地址的解析是由若干个域名服务器程序完成的。域名服务器程序在专设的结点上运行,运行该程序的机器称为域名服务器。
互联网采用了层次树状结构的命名方法。
任何一个连接在互联网上的主机或路由器,都有一个唯一的层次结构的名字,即域名。
域名的结构由标号序列组成,各标号之间用点隔开:….三级域名.二级域名.顶级域名
各标号分别代表不同级别的域名。
域名只是个逻辑概念
域名只是个逻辑概念,并不代表计算机所在的物理地点。
变长的域名和使用有助记忆的字符串,是为了便于人来使用。而IP地址是定长的32位二进制数字则非常便于机器进行处理。
域名中的“点”和点分十进制IP地址中的“点”并无一一对应的关系。点分十进制IP地址中一定是包含三个“点”,但每一个域名中“点”的数目则不一定正好是三个。
顶级域名TLD(TopLevelDomain)
(1)国家顶级域名nTLD.cn表示中国,.us表示美国,.uk表示英国,等等。
(2)通用顶级域名gTLD最早的顶级域名是:.com(公司和企业).net(网络服务机构.org(非赢利性组织).edu(美国专用的教育机构).gov(美国专用的政府部门).mil(美国专用的军事部门).int(国际组织)
(3)基础结构域名(infrastructuredomain)这种顶级域名只有一个,即arpa,用于反向域名解析,因此又称为反向域名。
新增加了下列的通用顶级域名
.aero(航空运输企业).biz(公司和企业).cat(加泰隆人的语言和文化团体).coop(合作团体).info(各种情况).jobs(人力资源管理者).mobi(移动产品与服务的用户和提供者).museum(博物馆).name(个人).pro(有证书的专业人员).travel(旅游业)
互联网的域名空间
一个服务器所负责管辖的(或有权限的)范围叫做区(zone)。
各单位根据具体情况来划分自己管辖范围的区。但在一个区中的所有节点必须是能够连通的。
每一个区设置相应的权限域名服务器,用来保存该区中的所有主机的域名到IP地址的映射。
DNS服务器的管辖范围不是以“域”为单位,而是以“区”为单位。
区的不同划分方法举例
树状结构的DNS域名服务器
域名服务器有以下四种类型
根域名服务器
根域名服务器是最高层次的域名服务器,也是最重要的域名服务器。所有的根域名服务器都知道所有的顶级域名服务器的域名和IP地址。
不管是哪一个本地域名服务器,若要对互联网上任何一个域名进行解析,只要自己无法解析,就首先求助于根域名服务器。
在互联网上共有13个不同IP地址的根域名服务器,它们的名字是用一个英文字母命名,从a一直到m(前13个字母)。
根域名服务器共有13套装置
根域名服务器共有13套装置,不是13个机器。这些根域名服务器相应的域名分别是:a.rootservers.netb.rootservers.net…m.rootservers.net到2016年2月,全世界已经在588个地点安装了根域名服务器,使世界上大部分DNS域名服务器都能就近找到一个根域名服务器。
举例:根域名服务器L的地点分布图
根域名服务器L分布在世界150个地点
根域名服务器并不直接把域名直接转换成IP地址。在使用迭代查询时,根域名服务器把下一步应当找的顶级域名服务器的IP地址告诉本地域名服务器。
顶级域名服务器
顶级域名服务器(即TLD服务器)负责管理在该顶级域名服务器注册的所有二级域名。
当收到DNS查询请求时,就给出相应的回答(可能是最后的结果,也可能是下一步应当找的域名服务器的IP地址)。
权限域名服务器
负责一个区的域名服务器。
当一个权限域名服务器还不能给出最后的查询回答时,就会告诉发出查询请求的DNS客户,下一步应当找哪一个权限域名服务器。
本地域名服务器
本地域名服务器对域名系统非常重要。
当一个主机发出DNS查询请求时,这个查询请求报文就发送给本地域名服务器。
每一个互联网服务提供者ISP,或一个大学,甚至一个大学里的系,都可以拥有一个本地域名服务器,
这种域名服务器有时也称为默认域名服务器。
提高域名服务器的可靠性
DNS域名服务器都把数据复制到几个域名服务器来保存,其中的一个是主域名服务器,其他的是辅助域名服务器。
当主域名服务器出故障时,辅助域名服务器可以保证DNS的查询工作不会中断。
主域名服务器定期把数据复制到辅助域名服务器中,而更改数据只能在主域名服务器中进行。这样就保证了数据的一致性。
**域名的解析过程**
主机向本地域名服务器的查询一般都是采用递归查询。如果主机所询问的本地域名服务器不知道被查询域名的IP地址,那么本地域名服务器就以DNS客户的身份,向其他根域名服务器继续发出查询请求报文。
本地域名服务器向根域名服务器的查询通常是采用迭代查询。当根域名服务器收到本地域名服务器的迭代查询请求报文时,要么给出所要查询的IP地址,要么告诉本地域名服务器:“你下一步应当向哪一个域名服务器进行查询”。然后让本地域名服务器进行后续的查询。
本地域名服务器采用迭代查询
本地域名服务器采用递归查询(比较少用)
名字的高速缓存
每个域名服务器都维护一个高速缓存,存放最近用过的名字以及从何处获得名字映射信息的记录。
可大大减轻根域名服务器的负荷,使互联网上的DNS查询请求和回答报文的数量大为减少。
文件传送协议FTP(FileTransferProtocol)是互联网上使用得最广泛的文件传送协议。
FTP提供交互式的访问,允许客户指明文件的类型与格式,并允许文件具有存取权限。
FTP屏蔽了各计算机系统的细节,因而适合于在异构网络中任意计算机之间传送文件。
RFC959很早就成为了互联网的正式标准。
文件传送并非很简单的问题文件传送并非很简单的问题
网络环境中的一项基本应用就是将文件从一台计算机中复制到另一台可能相距很远的计算机中。
初看起来,在两个主机之间传送文件是很简单的事情。
其实这往往非常困难。原因是众多的计算机厂商研制出的文件系统多达数百种,且差别很大。
网络环境下复制文件的复杂性:
(1)计算机存储数据的格式不同。(2)文件的目录结构和文件命名的规定不同。(3)对于相同的文件存取功能,操作系统使用的命令不同。(4)访问控制方法不同。
FTP特点
文件传送协议FTP只提供文件传送的一些基本的服务,它使用TCP可靠的运输服务。
FTP的主要功能是减少或消除在不同操作系统下处理文件的不兼容性。
FTP使用客户服务器方式。一个FTP服务器进程可同时为多个客户进程提供服务。FTP的服务器进程由两大部分组成:一个主进程,负责接受新的请求;另外有若干个从属进程,负责处理单个请求。
主进程的工作步骤
两个连接
控制连接在整个会话期间一直保持打开,FTP客户发出的传送请求通过控制连接发送给服务器端的控制进程,但控制连接不用来传送文件。
实际用于传输文件的是“数据连接”。服务器端的控制进程在接收到FTP客户发送来的文件传输请求后就创建“数据传送进程”和“数据连接”,用来连接客户端和服务器端的数据传送进程。
数据传送进程实际完成文件的传送,在传送完毕后关闭“数据传送连接”并结束运行。
**FTP使用的两个TCP连接**
两个不同的端口号
当客户进程向服务器进程发出建立连接请求时,要寻找连接服务器进程的熟知端口(21),同时还要告诉服务器进程自己的另一个端口号码,用于建立数据传送连接。
接着,服务器进程用自己传送数据的熟知端口(20)与客户进程所提供的端口号码建立数据传送连接。
由于FTP使用了两个不同的端口号,所以数据连接与控制连接不会发生混乱。
使用两个不同端口号的好处
使协议更加简单和更容易实现。
在传输文件时还可以利用控制连接(例如,客户发送请求终止传输)。
NFS采用另一种思路
TFTP(TrivialFileTransferProtocol)是一个很小且易于实现的文件传送协议。
TFTP使用客户服务器方式和使用UDP数据报,因此TFTP需要有自己的差错改正措施。
TFTP只支持文件传输而不支持交互。
TFTP没有一个庞大的命令集,没有列目录的功能,也不能对用户进行身份鉴别。
TFTP的主要特点
(1)每次传送的数据PDU中有512字节的数据,但最后一次可不足512字节。(2)数据PDU也称为文件块(block),每个块按序编号,从1开始。(3)支持ASCII码或二进制传送。(4)可对文件进行读或写。(5)使用很简单的首部。
TFTP的工作很像停止等待协议
发送完一个文件块后就等待对方的确认,确认时应指明所确认的块编号。
开始工作时,TFTP客户进程发送一个读请求PDU或写请求PDU给TFTP服务器进程,其熟知端口号码为69。
TFTP服务器进程要选择一个新的端口和TFTP客户进程进行通信。
若文件长度恰好为512字节的整数倍,则在文件传送完毕后,还必须在最后发送一个只含首部而无数据的数据PDU。
若文件长度不是512字节的整数倍,则最后传送数据PDU的数据字段一定不满512字节,这正好可作为文件结束的标志。
TELNET是一个简单的远程终端协议,也是互联网的正式标准。
TELNET能将用户的击键传到远地主机,同时也能将远地主机的输出通过TCP连接返回到用户屏幕。这种服务是透明的,因为用户感觉到好像键盘和显示器是直接连在远地主机上。
客户-服务器方式
现在由于PC的功能越来越强,用户已较少使用TELNET了。
TELNET也使用客户-服务器方式。在本地系统运行TELNET客户进程,而在远地主机则运行TELNET服务器进程。
和FTP的情况相似,服务器中的主进程等待新的请求,并产生从属进程来处理每一个连接。
TELNET使用网络虚拟终端NVT格式
网络虚拟终端NVT格式
客户软件把用户的击键和命令转换成NVT格式,并送交服务器。
服务器软件把收到的数据和命令,从NVT格式转换成远地系统所需的格式。
向用户返回数据时,服务器把远地系统的格式转换为NVT格式,本地客户再从NVT格式转换到本地系统所需的格式。
万维网WWW(WorldWideWeb)并非某种特殊的计算机网络。万维网是一个大规模的、联机式的信息储藏所。万维网用链接的方法能非常方便地从互联网上的一个站点访问另一个站点,从而主动地按需获取丰富的信息。这种访问方式称为“链接”。
**万维网提供分布式服务**
超媒体与超文本
万维网是分布式超媒体(hypermedia)系统,它是超文本(hypertext)系统的扩充。
一个超文本由多个信息源链接成。利用一个链接可使用户找到另一个文档。这些文档可以位于世界上任何一个接在互联网上的超文本系统中。超文本是万维网的基础。
超媒体与超文本的区别是文档内容不同。超文本文档仅包含文本信息,而超媒体文档还包含其他表示方式的信息,如图形、图像、声音、动画,甚至活动视频图像。
万维网的工作方式
万维网以客户服务器方式工作。
浏览器就是在用户计算机上的万维网客户程序。万维网文档所驻留的计算机则运行服务器程序,因此这个计算机也称为万维网服务器。
客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所要的万维网文档。
在一个客户程序主窗口上显示出的万维网文档称为页面(page)。
万维网必须解决的问题
(1)怎样标志分布在整个互联网上的万维网文档?
(2)用何协议实现万维网上各种超链的链接?
(3)怎样使各种万维网文档都能在互联网上的各种计算机上显示出来,同时使用户清楚地知道在什么地方存在着超链?
(4)怎样使用户能够很方便地找到所需的信息?
1.URL的格式
URL的一般形式
由以冒号隔开的两大部分组成,并且在URL中的字符对大写或小写没有要求。
URL的一般形式是:
2.使用HTTP的URL
这表示使用HTTP协议、冒号和两个斜线是规定的格式、这里写主机的域名、HTTP的默认端口号是80,通常可省略、若再省略文件的<路径>项,则URL就指到互联网上的某个主页(homepage)。
为了使超文本的链接能够高效率地完成,需要用HTTP协议来传送一切必须的信息。
从层次的角度看,HTTP是面向事务的(transaction-oriented)应用层协议,它是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。
万维网的工作过程
(1)浏览器分析超链指向页面的URL。(2)浏览器向DNS请求解析www.tsinghua.edu.cn的IP地址。(3)域名系统DNS解析出清华大学服务器的IP地址。(4)浏览器与服务器建立TCP连接。(5)浏览器发出取文件命令:GET/chn/yxsz/index.htm。(6)服务器给出响应,把文件index.htm发给浏览器。(7)TCP连接释放。(8)浏览器显示“清华大学院系设置”文件index.htm中的所有文本。
HTTP的主要特点
HTTP是面向事务的客户服务器协议。HTTP1.0协议是无状态的(stateless)。HTTP协议本身也是无连接的,虽然它使用了面向连接的TCP向上提供的服务。
持续连接
持续连接的两种工作方式
代理服务器(proxyserver)又称为万维网高速缓存(Webcache),它代表浏览器发出HTTP请求。万维网高速缓存把最近的一些请求和响应暂存在本地磁盘中。当与暂时存放的请求相同的新请求到达时,万维网高速缓存就把暂存的响应发送出去,而不需要按URL的地址再去互联网访问该资源。
使用高速缓存可减少访问互联网服务器的时延
没有使用高速缓存的情况
使用高速缓存的情况
(1)浏览器访问互联网的服务器时,要先与校园网的高速缓存建立TCP连接,并向高速缓存发出HTTP请求报文。
(2)若高速缓存已经存放了所请求的对象,则将此对象放入HTTP响应报文中返回给浏览器。
(3)否则,高速缓存就代表发出请求的用户浏览器,与互联网上的源点服务器建立TCP连接,并发送HTTP请求报文。
(4)源点服务器将所请求的对象放在HTTP响应报文中返回给校园网的高速缓存。
(5)高速缓存收到此对象后,先复制在其本地存储器中(为今后使用),然后再将该对象放在HTTP响应报文中,通过已建立的TCP连接,返回给请求该对象的浏览器。
HTTP有两类报文:
HTTP的报文结构(请求报文)
报文由三个部分组成,即开始行、首部行和实体主体。在请求报文中,开始行就是请求行。
HTTP请求报文的一些方法
HTTP的报文结构(响应报文)
响应报文的开始行是状态行。状态行包括三项内容,即HTTP的版本,状态码,以及解释状态码的简单短语。
状态码都是三位数字
1xx表示通知信息的,如请求收到了或正在进行处理。2xx表示成功,如接受或知道了。3xx表示重定向,表示要完成请求还必须采取进一步的行动。4xx表示客户的差错,如请求中有错误的语法或不能完成。5xx表示服务器的差错,如服务器失效无法完成请求。
万维网站点使用Cookie来跟踪用户。Cookie表示在HTTP服务器和客户之间传递的状态信息。使用Cookie的网站服务器为用户产生一个唯一的识别码。利用此识别码,网站就能够跟踪该用户在该网站的活动。
超文本标记语言HTML中的Markup的意思就是“设置标记”。HTML定义了许多用于排版的命令(即标签)。HTML把各种标签嵌入到万维网的页面中。这样就构成了所谓的HTML文档。HTML文档是一种可以用任何文本编辑器创建的ASCII码文件。
HTML文档
仅当HTML文档是以.html或.htm为后缀时,浏览器才对此文档的各种标签进行解释。如HTML文档改换以.txt为其后缀,则HTML解释程序就不对标签进行解释,而浏览器只能看见原来的文本文件。当浏览器从服务器读取HTML文档后,就按照HTML文档中的各种标签,根据浏览器所使用的显示器的尺寸和分辨率大小,重新进行排版并恢复出所读取的页面。
HTML文档中标签的用法
HTML很容易掌握
这是第一个段落。虽然很短,但它仍是一个段落。
这是第二个段落。
两种不同的链接HTML还规定了链接的设置方法。每个链接都有一个起点和终点。远程链接:超链的终点是其他网点上的页面。本地链接:超链指向本计算机中的某个文件。
XML
XML(ExtensibleMarkupLanguage)是可扩展标记语言,它和HTML很相似。
但XML的设计宗旨是传输数据,而不是显示数据(HTML是为了在浏览器上显示数据)。
XML不是要替换HTML,而是对HTML的补充。
XHTML
XHTML(ExtensibleHTML)是可扩展超文本标记语言,它与HTML4.01几乎是相同的。
但XHTML是更严格的HTML版本,也是一个W3C标准(2000年1月),是作为一种XML应用被重新定义的HTML,并将逐渐取代HTML。
新的浏览器都支持XHTML。
CSS
CSS(CascadingStyleSheets)是层叠样式表,它是一种样式表语言,用于为HTML文档定义布局。
CSS与HTML的区别就是:HTML用于结构化内容,而CSS则用于格式化结构化的内容。
静态文档是指该文档创作完毕后就存放在万维网服务器中,在被用户浏览的过程中,内容不会改变。
动态文档是指文档的内容是在浏览器访问万维网服务器时才由应用程序动态创建。
动态文档和静态文档之间的主要差别体现在服务器一端。这主要是文档内容的生成方法不同。而从浏览器的角度看,这两种文档并没有区别。
**万维网服务器功能的扩充**
(1)应增加另一个应用程序,用来处理浏览器发来的数据,并创建动态文档。(2)应增加一个机制,用来使万维网服务器把浏览器发来的数据传送给这个应用程序,然后万维网服务器能够解释这个应用程序的输出,并向浏览器返回HTML文档。
扩充了功能的万维网服务器
通用网关接口CGI
CGI程序
CGI程序的正式名字是CGI脚本(script)。“脚本”指的是一个程序,它被另一个程序(解释程序)而不是计算机的处理机来解释或执行。脚本运行起来要比一般的编译程序要慢,因为它的每一条指令先要被另一个程序来处理(这就要一些附加的指令),而不是直接被指令处理器来处理。
活动文档(activedocument)技术把所有的工作都转移给浏览器端。每当浏览器请求一个活动文档时,服务器就返回一段程序副本在浏览器端运行。活动文档程序可与用户直接交互,并可连续地改变屏幕的显示。由于活动文档技术不需要服务器的连续更新传送,对网络带宽的要求也不会太高。
活动文档在客户端创建
用Java技术创建活动文档
由美国Sun公司开发的Java语言是一项用于创建和运行活动文档的技术。
在Java技术中使用“小应用程序”(applet)来描述活动文档程序。
用户从万维网服务器下载嵌入了Java小应用程序的HTML文档后,可在浏览器的屏幕上点击某个图像,就可看到动画效果,或在下拉式菜单中点击某个项目,就可看到计算结果。
Java技术是活动文档技术的一部分。
Java技术有三个主要组成部分
(1)程序设计语言。Java包含一个新的程序设计语言,用来编写传统的计算机程序和Java小应用程序。(2)运行(runtime)环境。这是运行Java程序所必须的运行环境,其中包括Java虚拟机(简称为JVM),该软件定义了Java二进制代码的执行模型。(3)类库(classlibrary)。为了更容易编写Java小应用程序,Java提供了强大的类库支持。
Java
Java是一种面向对象的高级语言,从C++派生出来的,它省略了C++很多复杂的、很少用的语言特点。Java的每一个数据项都有一个确定的类型。对数据的操作严格按照该数据的类型来进行。Java的编译程序将源程序转换成Java字节码(bytecode),这是一种与机器无关的二进制代码。计算机程序调用解释程序读取字节码,并解释执行。
计算机硬件无关
Java语言、字节码以及Java运行系统都被设计成与计算机硬件无关。一旦形成了字节码,就可在任何计算机上运行并产生相同的输出。Java小应用程序与机器无关可使在任何计算机上运行的浏览器程序能够下载并运行活动文档。可保证活动文档在所有的浏览器上产生同样的正确输出。可大大地降低活动文档的创建和测试费用,因为不必为每一种计算机都制作一个副本。
Java解释程序
运行Java的浏览器需要有HTML解释程序和Java小应用程序解释程序。解释程序的核心是一个模仿计算机的简单循环。解释程序维持一个指令指针,在初始化时指在小应用程序的开始处。在每一次循环操作时,解释程序在指令指针指向的地址读取字节码。然后解释程序对字节码进行解码,并完成指明的操作。
在万维网中用来进行搜索的程序叫做搜索引擎。全文检索搜索引擎是一种纯技术型的检索工具。它的工作原理是通过搜索软件到互联网上的各网站收集信息,找到一个网站后可以从这个网站再链接到另一个网站。然后按照一定的规则建立一个很大的在线数据库供用户查询。用户在查询时只要输入关键词,就从已经建立的索引数据库上进行查询(并不是实时地在互联网上检索到的信息)。
分类目录搜索
分类目录搜索也叫做分类网站搜索。
一些著名的搜索引擎
最著名的全文检索搜索引擎:
最著名的分类目录搜索引擎:
垂直搜索引擎
垂直搜索引擎(VerticalSearchEngine)针对某一特定领域、特定人群或某一特定需求提供搜索服务。
垂直搜索也是提供关键字来进行搜索的,但被放到了一个行业知识的上下文中,返回的结果更倾向于信息、消息、条目等。
Weblog这个新词是JornBarger于1997年创造的。
简写的blog(这是今天最常用的术语)则是PeterMerholz于1999年创造的。
有人把blog既当作名词,也当作动词,表示编辑博客或写博客。
博客已经极大地扩充了互联网的应用和影响。
在博客出现以前,网民是互联网上内容的消费者。
但博客改变了这种情况,网民不仅是互联网上内容的消费者,而且还是互联网上内容的生产者。
微博就是微型博客(microblog),又称为微博客。
微博不同于一般的博客。微博只记录片段、碎语,三言两语,现场记录,发发感慨,晒晒心情,永远只针对一个问题进行回答。
用户可以通过网页、WAP网、手机短信彩信、手机客户端等多种方式更新自己的微博。
每条微博字数限制为140字,提供插入单张图片、视频地址、音乐功能。
轻博就是轻博客(lightblogging)。
轻博客是一种介于博客和微博之间的网络服务,同样为用户提供生成内容表达自己的平台。
轻博可以发送博文,没有字数限制。
轻博发表后,其界面会好看些。
在轻博中,推荐与发现的内容比较丰富。
社交网站SNS(SocialNetworkingSite)是近年来发展非常迅速的一种网站,其作用是为一群拥有相同兴趣与活动的人创建在线社区。
2004年社交网站脸书(Facebook,又名面书、脸谱、脸谱网)在美国诞生。
国内以人人网、开心网等为代表的社交网站也如雨后春笋般迅速崛起。
目前世界上排名第一且分布最广的社交网站是脸书。
另一种能够提供微博服务的社交网络现在也很流行。例如推特Twitter(twitter.com)网站可以让用户发表不超过140个字符的消息。这些消息也被称为“推文”(Tweet)。
我国的新浪微博(www.weibo.com)、腾讯微博(t.qq.com)等就是这种性质的社交网站。
职业性社交网站领英LinkedIn也很受欢迎。
电子邮件(e-mail)是互联网上使用得最多的和最受用户欢迎的一种应用。
电子邮件不仅使用方便,而且还具有传递迅速和费用低廉的优点。
现在电子邮件不仅可传送文字信息,而且还可附上声音和图像。
电子邮件的一些标准
发送邮件的协议:SMTP
读取邮件的协议:POP3和IMAP
MIME在其邮件首部中说明了邮件的数据类型(如文本、声音、图像、视像等),使用MIME可在邮件中同时传送多种类型的数据。
电子邮件的最主要的组成构件
用户代理UA(UserAgent)
用户代理UA就是用户与电子邮件系统的接口,是电子邮件客户端软件。
用户代理的功能:撰写、显示、处理和通信。
邮件服务器的功能是发送和接收邮件,同时还要向发信人报告邮件传送的情况(已交付、被拒绝、丢失等)。
邮件服务器按照客户服务器方式工作。邮件服务器需要使用发送和读取两个不同的协议。
应当注意
一个邮件服务器既可以作为客户,也可以作为服务器。
例如,当邮件服务器A向另一个邮件服务器B发送邮件时,邮件服务器A就作为SMTP客户,而B是SMTP服务器。
当邮件服务器A从另一个邮件服务器B接收邮件时,邮件服务器A就作为SMTP服务器,而B是SMTP客户。
发送和接收电子邮件的几个重要步骤
请注意,POP3服务器和POP3客户之间的通信是由POP3客户发起的。
电子邮件的组成
电子邮件由信封(envelope)和内容(content)两部分组成。
在邮件的信封上,最重要的就是收件人的地址。
电子邮件地址的格式
xiexiren这个用户名在该域名的范围内是唯一的。
SMTP所规定的就是在两个相互通信的SMTP进程之间应如何交换信息。
由于SMTP使用客户服务器方式,因此负责发送邮件的SMTP进程就是SMTP客户,而负责接收邮件的SMTP进程就是SMTP服务器。
SMTP规定了14条命令和21种应答信息。每条命令用4个字母组成,而每一种应答信息一般只有一行信息,由一个3位数字的代码开始,后面附上(也可不附上)很简单的文字说明。
SMTP通信的三个阶段
一个电子邮件分为信封和内容两大部分。
RFC822只规定了邮件内容中的首部(header)格式,而对邮件的主体(body)部分则让用户自由撰写。
用户写好首部后,邮件系统将自动地将信封所需的信息提取出来并写在信封上。所以用户不需要填写电子邮件信封上的信息。
邮件内容首部包括一些关键字,后面加上冒号。最重要的关键字是:To和Subject。
邮件内容的首部
“To:”后面填入一个或多个收件人的电子邮件地址。用户只需打开地址簿,点击收件人名字,收件人的电子邮件地址就会自动地填入到合适的位置上。“Subject:”是邮件的主题。它反映了邮件的主要内容,便于用户查找邮件。“Cc:”表示应给某某人发送一个邮件副本。“From”和“Date”表示发信人的电子邮件地址和发信日期。“Reply-To”是对方回信所用的地址。
邮局协议POP是一个非常简单、但功能有限的邮件读取协议,现在使用的是它的第三个版本POP3。POP也使用客户-服务器的工作方式。在接收邮件的用户PC机中必须运行POP客户程序,而在用户所连接的ISP的邮件服务器中则运行POP服务器程序。
IMAP协议
IMAP(InternetMessageAccessProtocol)也是按客户服务器方式工作,现在较新的是版本4,即IMAP4。
IMAP的特点
IMAP最大的好处就是用户可以在不同的地方使用不同的计算机随时上网阅读和处理自己的邮件。
IMAP的缺点是如果用户没有将邮件复制到自己的PC上,则邮件一直是存放在IMAP服务器上。因此用户需要经常与IMAP服务器建立连接。
必须注意
不要将邮件读取协议POP或IMAP与邮件传送协议SMTP弄混。
发信人的用户代理向源邮件服务器发送邮件,以及源邮件服务器向目的邮件服务器发送邮件,都是使用SMTP协议。
而POP协议或IMAP协议则是用户从目的邮件服务器上读取邮件所使用的协议。
电子邮件从A发送到网易邮件服务器使用HTTP协议。
两个邮件服务器之间的传送使用SMTP。
邮件从新浪邮件服务器传送到B是使用HTTP协议。
万维网电子邮件的好处:只要能够找到上网的计算机,打开任何一种浏览器就可以非常方便地收发电子邮件。
SMTP有以下缺点:
通用互联网邮件扩充MIME并没有改动SMTP或取代它。
MIME的意图是继续使用目前的[RFC822]格式,但增加了邮件主体的结构,并定义了传送非ASCII码的编码规则。
MIME和SMTP的关系
MIME主要包括三个部分
5个新的邮件首部字段,它们可包含在[RFC822]首部中。这些字段提供了有关邮件主体的信息。
定义了许多邮件内容的格式,对多媒体电子邮件的表示方法进行了标准化。
定义了传送编码,可对任何内容格式进行转换,而不会被邮件系统改变。
MIME增加5个新的邮件首部
MIME-Version:标志MIME的版本。现在的版本号是1.0。若无此行,则为英文文本。
Content-Description:这是可读字符串,说明此邮件是什么。和邮件的主题差不多。
Content-Id:邮件的唯一标识符。
Content-Transfer-Encoding:在传送时邮件的主体是如何编码的。
Content-Type:说明邮件的性质。
最简单的编码就是7位ASCII码,而每行不能超过1000个字符。MIME对这种由ASCII码构成的邮件主体不进行任何转换。
另一种编码称为quoted-printable,这种编码方法适用于当所传送的数据中只有少量的非ASCII码。
对于任意的二进制文件,可用base64编码。
MIME着标准规定Content-Type说明必须含有两个标识符,即内容类型(type)和子类型(subtype),中间用“/”分开。
MIME标准定义了7个基本内容类型和15种子类型。
MIMEContent-Type说明中的类型及子类型
为了将软件协议做成通用的和便于移植,协议软件的编写者把协议软件参数化。这就使得在很多台计算机上使用同一个经过编译的二进制代码成为可能。
一台计算机和另一台计算机的区别,都可通过一些不同的参数来体现。
在软件协议运行之前,必须给每一个参数赋值。
协议配置
在协议软件中给这些参数赋值的动作叫做协议配置。
一个软件协议在使用之前必须是已正确配置的。
具体的配置信息有哪些则取决于协议栈。
需要配置的项目(1)IP地址(2)子网掩码(3)默认路由器的IP地址(4)域名服务器的IP地址
这些信息通常存储在一个配置文件中,计算机在引导过程中可以对这个文件进行存取。
动态主机配置协议DHCP
互联网广泛使用的动态主机配置协议DHCP(DynamicHostConfigurationProtocol)提供了即插即用连网(plug-and-playnetworking)的机制。
这种机制允许一台计算机加入新的网络和获取IP地址而不用手工参与。
DHCP使用客户-服务器方式
需要IP地址的主机在启动时就向DHCP服务器广播发送发现报文(DHCPDISCOVER),这时该主机就成为DHCP客户。
本地网络上所有主机都能收到此广播报文,但只有DHCP服务器才回答此广播报文。
DHCP服务器先在其数据库中查找该计算机的配置信息。若找到,则返回找到的信息。若找不到,则从服务器的IP地址池(addresspool)中取一个地址分配给该计算机。DHCP服务器的回答报文叫做提供报文(DHCPOFFER)。
DHCP中继代理(relayagent)
并不是每个网络上都有DHCP服务器,这样会使DHCP服务器的数量太多。现在是每一个网络至少有一个DHCP中继代理,它配置了DHCP服务器的IP地址信息。
当DHCP中继代理收到主机发送的发现报文后,就以单播方式向DHCP服务器转发此报文,并等待其回答。收到DHCP服务器回答的提供报文后,DHCP中继代理再将此提供报文发回给主机。
DHCP中继代理以单播方式转发发现报文
租用期(leaseperiod)
租用期的数值应由DHCP服务器自己决定。
DHCP客户也可在自己发送的报文中(例如,发现报文)提出对租用期的要求。
DHCP协议的工作过程
1:DHCP服务器被动打开UDP端口67,等待客户端发来的报文。
2:DHCP客户从UDP端口68发送DHCP发现报文。
3:凡收到DHCP发现报文的DHCP服务器都发出DHCP提供报文,因此DHCP客户可能收到多个DHCP提供报文。
4:DHCP客户从几个DHCP服务器中选择其中的一个,并向所选择的DHCP服务器发送DHCP请求报文。
6:被选择的DHCP服务器发送确认报文DHCPACK,进入已绑定状态,并可开始使用得到的临时IP地址了。
7:DHCP服务器若同意,则发回确认报文DHCPACK。DHCP客户得到了新的租用期,重新设置计时器。
8:DHCP服务器若不同意,则发回否认报文DHCPNACK。这时DHCP客户必须立即停止使用原来的IP地址,而必须重新申请IP地址(回到步骤2)。
若DHCP服务器不响应步骤6的请求报文DHCPREQUEST,则在租用期过了87.5%时,DHCP客户必须重新发送请求报文DHCPREQUEST(重复步骤6),然后又继续后面的步骤。
9:DHCP客户可随时提前终止服务器所提供的租用期,这时只需向DHCP服务器发送释放报文DHCPRELEASE即可。
网络管理包括对硬件、软件和人力的使用、综合与协调,以便对网络资源进行监视、测试、配置、分析、评价和控制,这样就能以合理的价格满足网络的一些需求,如实时运行性能,服务质量等。网络管理常简称为网管。
网络管理并不是指对网络进行行政上的管理。
网络管理的一般模型
网络管理模型中的主要构件
管理站也常称为网络运行中心NOC(NetworkOperationsCenter),是网络管理系统的核心。
管理程序在运行时就成为管理进程。
管理站(硬件)或管理程序(软件)都可称为管理者(manager)。
Manager不是指人而是指机器或软件。
网络管理员(administrator)指的是人。大型网络往往实行多级管理,因而有多个管理者,而一个管理者一般只管理本地网络的设备。
被管对象(ManagedObject)。
网络的每一个被管设备中可能有多个被管对象。被管设备有时可称为网络元素或网元。在被管设备中也会有一些不能被管的对象。
代理(agent)
在每一个被管设备中都要运行一个程序以便和管理站中的管理程序进行通信。这些运行着的程序叫做网络管理代理程序,或简称为代理。
代理程序在管理程序的命令和控制下在被管设备上采取本地的行动。
网络管理协议
网络管理协议简称为网管协议。
需要注意的是,并不是网管协议本身来管理网络。网管协议是管理程序和代理程序之间进行通信的规则。
网络管理员利用网管协议通过管理站对网络中的被管设备进行管理。
客户服务器方式
管理程序和代理程序按客户服务器方式工作。
管理程序运行SNMP客户程序,向某个代理程序发出请求(或命令),代理程序运行SNMP服务器程序,返回响应(或执行某个动作)。
在网管系统中往往是一个(或少数几个)客户程序与很多的服务器程序进行交互。
网络管理的基本原理
若要管理某个对象,就必然会给该对象添加一些软件或硬件,但这种“添加”必须对原有对象的影响尽量小些。
SNMP的指导思想
SNMP最重要的指导思想就是要尽可能简单。
SNMP的基本功能包括监视网络性能、检测分析网络差错和配置网络设备等。
在网络正常工作时,SNMP可实现统计、配置、和测试等功能。当网络出故障时,可实现各种差错检测和恢复功能。
虽然SNMP是在TCP/IP基础上的网络管理协议,但也可扩展到其他类型的网络设备上。
SNMP的管理站和委托代理
整个系统必须有一个管理站。
管理进程和代理进程利用SNMP报文进行通信,而SNMP报文又使用UDP来传送。
若网络元素使用的不是SNMP而是另一种网络管理协议,SNMP协议就无法控制该网络元素。这时可使用委托代理(proxyagent)。委托代理能提供如协议转换和过滤操作等功能对被管对象进行管理。
SNMP网络管理组成
SNMP的网络管理由三个部分组成:
SNMP
SNMP定义了管理站和代理之间所交换的分组格式。所交换的分组包含各代理中的对象(变量)名及其状态(值)。
SNMP负责读取和改变这些数值。
SMI
SMI定义了命名对象和定义对象类型(包括范围和长度)的通用规则,以及把对象和对象的值进行编码的规则。
这样做是为了确保网络管理数据的语法和语义的无二义性。但从SMI的名称并不能看出它的功能。
SMI并不定义一个实体应管理的对象数目,也不定义被管对象名以及对象名及其值之间的关联。
MIB
MIB在被管理的实体中创建了命名对象,并规定了其类型。
SMI的功能:(1)被管对象应怎样命名;(2)用来存储被管对象的数据类型有哪些种;(3)在网络上传送的管理数据应如何编码。
SMI规定所有被管对象必须在命名树上
SMI使用ASN.1
SMI标准指明了所有的MIB变量必须使用抽象语法记法1(ASN.1)来定义。
SMI既是ASN.1的子集,又是ASN.1的超集。
ASN.1的记法很严格,它使得数据的含义不存在任何可能的二义性。
SMI把数据类型分为两大类:简单类型和结构化类型。
基本编码规则BER
ISO在制订ASN.1语言的同时也为它定义了一种标准的编码方案,即基本编码规则BER(BasicEncodingRule)。
BER指明了每种数据类型中每个数据的值的表示。
发送端用BER编码,可将用ASN.1所表述的报文转换成唯一的比特序列。接收端用BER进行解码,得到该比特序列所表示的ASN.1报文。
用TLV方法进行编码
把各种数据元素表示为以下三个字段组成的八位位组序列:(1)T字段,即标识符八位位组(identifieroctet),用于标识标记。(2)L字段,即长度用八位位组(lengthoctet),用于标识后面V字段的长度。(3)V字段,即内容八位位组(contentoctet),用于标识数据元素的值。
TLV中的T字段定义数据的类型
TLV中的L字段定义V字段的长度
TLV中的V字段定义数据的值
例如,INTEGER15,其T字段是02,INTEGER类型要用4字节编码。最后得出TLV编码为02040000000F。
又如IPAddress192.1.2.3,其T字段是40,V字段需要4字节表示,因此得出IPAddress192.1.2.3的TLV编码是4004C0010203。
被管对象必须维持可供管理程序读写的若干控制和状态信息。这些信息总称为管理信息库MIB(ManagementInformationBase)。
管理程序使用MIB中这些信息的值对网络进行管理(如读取或重新设置这些值)。
节点mib-2所包含的信息类别举例
SNMP的操作只有两种基本的管理功能:
SNMP的这些功能通过探询操作来实现。
SNMP的探询操作
探询操作——SNMP管理进程定时向被管理设备周期性地发送探询信息。
探询的好处是:
但探询管理协议不够灵活,而且所能管理的设备数目不能太多。探询系统的开销也较大。如探询频繁而并未得到有用的报告,则通信线路和计算机的CPU周期就被浪费了。
陷阱(trap)
SNMP不是完全的探询协议,它允许不经过询问就能发送某些信息。这种信息称为陷阱,表示它能够捕捉“事件”。
这种陷阱信息的参数是受限制的。
当被管对象的代理检测到有事件发生时,就检查其门限值。代理只向管理进程报告达到某些门限值的事件(即过滤)。过滤的好处是:
SNMP是有效的网络管理协议
使用探询(至少是周期性地)以维持对网络资源的实时监视,同时也采用陷阱机制报告特殊事件,使得SNMP成为一种有效的网络管理协议。
SNMP使用无连接的UDP
SNMP使用无连接的UDP,因此在网络上传送SNMP报文的开销较小。但UDP不保证可靠交付。
在运行代理程序的服务器端用熟知端口161来接收get或set报文和发送响应报文(与熟知端口通信的客户端使用临时端口)。
运行管理程序的客户端则使用熟知端口162来接收来自各代理的trap报文。
SNMPv1定义的协议数据单元类型(无编号4)
SNMP的报文格式
Get-request报文ASN.1编码
大多数操作系统使用系统调用(systemcall)的机制在应用程序和操作系统之间传递控制权。
对程序员来说,每一个系统调用和一般程序设计中的函数调用非常相似,只是系统调用是将控制权传递给了操作系统。
多个应用进程使用系统调用的机制
应用编程接口API
当某个应用进程启动系统调用时,控制权就从应用进程传递给了系统调用接口。
此接口再将控制权传递给计算机的操作系统。操作系统将此调用转给某个内部过程,并执行所请求的操作。
内部过程一旦执行完毕,控制权就又通过系统调用接口返回给应用进程。
系统调用接口实际上就是应用进程的控制权和操作系统的控制权进行转换的一个接口,即应用编程接口API(ApplicationProgrammingInterface)
几种应用编程接口API
BerkeleyUNIX操作系统定义了一种API,它又称为套接字接口(socketinterface)。
微软公司在其操作系统中采用了套接字接口API,形成了一个稍有不同的API,并称之为WindowsSocket。
AT&T为其UNIX系统V定义了一种API,简写为TLI(TransportLayerInterface)。
应用进程通过套接字接入到网络
套接字的作用
当应用进程需要使用网络进行通信时就发出系统调用,请求操作系统为其创建“套接字”,以便把网络通信所需要的系统资源分配给该应用进程。
操作系统为这些资源的总和用一个叫做套接字描述符的号码来表示,并把此号码返回给应用进程。应用进程所进行的网络操作都必须使用这个号码。
调用socket创建套接字
并发方式工作的服务器
调用accept要完成的动作较多。这是因为一个服务器必须能够同时处理多个连接。这样的服务器常称为并发方式(concurrent)工作的服务器。
客户和服务器都在TCP连接上使用send系统调用传送数据,使用recv系统调用接收数据。
通常客户使用send发送请求,而服务器使用send发送回答。
服务器使用recv接收客户用send调用发送的请求。客户在发完请求后用recv接收回答。
一旦客户或服务器结束使用套接字,就把套接字撤消。这时就调用close释放连接和撤销套接字。
系统调用使用顺序的例子
P2P工作方式概述
自从互联网能够提供音频/视频服务后,宽带上网用户数也急剧增长。很多用户使用宽带接入的目的就是为了更快地下载音频/视频文件。
P2P工作方式受到广大网民的欢迎。这种工作方式解决了集中式媒体服务器可能出现的瓶颈问题。
在P2P工作方式下,所有的音频/视频文件都是在普通的互联网用户之间传输。这是相当于有很多分散在各地的媒体服务器向其他用户提供所要下载的音频/视频文件。
在互联网流量中,P2P工作方式下的文件分发已占据了最大的份额,比万维网应用所占的比例大得多。
最早出现的P2P技术,可提供免费下载MP3音乐。
Napster能够搜索音乐文件,能够提供检索功能。所有的音乐文件地址集中存放在一个Napster目录服务器中。使用者可很方便地下载需要的MP3文件。
用户要及时向Napster的目录服务器报告自己存有的音乐文件。当用户想下载某个MP3文件时,就向目录服务器发出询问。目录服务器检索出结果后向用户返回存放此文件的PC机的IP地址。Napster的文件传输是分散的,但文件的定位则是集中的。
Gnutella是第二代P2P文件共享程序,采用全分布方法定位内容的P2P文件共享应用程序。
Gnutella与Napster最大的区别就是不使用集中式的目录服务器,而是使用洪泛法在大量Gnutella用户之间进行查询。
为了不使查询的通信量过大,Gnutella设计了一种有限范围的洪泛查询。这样可以减少倾注到互联网的查询流量,但由于查询的范围受限,因而这也影响到查询定位的准确性。
电骡eMule使用分散定位和分散传输技术,把每一个文件划分为许多小文件块,并使用多源文件传输协议MFTP进行传送。因此用户可以同时从很多地方下载一个文件中的不同文件块。由于每一个文件块都很小,并且是并行下载,所以下载可以比较快地完成。
eMule用户在下载文件的同时,也在上传文件,因此,互联网上成千上万的eMule用户在同时下载和上传一个个小的文件块。
eMule的其他特点
eMule使用了一些服务器。这些服务器并不是保存音频/视频文件,而是保存用户的有关信息,因而可以告诉用户从哪些地方可以下载到所需的文件。
eMule使用了专门定义的文件夹,让用户存放可以和其他用户共享的文件。
eMule的下载文件规则是鼓励用户向其他用户上传文件。用户上传文件越多,其下载文件的优先级就越高(因而下载就越快)。
使用P2P的比特洪流BT
BitTorrent所有对等方集合称为一个洪流(torrent),下载文件的数据单元为长度固定的文件块(chunk)。基础设施结点,叫做追踪器(tracker)。
BT协议
当一个新的对等方A加入洪流时,追踪器就随机地从参与的对等方集合中选择若干个(例如,30个),并把这些对等方的IP地址告诉A。于是A就和这些对等方建立了TCP连接。所有与A建立了TCP连接的对等方为“相邻对等方”(neighboringpeers)。
A使用最稀有的优先(rarestfirst)的技术,首先向其相邻对等方请求对应的文件块。
凡当前以最高数据率向A传送文件块的某相邻对等方,A就优先把所请求的文件块传送给该相邻对等方。
有N台主机从服务器下载一个大文件,其长度为Fbit。假定主机与互联网连接的链路的上传速率和下载速率分别为ui和di,单位都是bit/s。
现在广泛使用的索引和查找技术叫做分布式散列表DHT(DistributedHashTable)。DHT也可译为分布式哈希表,它是由大量对等方共同维护的散列表。
广泛使用的Chord算法是美国麻省理工大学于2001年提出的。
分布式散列表DHT利用散列函数,把资源名K及其存放的结点IP地址N都分别映射为资源名标识符KID和结点标识符NID。
Chord把结点按标识符数值从小到大沿顺时针排列成一个环形覆盖网络。