超文本与超媒体
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
超文本与超媒体的核心组成部分是节点和超链。
本章将围绕节点与超链介绍超文本与超媒体的基本概念、超文本传输协议、超文本标记语言、动态网站设计技术简介和语义网的基本概念。
4.1.1 文本及多媒体
对于text和document在计算机词典中有不同的定义。
1991年出版的教科书《超文本:从文本到专家文本》( Hypertext: from text to
expertext )的作者认为,当文本和文档主要包含了自然语言字符和图画时,二者是同
义词。
我们暂且认为它们是同义词。
在人类历史的长河中,文本或文档的作用主要用于
表示和表达人类的思想。
从六千年前刻在古埃及石窟中的纪录,到600年前印刷术诞生
后只有像宗教界领袖才能使用纸制书籍,发展到20世纪六十年代以后,电子出版形式
的文本、图片、影视节目直到Internet网在全球迅速蔓延,从网上直接阅读超文本,
超媒体五彩缤纷的内容,都是人们用来表达和交换思想的方式。
多媒体按照本书第一章的定义,是指由图、文、声、像多种形式组成的媒体。
4.1.2超文本、超链带来的根本变化
超文本由节点与超链组成。
超文本的阅读与普通文本不同。
普通文本是一行接一行,
一页接一页顺序阅读的;而超文本中由于超链的作用,文本的阅读可以跳转,如图4-1
所示。
图4-1 文本的阅读
假如我手头有一本关于word的使用手册,我想了解如何插入文字、图片、如何存
盘。
按照常规,即使不是从头到尾一页一页读下去,至少也需一页一页翻过去找到所需
要的内容。
如果在计算机上利用联机帮助(On-line help)情况就完全不同了。
我可以在帮助的导航图上找到文字插入,或图片插入,直接跳转到感兴趣的内容。
这种功能在信息量大的情况下(例如百科全书)更能显示出优越性。
一般来讲,在文本之间利用超链实现非线性阅读,分为N-N(节点到节点)、N-P(节点到点)、P-P(点到点)三种类型。
图4-1 b明确地表示这三种类型的区别:P-N的链接表示用户要求把插入的部分文字存盘;N-N链表示要求将绘制的整幅图存盘;P-P链表示要求将绘制的某个图元以某种指定的格式存在某个位置上等等。
超文本链接的不同节点,可以在同一台机器上,也可以在局域网甚至Internet网的不同机器上。
例如,我们制作的“计算机网络”远程教学课件有关TCP/IP协议部分,讲述IPV.4的内容可以放在本地的课件中。
而有关下一代IPV.6的知识内容可以放在清华大学的IPV.6实验床的主页上。
由于该实验室研究的内容不断更新,他们负责维护这部分并进行扩充,只要有超链指向这个不断更新的知识点,学生即可获得国内最新的相关内容。
如果说把全世界成千上万台计算机连接在一起构成互联网(Internet)靠的是包交换技术和TCP/IP协议,那么将全球范围的成千上万个由文本、图形及音、视频组成的网页连接在一起形成万维网(WWW)靠的则是超文本、超媒体技术和HTTP协议。
因此,可以说网络和超链从根本上改变了人们的工作、生活以至于交往和思维方式。
4.1.3超文本的发展历史
超文本概念的产生早于计算机的诞生。
1939年美国著名科学家V. Bush担心科学信息量迅速增长,致使某一门学科的专家也不可能跟踪该学科的发展。
自从印刷术发明以来,共享与表现信息的手段很少,而传统的顺序检索方法存在着很多弊病。
1945年Bush撰写的论文“As We May Think”描述了一个超文本系统Memex(Memory Extender),目的是扩充个人大脑的记忆能力。
按照今天的观点,Memex可以称为是个人的知识管理系统或数字图书馆。
这个系统主要有两个特点,第一属于个人。
考虑到将来可以为每个人设计一个机械地存储个人文件和图书的装置,只要使用者随机地起一个名字,并设计好装置的功能,Memex就能以缩微胶卷的形式存储书籍、照片、记录和信件,并且在页边加注释和说明;第二个特点,这种装置与人类大脑的工作方式非常接近,是以联想存储,而不是地址寻址方式进行存储。
他说:“人的大脑通过联想方式进行操作。
”一旦
某个想法或事物被抓住,联想记忆便会建议立即获得与大脑神经细胞构成的复杂网络中的内容相一致的“快照”(snap)。
超媒体就是一种允许读者跟随文档作者的联想思路和记忆进行思考的方式。
从1962年到1967年D.Englebart在斯坦福研究所开发了一个项目叫Augment,致力于扩大人类的能力。
该项目的一部分称为NLS(ON Line System)在线系统,具有超文本的性质。
NLS可以把存储的文本都连在一起。
在该项目中工作的所有科学家都使用指针一起协同工作。
最后,该项目大约有10万个指针入口。
1965年,在美国一大书刊公司工作的Ted Nelson第一次使用hypertext这个词。
当时他正在开发超文本系统“Xan du”。
按照他的设想要建立一个世界文库,把所有的作品都放到一个超文本系统中,在其中,用户可以从任何一个文档中的任意地方访问其它文档的一个子字符串,包括本地及远程的数据。
Nelson说:“关于hypertext,我认为应当是非顺序的书写文本,既它可以由用户进行选择,分不同的分支去阅读文本,最好在交互式的品目上进行阅读。
当这种方式被普遍接受时,它就成为由作者提供给读者的一部大的文本,而文本由许多链(links)链接在一起,给读者提供了不同的阅读通络。
”因此,非顺序的写作给了作者一种更好地表达他们思想的可能性,而链的概念在实现非顺序阅读文本中起到核心的作用。
20世纪六十年代中,美国的布朗大学成为超文本系统的研究中心。
1967年超文本编辑系统研制成功。
这是第一个可以运行的超文本系统,它需要120K字节的内存,在IBM/360机器上运行。
1968年研制成功了FRESS(File Retrieval and Editing System)。
这两个系统都用指针把文件连在一起,用户接口是通过文本进行操作的。
在MIT实验室,体系结构组研制了世界上第一个最重要的超媒体系统白杨树城影像图系统,它支持时基媒体。
用户可以用一个操纵杆进入四个地理方向,通过白杨树城的虚拟驱动可以把行进过程和结果显示在计算机屏幕上。
这种系统包括一组可存储在视频盘上的大幅图像。
使用四个摄像机从前、后、左、右方向进行拍摄。
当汽车驶入城市的所有街道时,每隔两米取一幅图像。
这些图像用隐式指针连在一起,模拟汽车穿过城市的所有操作,每隔3米取一幅图,以2幅图/S的速度显示,可达车速110km/小时。
由两个屏幕进行显示,一个显示街道图片,另一个显示街道的实际位置。
1987年以后超文本、超媒体会议年年召开,在进入90年代以后,WWW服务中超媒体的广泛应用,新一代WEB超文本系统HYPER-G的诞生,开放式超文本系统OHS都推动了超文本、超媒体技术的发展。
在超文本发展的过程中,借助于最新的多媒体技术,与人工智能相结合,产生了一些有较大影响的大型产品。
1985年Symbolic公司开发的符号文本检查系统 (Symbolic Document Examiner)具有8000个页面,1万个节点,23000个指针,是一个大型超文本应用系统;1972年—1982年美国卡尼基•梅隆大学研制的KMS(Knowledge Management System)知识管理系统是一种结构式浏览的超文本系统,用于原子能航空母舰上。
1985年由施乐公司开发的Notecards具有复杂的网络层次结构,包括节点、链、浏览器和文件盒四种对象;Guide系统是1986年开发的支持替换、弹出、跳转和命令四种链的超文本创作工具;HyperCard是80年代末期世界上最流行的由苹果公司开发的超文本系统。
它把节点、链概念介绍给用户,并提供了一种功能很强的脚本语言Hypertalk 。
尽管超文本超媒体的先驱们有非常诱人的设想和部分思想的实现,“WWW是第一个使得需访问的内容在真正的大规模范围中可以使用的,使分布在全球的成千上亿用户可以访问的超媒体系统”[From content-Centrered]。
Ted Nelson和Vannevar Bush
的想法在Web上真正得到了实现。
1989年开始,Robert Caillian和Tim Berners-Lee 首先接受了先驱们的思想,接着得到W3C委员会的认可。
归纳起来,Berners-Lee的思想是:
·提供一个远程存储的可以用网络访问的人类可读信息的协议。
·可以很容易地交换与所使用的显示技术无关的文本。
·提供一个协议,允许信息的交换与信息提供者及信息消费者使用的平台无关。
·提供一种搜索选择,允许信息能够由关键字自动地进行搜索。
·支持沿着超链在文档之间自由导航。
·提供并维护一种可以由用户存放自己文档的集合。
·允许被管理的文档或文档的集合由网络上的个体被超链到其它文档或文档集合中去。
·在任何情况下都能使用免费的公用软件。
·能够与已经存在的个人系统相连接。
信息交换发生在客户和服务器之间,没有服务器之间的通信能够实现链接的自动更新这个困难的任务。
目前,维护超链接都是靠自愿者在进行,使得目的锚点能够指向正确的位置。
结果,在WWW网上有很多空链接。
4.1.4超文本与超媒体的应用
从1945年超文本概念诞生,到20世纪六十年代中若干个成功的超媒体系统得到应用,到20世纪九十年代WWW的广泛应用,超媒体系统运用海量的信息和丰富多彩的形式,使网络上的任何人能够在任何时间,与任何地点的其它事物相联系。
超文本和超媒体的应用主要体现在WWW网上的信息搜索、电子出版物、远程教学、远程医疗和网络游戏等方面。
1.电子出版物
传统的媒体,如报纸和书籍是围绕内容的表示和访问而编排的,与内容相联系的参考文档虽然被提供,但是由于出版方式和过程的限制,文章和书籍的出版仅仅限于内容本身,参考文档的自动导航是不支持的。
WWW的诞生与应用,迅速地改变了这种状况。
WWW网络与生俱来地以超链的形式支持文档的随意访问。
比如,读者从纸质报纸上得到2005年物理学诺贝尔奖金获得者的消息,仅此而已。
假如是在网上查到同样的内容,那就会有相关链接指向其它站点,介绍有关物理学诺贝尔奖金得主的其它情况,前几年诺贝尔奖获得者的情况,诺贝尔奖项基本情况的介绍等等,甚至可以找到得奖者的主要论文和著作等等。
超链将Web上有关物理学诺贝尔奖的相关知识和报道都连在了一起,建立了紧密的联系。
更加方便有效的是,不仅有文字内容,还可以用超链将相关的图片、动画和视频都连在一起,为Web网的读者提供形象的、生动活泼的信息内容和形式。
2.信息搜索
2005年7月7日,英国首相布莱尔和广大的英国民众处在庆祝获得2012年奥运会举办权的兴奋状态之中,这种状态才渡过了21小时就传来了首都伦敦三起连环爆炸案的噩耗,整个英伦三岛处在一片惊恐和悲愤中。
若针对伦敦连环爆炸案到任何一个大一些的网站上去查询,不仅能够得到当时有关伦敦的情况,还能追溯和搜索到有关西班牙马德里爆炸事件,俄罗斯北高加索的恐怖事件等等,并能得到一系列相关的报导及评论。
自从互联网诞生以来,科学研究人员、银行、税务工作人员、技术人员、大中专学生、公司营销人员都感到须臾不可离开WWW网络。
从一个新概念的诞生、定义,它的内涵到外延,到相关领域的研究现状,学术学派及领头人,重要的杂志、期刊,有代表性的会议及经典的论文等等重要信息,都需要到网上去搜索、查询。
这些是进行科学研究必备的先决条件。
3.远程教学
伴随着Internet技术的不断发展,基于Web的远程教学应运而生,这是WWW技术、计算机网络和多媒体相结合的新一代教育技术,具有“个性化教育”、资源丰富的优点。
在美国及欧共体的许多国家,许多大学都开设了基于WWW的“网上学校”,以满足那些不能正常进入学校学习者的需要。
美国西北大学得到美国国家自然基金委员会支持的COVIS工程,美国斯坦福大学,瑞典皇家工学院(KTH)和新加坡国立大学(NUS)建立了三校互联的基于Internet的远程学习环境。
在英国,已经实现了英语资格考试的网上学习和水平认证全过程。
在日本,由邮政省和早稻田大学联合实施采用卫星与Internet技术的GITI(全球信息技术学院)工程。
国内清华大学的网络学堂、北大的远程教育、上海交大的网上虚拟校园、中国教育科研网格China Grid充分利用中国教育科研网CERNET和高校的大量计算资源和信息资源,开发相应的网格软件,配合网络计算机(NC)的使用,将分布在教育与科研网上自治分布的异构的海量信息资源集成起来,实现有效的共享。
除此而外,一些大公司,如Microsoft、SUN等也采用了类似的方法为员工和用户提供必要的网上培训和产品技术的在线支持。
学习资源的可共享性和系统的互操作性对于网络远程教育的实用性和经济性具有决定性意义。
国际上已有不少国家和组织致力于现代远程教育技术标准的研究。
在美国,航空工业计算机辅助培训委员会AICC最早提出计算机管理教学标准,以及美国国防部提出了可共享课程对象参照模型(SCORM),IMS全球学习联合公司提出学习系统的技术规范。
在欧洲,有ARIADNE(欧洲远程教育多媒体制作与销售网联盟),PROMETEUS (促进欧洲社会教育和培训中使用的多媒体工程)。
目前,在国际电气与电子工程师协会学习技术标准委员会(IEEE LTCS)的主持下,将形成IEEE1484标准。
2000年11月,我国教育部组织国内8所重点高校的有关专家开展网络教育技术标准研制工作,成立了教育信息化技术标准委员会CELTSC。
该委员会以研究、制定、推行和教育信息化相关的技术标准为使命。
4.远程医疗
无论是在国内还是国外,由于医疗条件分布的不平衡,供需矛盾的客观存在,使得医疗卫生成为运用现代信息和通信技术(ICT: Information and Communication Technology)发展最迅速的领域之一。
在Internet诞生和我国刚刚建立之初,人们就曾经广为流传着清华大学的学生从Internet网上为自己深度昏迷的同学求助的故事;美国的国会议员也曾在华盛顿的议会大厅,亲眼目睹位于加洲洛杉矶大学校医院的专家,通过Internet网调用家住波士顿的伤员的病历,并运用DARPA的高倍显微镜,为在加洲乡村小镇医院住院的病人进行远距离检查,并指导当地医生及时实施抢救手术,在黄
金时段挽救了病人生命的全过程;直到最近,还有一位在中国某城市图书馆上网的女学生,因半夜未离开机房突然觉得不舒服,呼吸困难,利用网上聊天求助一个美国的女孩,通过网络拨通了中国女生所在城市的110求救电话,及时把她送到医院。
根据Bemmel J.H 编辑的“医疗信息学手册”(Hand book of Medical Informatics)中描述的应用健康ICT技术解决方案的部分图解,较为理想的集中式与分布式医疗系统可由集中式、分布式以及集成式健康信息系统三部分组成,如图4-2所示。
在四个关键的以病人为中心的信息系统中,初步诊断系统以电子文档的方式管理病人的基本病历记录、医疗计划、用药情况、治疗安排、医疗费用等。
临床部门信息系统完成医院信息系统(HIS)的全部功能。
临床支持系统包括放射信息系统(RIS)、各种实验室信息系统、医院的药物信息系统。
RIS系统包括血管数字镜象造影、CT、核磁共振。
这些信息通过PACS(Picture Archiving and Communication System)进行通信和集成。
护士信息系统是为护士工作方便提供服务的。
医院信息系统是最早的医疗信息应用系统,目前在我国也得到了广泛的应用。
表4-1 现代远程医疗与三种健康策略有关的分类法
分布式健康信息系统使用了更多的现代ICT技术支持分布在不同物理位置上的医疗机构。
远程医疗从广义上讲应包括所有远程通信技术在医疗服务和信息供应方面的应用。
例如,医疗服务中治疗、培训和管理的发送、传递、视觉、听觉、图形信息的传送,
医疗专家、病人和其他人员通过远程通信手段进行咨询和交流。
远程医疗经常根据医疗领域和应用领域来分类。
表4-1列出了远程医疗的三种策略。
表4-1中的三种策略范围从历史上使用模拟电视
系统用于远距离教育和远程咨询,当代的在医疗专家和病人之间架起来的数字通信系统;
远程医疗是从运用传统的通信技术(如模拟电视和电话)到数字网络和数字系统的演化,包括Internet和其它数字媒体。
当前,随着技术的发展,远程医疗应用在不断变化着,朝着越来越强调面向消费者的健康服务的方向发展。
5.网上娱乐
定义娱乐本身就不是件容易的事情。
Langer把娱乐描述为“任何没有直接的物理目标,由于感兴趣而参与的任何活动”称为娱乐。
IBM公司的Claudio Pinhanez 等人则认为凡是当人们自愿参与的、使他们感兴趣的、给予人们快乐和放松的行为都属于娱乐的范畴。
具体来说,娱乐包括的行为有谈话、闲聊、阅读报纸和书籍、听音乐和广播、看电影和电视、参加运动、参加体育和文艺表演、下棋、外出购物、烹饪、种花、钓鱼、品尝美味、品酒、旅游、参观博物馆、逛公园等等。
如果仅仅从娱乐业的角度看,应当把上面讲述的娱乐行为更集中一些,主要指那些由专业人员创作的、使观众快乐的、带有知识性、思想性、有图有声的超出家庭和朋友
范围的一些活动。
那么,因特网上的娱乐活动应当有哪些呢?前面列出的娱乐活动大都能在Internet 上找到它们的副本。
比如,谈话和闲聊可以在网上参加论坛和电子聊天室;在网上阅读报纸已经变得越来越流行;在网络游戏的时代,先前的视频游戏活动已经找到了新的涵义;网上购物已经在人们的生活中占有较大的比例,而在线拍卖激起人们极大的热情和兴趣;网上旅游、参观博物馆、网上种花、养鱼不仅可以达到观赏、娱乐之目的,还能节省大量的资金;现在越来越多的人在网上建立自己的相册,交流共同感兴趣的艺术品,亲自动手做节日电子贺卡,庆祝亲友的生日、传统的中国节日和西方节日。
当然,目前在网上看电影、观看电视连续剧、下载和聆听MP3、MP4格式的音乐、歌剧、音乐剧,甚至观看大型球类比赛、体操比赛、模特比赛、以至于参与春节联欢晚会的互动节目。
4.1.5超文本与超媒体模型
本节对早期经典的超媒体Dexter模型及相关模型的发展变化作一简介,同时介绍多媒体、超媒体MHEG模型的应用,使读者对超文本与超媒体模型的框架有一个大概的了解。
1. Dexter超文本参考模型
超文本与超媒体发展二十几年以来,很多科学家和研究人员都在独立地用不同的技术描述超文本模型。
为了信息交流,人们需要一些超文本超媒体领域中的公共模型和公共术语。
1988年在美国的新汗布什尔的Dexter旅馆中,由超文本标准小组提出了Dexter参考模型。
同时,另外一个工作组也致力于研究Dexter模型使用的术语如何能更好地避免歧义和混淆,并使用语言将Dexter模型形式化地表示成共同遵循的规范。
1998年Cambell B 和Goodman提出了一种超文本抽象模型HAM(Hypertext Abstract Machine),它由5个层次组成:图形、上下文、节点、链和属性层;随着超文本和超媒体技术的深入发展,人们对适应性超媒体系统AHS(Adaptive Hypermedia System)提出了越来越高的要求。
1999年,De Bra P.等人提出了一种适应性超媒体参考模型AHAM(Adaptive Hypermedia Application Model) ,在Dexter模型的基础上加了教授模型,领域模型和用户模型;Koch N.等人在2002年用UML语言形式化地描述和改进Dexter模型,构造了一种称为慕尼黑三层结构的超文本模型。
在模型的存储层包括三种元模型
(Meta-Model)。
适应性元模型由一个规则集组成,它完成适应性功能,特别是个性化
要求的各种功能;领域元模型管理超媒体系统的基本网络结构,其中导航部分通过由领域元模型决定的信息空间描述可能的链接;用户元模型管理一组用户表达的属性。
这些属性一部分是领域相关的知识,另一部分是领域无关的性质。
2005年,斯洛伐克的学者Anton Andrejko认为适应性超媒体系统能够适应用户或环境的要求,但是很多时候即使用户提供了适应性的内容和表示,仍然不能满足用户的期望。
主要原因是计算机不能“理解”这些被表示的内容。
因此,需要为内容加一些元数据使得计算机能够更好地进行处理。
下面,先描述运用最广泛,也是其它多种超文本模型基础的Dexter模型,然后列出Anton Andrejko的带有语义层的Dexter参考模型。
Dexter模型由三层组成,见图4-3 Dexter 模型。
图4-3 Dexter模型的三层结构
从基础的底层向上逐步分析各层的作用。
Dexter模型的内部成员层存放了所有可能使用的节点(由第二个工作组决定,为避免混淆Deter模型中不使用节点这个词,而用“成员”一词作为替代)的内容和结构。
成员是存储层寻址的基本单元,由原子、链和复合单元组成;存储层将超文本描述为成员与分解功能、访问功能的有限集合。
访问功能与分解功能共同负责检索内部成员。
存储层与内部成员层中间的“锚接口标识”是一种定位机制。
一个锚(anchor)由锚标识(ID)和锚值(value)两部分组成。
锚标识是唯
一表明锚在成员范围内的标识,它可以唯一地标识跨越由多个超文本组成的整个网络成员。
锚值可指明位置、范围,子成员内的项,或者子结构的任意值。
最上面一层运行层是表现成员实例的。
它把成员的拷贝存放在实例中,由用户来编辑和查看,然后写回到存储层。
因此,按操作来看,实例可以被看成是成员运行的高速缓存。
运行层和存储层之间的描述规范规定了统一数据的呈现形式。
从上面的叙述可以看出,三层中的中间一层是最重要的。
因为该层包含了原子节点,复合节点。
当一个复合节点包含了另一个直接非环形图的节点时,复合节点便形成了层次。
本层中的链是表达节点间关系的实体,它们是两个以上终节点规范的序列。
每一个终节点规范都与超文本中的一个节点有关。
同时,每一个节点都有一个全局唯一的标识UID(Unique Identifier)。
在Internet中就是我们常用的URL(Uniform Resource Locator)。
带有语言义层的Dexter改进模型如图4-4所示。
图4—4 带有语义层的Dexter模型
对Dexter模型的改进表现为在存储层和内部成员层之间加语义层(semantic layer)。
这一层规定数据内容,并且定义从不同的资源搜索数据和集成数据的过程。
这一层创建了一个层之间的接口,并且根据用户的查询等要求,使用本体任务考虑内容的语义,并从内部成员层向用户提供内容敏感的结果。
为了描述语义,可以使用诸如RDF,RDF Schema,或者OWL一类的本体语言。
2.多媒体和超媒体信息编码专家组MHEG模型
MHEG(Multimedia Hypermedia Information Coding Expert Group)是ISO/IEC JTC1/SC29 组织的为多媒体系统信息交换格式制定的标准模型,无疑它是多媒体超媒体系统最重要的模型。
从1993年起ISO-SC29工作组就致力于该项工作,到目前为止有些标准的细节还没有完全完成。
在各种教科书中关于MHEG的描述也不尽相同。
我们在查阅较多资料后,以R.Steinmetz 《多媒体计算、通信及应用》一书中的主要思想为主线介绍MHEG。
同时参考英国关于MHEG和MHP专家组的报告,对MHEG模型作一补充。