电报实验2莫斯
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
附录1 摩尔斯编码
电报,就是用电信号传递的文字信息。电报(telegraph)是通信业务的一种,是最早使用电进行通信的方法,它利用电磁波作载体,通过编码和相应的电处理技术实现人类远距离传输与交换信息的通信方式。电报大为加快了消息的流通,是工业社会的其中一项重要发明。早期的电报只能在陆地上通讯,后来使用了海底电缆,开展了越洋服务。到了二十世纪初,开始使用无线电拍发电报,电报业务基本上已能抵达地球上大部份地区。电报主要是用作传递文字信息,使用电报技术用作传送图片称为传真。
电报发展的基本历程
在未发明电报以前,长途通讯的主要方法包括有:驿送、信鸽、信狗、以及烽烟等。驿送是由专门负责的人员,乘坐马匹或其他交通工具,接力将书信送到目的地。建立一个可靠及快速的驿送系统需要十分高昂的成本,首先要建立良好的道路网,然后配备合适的驿站设施。在交通不便的地区更是不可行。使用信鸽通讯可靠性甚低,而且受天气、路径所限。另一类的通讯方法是使用烽烟或摆臂式信号机(Semaphores)、灯号等肉眼可见的讯号,以接力方法来传讯。这种方法同样是成本高昂,而且易受天气、地型影响。在发明电报以前,只有最重要的消息才会被传送,而且其速度在今日的角度来看,是难以忍受的缓慢。
欧洲的科学家在18世纪逐渐发现电的各种特质。同时开始有人研究使用电来传递讯息的可能。早在1753年,一名英国人便提出使用静电来拍发电报。他的设想是使用26条电线分别代表26个英文字母。发电报的一方按文本顺序在电线上加以静电。接收的一方在各电线接上小纸条。当纸条因静电而升起时,便能把文本誊录。
初期的电报只能透过使用架在陆地上的电线(land line)通讯。最早期的电线属于单线式,需要透过地面完成回路,传送距离有限,更不能越过海洋。到了1850年,首条海底电缆横越英吉利海峡,把英国及欧洲大陆连接起来。首条横越大西洋的电报电缆则在1857年敷设完毕。但由于技术原因,这条越洋电缆只使用
了数天便告失灵。首条大西洋海底电报电缆要在九年之后,即在1866年方才成功投入使用。至于横越太平洋的海底电缆,更要在1902年方才完工。
摩尔斯编码
有线电报通信是由美国摩尔斯于1837年首先试验成功的。虽然摩尔斯发明了电报,但他缺乏相关的专门技术。他与艾尔菲德·维尔签定了一个协议,让他帮自己制造更加实用的设备。艾尔菲德·维尔构思了一个方案,通过点、划和中间的停顿,可以让每个字符和标点符号彼此独立地发送出去。“点”对应于短的电脉冲信号,“划”对应于长的电脉冲信号;这些信号传到对方,接收机把短的电脉冲信号翻译成“点”,把长的电脉冲信号转换成“划”;译码员根据这些点划组合就可以译成英文字母,从而完成了通信任务。他们达成一致,同意把这种标识不同符号的方案放到摩尔斯的专利中。这就是现在我们所熟知的美式摩尔斯电码,它被用来传送了世界上第一条电报。
图 1 有线电报原理示意图
摩尔斯电码是串行编码(serial coding)的祖宗,不但可以把英语的26个字母和标点符号通过简单的编码(只要长音和短音——一根手指把电流开关摁下去松开的时间长短)表达出来,理论上说,摩尔斯电码适用于所有其它的语言。这种代码可以用一种音调平稳时断时续的无线电信号来传送,通常被称做“连续波”CW (Continuous Wave)。它可以是电报电线里的电子脉冲,也可以是一种机械的或视觉的信号(比如闪光)。
摩尔斯发明了电报后向美国政府申请了专利,于1844年开通了华盛顿到巴尔地
摩的首条商用电报系统。不到10年的时间,全美国已经有了超过50家电报运营公司。
1.英文的摩尔斯码表示
摩尔斯码的各个字母的码长是不一样的。它把英文字母表中的字母、标点符号按照出现的频度排序,然后用点和划的组合来代表这些字母、标点,使频度最高的符号具有最短的点划组合;S出现的概率很高,所以只用三个编码单元,而且是三个点;Z出现的概率最低,所以也就最长;E最短,只有一个点,因为其出现在英语里面的频率最高。
表1英文字母的出现频率
值得一提的是,摩尔斯电码本身完全符合信息论(Information Theory)的原则,虽然信息论是香农(Claude E. Shannon)在摩尔斯之后一百多年才创立的。我们知道,编码本身分为等长编码和变长编码两种,等长编码就是所有的字符都用一样的编码长度,比如美国标准信息交换码(ASCII-American Standard Code for Information Interchange)。但是通信工程里面有一个原则,就是用最小的系统资源传输最多的信息,也就是说平均信息量(信息熵)一定的情况下,数据量要达到最小。根据这个原则,等长编码是有问题的,因为电报是用来传送语言信息的,即英语的26个字母和一些标点符号,而这些字符在英语里面出现的概率是不一样的,统计显示,字母E出现的概率最高,而Z出现的概率最小。如果用等长编码,数据量不能达到最小。要使数据量小的一个基本原则就是让出现概率高的信息用较短长度的编码,而那些不常见的信息用较长的编码。这样在传输的时候,由于传输的都是比较常见的信息,所以概率上说我们可以用比等长编码更小的数据量完成传输。等长编码只有在所有信息单位出现的概率都相同的情况下才能达到信息熵。实际上,winRAR
之类的压缩软件,都是运用这个原理。
图2给出了国际标准英文字母和数字的摩尔斯电码。
图 2 国际摩尔斯电码表
2.中文的摩尔斯码表示
自摩尔斯电码在1835年发明后,一直只能用来传送英语或以拉丁字母拼写的文字。1873年,法国驻华人员威基杰(S·A·Viguer)参照《康熙字典》的部首排列方法,挑选了常用汉字6800多个,编成了第一部汉字电码本,名为《电报新书》。后由我国的郑观应将其改编成为《中国电报新编》。这是中国最早的汉字电码本。
中国汉字多达6万字,常用的汉字只有一万个左右,所以用10的4次方(10,000)来表示。中文电码表采用了四位阿拉伯数字作代号,简称“四码电报”,从0001到9999按四位数顺序排列,用四位数字表示最多一万个汉字、字母和符号。汉字先按部首,后按笔划排列。字母和符号放到电码表的最尾。后来由于一万个汉字不足以应付户籍管理的要求,又有第二字面汉字的出现。在香港,两个字面都采用同一编码,由输入员人手选择字面;在台湾,第二字面的汉字会在开首补上“1”字,变成5个数字的编码。