为什么汉语是世界上最先进的语言
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为什么汉语是世界上最先进的语言
一、语言水平高低的评判准则
口语,实际上是一种通讯协议。就是说,语言实际上是把
人的思想通过发音器官变成一串频率不同、波形不同的声波,然后被另一个体的听觉器官和相关的脑部组织重新转变回
思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于传输的信号的规则
计算机上,通讯协议有两个基本评判标准:【传输效率】
和【抗噪能力】
传输效率:在单位时间里,按照该通讯协议能够传输多少
信息。
抗噪能力:这种通讯方式能够在多大的噪音下仍然保证绝
大多数信息正确传输。
【传输效率】又分两个方面,编码效率和传输速度
编码效率:这个通讯协议能够把一个信息用多短的一串信
号来表达
传输速度:一段信号,能够以多快的速度传输
评价一种语言的口语是否先进,就要分析上面这几个问题。
文字,则是一种数据存储方式,存储格式的要求与通讯协
议不同,存储格式要求储存空间小、读写速度快,相比于读取速度,书写速度是次要的。这是因为平均下来一次书写对应很多次阅读,而人在阅读文字上花的时间一般远远大于书写。尤其是现代社会,手写越来越少,计算机输入、打印、印刷都大大加快了记录文字的速度,而阅读速度却没有多少提升,因此在现代社会,阅读速度就在定义文字水平上占据了更重要的地位。
需要注意的是,下面的讨论中“音节”均采用西方语言学定义,粗略地讲就是一组连续元音与其前后的辅音共同构成一个
音节。比如To、Bliss、Strength是单音节。汉语Ba、Chuang 也是单音节,虽然单音节词的发音长度并不完全相同,但至少是可比的
二、语言的分类
世界上的语言大致分为两种,【孤立语】和【综合语】
(综合语其下又划分为黏着语、屈折语等子类型)
【孤立语】单纯通过词与词之间的关系来表达不同的意思
【综合语】可以通过改变词的形态来表达不同的意思
我们举个简单的例子:
中文(孤立语):我昨天告诉他了。
英文(综合语):I told him yesterday.
英文你首先可以看到told和him两个变形,其中把tell 变成told表示过去发生的动作。把he变成him表示客体
而中文用昨天来直接指明时间,如果不指明时间则需要用“已经”、“过”之类来表示过去,而并不改变词的形态,中文还通过各自的位置来体现谁是主体谁是客体
实际上,英语已经是综合语中非常接近【孤立语】的了。英语的未来时态用的词形和一般时态没有区别,而很多其他语言中不同的时态都是用不同的词形来表达的。英文对于各个词的位置有明确的规定,而很多其他综合语,诸如拉丁语中,词的位置可以不固定。换句话说就是可以说出这样的句子:Him yesterday told I 然后通过词形里的主格词形和宾格词形来判断究竟是谁告诉了谁
这是非常糟糕的,因为在读取的时候,总是有先后的差别,我们希望的读取顺序是:先读取我们的大脑需要先处理的部分,【孤立语】天然就有这种优势,很多【综合语】在逐步的发展中也确立了类似的规则,比如拉丁语的后裔之一——法语
上古古汉语也曾是一种【综合语】但是由于汉字的限制,古汉语的词形变化仅存在于口头中,比方说文言文中的使动用法,如“文王以百里之壤而臣诸侯”中的臣(使臣服,在上古时期,是需要在汉字发音前加“s-”音来标识的,就是一个典型的综合语的词形变化
有人认为现在的汉语仍然带有一定的综合语色彩,他们认为加入诸如“了”、“的”这种助词实际上就是词的变形,这种看法就只能见仁见智了
从整体发展趋势来看,世界各地的口语都是从【综合语】向【孤立语】发展,虽然不能说【孤立语】就一定优于综合语,但是这个趋势说明【孤立语】的某种特性符合历史的发展,这个优势就是数据的压缩
三、数据压缩:【孤立语】的高超之处
当计算机发展到了新的时代,人们开始研究如何在计算机上存储视频文件,一开始的方案极其简单,就是把一帧一帧图像全部都存储下来,但是这无疑是低效的,因为这里面的冗余信息太多
举个简单的例子,一个夜晚的场景,画面上很多地方都是黑的,何必把每一个点的色彩反复记录呢?所以接下来的一个思路就是,不再存储每一帧图像的完整信息,而存储下一帧图像与上一帧图像之间的差异之处,两幅图像中颜色一样的部分全部跳过
【孤立语】恰恰就具有这样的效果
举个简单的例子,一个人在用汉语谈论昨天发生的事情时,只需要一开始提及“下面这些事情都发生在昨天”,后面就再也不必提及时态了,而英文,则需要反复使用时态来表明这事情发生在过去
在交流时你需要时刻考虑时间、主格/宾格、数量、主动/被动,这对交流是有影响的,当然,熟练使用这种语言之后会大大降低考虑这些的时间,但是即便熟练的综合语使用者还是会在这方面犯错,在上下文的帮助下,这些变化都可以省掉
时间变形,可以依靠在第一句中加入时间状语完成描述,其后描述相同时间段的句子就再也不用考虑描述时间了,这就是【孤立语】的数据压缩能力。
随着人类社会交流量的上升,一次交流的上下文就变得丰富起来,很多在单词、单句的条件下很有效率的信息交流方式,也就显得越来越冗余了,因此世界上的各个主要语言纷纷向【孤立语】靠拢。
关于各个语言的表意效率,也就是信息密度,2011年法国里昂大学做了一个实验
rs.fr/fulltext/pellegrino/Pellegrino_ 2011_Language.pdf
这个实验里,研究者找了59位不同语言使用者,其中包括英语、法语、德语、日语、汉语、意大利语和西班牙语。为他们提供了20段文字,这些文字都翻译成各自的语言,然后请这些人分别用正常语速朗读,研究者全程录音,然后研究者计算所有音节数量,计算朗读中表现的义项(表意的基本单位)的数量,最后得出结论
研究的结果是
【汉语】信息密度为0.94,位居第一
【英语】信息密度为0.91,位居第二
德语(0.79)