应用语言学论述题.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

儿童词汇的发展是儿童语言发展的重要部分,研究者们普遍认为儿童第一个词产生于10-13个月龄的时候。

儿童掌握词义是一个逐步深化、不断完善的过程,初期表现出与成人对词义理解不完全相同的现象。

一、最初的词

有一些学者认为,当婴儿经常地、一贯地、相当刻板地使用单个语音的时候,就算掌握了第一批词。

另外一些学者认为,只有婴儿能够使用语声明确地指明特定的人、物、事件或性质时,才真正算是掌握了词汇。

还有一些学者认为,婴儿只有用单个的词传递句子的意思时,才能认为婴儿掌握了词汇。

二、儿童词汇量的发展

一般认为:1岁左右出现约20个词,2岁左右出现300-500个词,3岁左右接近1000个词。从总趋势来看,儿童的词汇量是随年龄的增长而不断增长的,但是增长的速度却不是匀速的,儿童在2-3岁间词汇量的发展速度是最快的,3岁以后儿童词汇量的增长速度逐渐减慢。

三、儿童各类词汇的发展

儿童一般先掌握实词,再掌握虚词。实词中最先掌握的是名词,其次是动词,再次是形容词,最后是数量词。

在学龄前期的各个年龄阶段,具体名词词汇量总是超过抽象名词的数量,但是两类名词的年增长率却是抽象名词高于具体名词。这说明幼儿的认知范围逐渐由具体形象的人和物向抽象的事物和概念发展。

3-4岁儿童对表示动作的“先”、“后”和“同时”等词已经理解。对于“以前”、“以后”大多数儿童要到5岁时才能正确理解。

4-5岁儿童能够理解“昨天”、“今天”、“明天”及其先后顺序,而对于一天之内的时段词汇,如“早晨”、“上午”、“中午”、“下午”等词及其顺序的正确理解则要推迟一年。同时,对于时段太长,生活中难以体验的“去年”、“今年”、“明年”,一般要到6至6岁半才能理解。

儿童首先理解“正在”(3-4岁),其次是“已经”(5岁),最后是“就要”(6岁)。

儿童获得方位词的顺序大致为:里/上/下>后/前/外/中>左/右。

幼儿常用动词词汇有三类:第一类反映人物动作和行为,第二类反映人物心理活动和道德行为,第三类反映趋向和意愿等活动和行为。

与成人不同的是,儿童经常使用非动词来表达需要和描述活动。

儿童掌握形容词的发展过程表现出以下特点:

(1)儿童最早使用的是描述物理特征的形容词(2岁),其中颜色词出现得较早。

(2)儿童对形容词的习得和使用表现为从事物单一特征的描述到复杂特征的描述。

(3)从简单形式的形容词到复杂形式的形容词。

幼儿对“这”、“这边”,“那”、“那边”的理解没有先后差异,而语言情景对指示代词的理解具有明显的影响。

幼儿对“我”理解最好,“你”次之,“他”最差。

3岁儿童基本能够理解“谁”、“什么”、“什么地方”三个词;4岁儿童能大致上理解“什么时候”、“怎样”;而对“为什么”则要等到5岁时才能基本上理解。

儿童对积极义副词的习得优于对消极义词的习得,所谓积极义是表示程度高、频率高、范围大的副词,消极义副词的意思恰恰相反。

四、儿童词义的发展

意义的重叠和过度扩大

意义的重叠和过度缩小

无重叠的意义

五、儿童词汇发展的差异

一方面是儿童词汇量的差异。

另一方面是儿童掌握单词类型的差异。

还有一个方面是性别差异。

再有一个方面是跨文化差异。

六、儿童掌握词汇的特点

第一,发展的顺序性以及对情境的依赖。

第二,发展的不匀速性和阶段性。

第三,词汇意义的逐步精确化和概括化。

第四,儿童对词的理解和使用是以儿童的认知发展,特别是概念的掌握为基础的。

3、我国中文信息处理面对的难题

(一)汉字的输入、存储、显示、打印

汉字输入、输出、打印的难题并没有完全得到解决,因为汉字数量庞大。现有的字库中找不到的古汉字的处理成为古籍计算机处理的一大难题。另外,在实际的教学中,教师要在计算机中处理学生写错的汉字也十分困难。

(二)汉语在计算机中的分词处理

让计算机对汉语进行自动分词处理是中文信息处理特有的难题。

1、分词规范

目前计算机在对汉语进行分词时主要依靠分词系统中的词表。通常一个分词系统包括若干个词表,其中有一个是基本词表(或者叫通用词表),包括的词都是日常社会生活所需要的。另外有一些附加的词表,这些词表包括人名表、地名表、专有名词表、组织机构表、缩略语表、专业术语表等。

要给出合适的词表并不是一件容易的事:首先,汉语的语素与词、合成词与短语之间的界限不明,许多词在实际使用中可分可合,例如:“放假”,实际使用中可以是:“放了假”。其次,汉语中有些语素构词能力超常,如“者”,一般的构词是“劳动者”,但是又可以说“持有两国护照者”。

要认定某一个字串是否可以当作一个词,需要在真实文本语料中加以考察,而且有些结合紧密、使用稳定的字串也未必就是词。

2、歧义切分

20世纪80年代后,人们在进行汉语文本的自动分词研究中发现,对字串的切分会遇到两种切分的歧义。一种是交集性歧义;另一种是组合性歧义。

3、未登录词的识别

未登录词是指词表未收因而机器不认识的词,但是未登录词本质上是不可穷尽登录的:人名、地名几乎可以看成是无限的,新词也在不断地产生。为了识别未登录词,人们采取的办法是不断扩充词表,但词

表不是越大越好。更好的方法有待寻找。另外书面汉语没有词界标记,因此首先有一个确定未登录词边界的问题,这既是汉语自动分词中的一个难点,又是一个不能回避的重点。缺乏识别未登录词的能力,计算机就难以自动处理大规模语料。

(三)汉语词性的自动标注

词性标注就是标注出文本中每个词在特定语境中的词类(名词、动词、形容词等等),所以也叫词类标注。

在中文信息处理中,词性标注的意义:

第一,确定词的语法功能,为句法分析打基础。这是把词性标注看成句法分析的一种预处理过程。

第二,便于在词性标注语料库中检索句法结构。比如:一些有特定标记的句法结构在词性标注语料库中就可以检索到,例如数量结构、“把”字结构、“的”字结构等等,虽然有些结构的左边界或右边界尚难确定。

第三,为同音字标注、多音字标注和词义标注提供支持。一音多字、一字多音、一词多类和一词多义,都是语言中的歧义现象,其间有一定的依赖关系。例如,许多多义词的义项可以从词性上加以分化。也就是说,词性标注之后,词汇歧义的严重性能够大大缓解。

(四)汉语句子的理解和生成

汉语句子的理解和生成是当前中文信息处理面临的难题。

子不像印欧语有形式上的标志。

冯志伟在分析汉语句法结构难题时指出了以下这些现象:

●汉语句子的词序比较灵活,这使得自动分析规则写起来非常困难;

●汉语中名词词组结构复杂,分析时常出现结构歧义;

●汉语句子中的主语常常被省略,这使得主语成分的确定变得非常棘手;

●汉语句子的被动句常常不用“被”字句,这使得主动形式与被动形式没明显差别;

●汉语中的主谓谓语句使得它后面的成分边界不清;

在实际的语言自动分析中,遇到的困难远远不止这些,比如:

●涉及语义分析的层面时,困难似乎更多;

●汉语常用词多义现象普遍,多义词的判断规则十分繁琐,很难有一个简单的规则;

●语义组合层次和关系的不同都可能造成歧义。例如:“小张的教练当得有水平”“他连你也不相信”。

相关文档
最新文档