2012020748文芳艳
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、实现中介语语料库平衡性的 基本原则和策略
(一)基本原则:目标驱动,质稳量足。(要实现怎样的研究目 标,就建怎样的语料库; 为了挖掘某方面的知识,就在这个方面 做出更充分的平衡性考量,以达到质量的稳定可靠和数量的充 足够用) • “目标驱动,质稳量足”必然体现为语料库的通用性和专题性 相结合 。我们既需要为一般用途而建的语料库,也需要为特殊 用途而建的语料库 。就一般用途而言,其平衡性要求自然要在 各个参数之间做出大体均衡的选择; 而就特殊用途的专用( 专题) 语料库而言,其平衡性主要体现在所定质量参数上有足量的数 据可供分析。
先建的基础上,循序渐进地丰富语料库建设的内容,逐步满足多层
面使用的需要。
四、余论
• 考虑到语料库的服务对象并不限于语言学,我们认为完全可以 建立一门语料库学, 语料库学的中心话题未必是语言学的,语
料库语言学只是语料库学和语言学的交叉学科 。本文即以此为
大背景来讨论中介语语料库建设中的平衡性问题。 • 目前的中介语语料库及中介语语料库语言学的论题基本上都是 基于研究目标驱动的,因此其服务对象都是教学研究人员 实际 上还应该存在这样的一种语料库和语料库语言学,即基于中介 语语料库的学习者测试评价和帮助系统语料库及相关研究。
(二)基本策略:急用先建,循序渐进 急用先建的含义: 1、以需要为出发点,一是时间不必贪大求全, 平衡要以效率为前 提 2、所建语料库主要是为整个学术界的学术研究和教学服务还是为建 库者的学术研究和教学需要服务。前者往往采取凡有必录的方式, 只对特别大量的文本数量做一定的减量,但在标记内容和方式上体 现出急用先建的策略。 而后者则是典型的建我所需、为我所用,是 否需要标记、如何标记,完全靠当下设定的研究目标。 3、指语料标注要使一般性操作简单可靠,参数关联便捷有效在急用
百度文库
一、语料库平衡性的基本内涵及中介语语料 库的平衡性问题
• 基本内涵:构成特定语料库中各部分语料的类型和比例相 对适当,以满足语料库建设和使用中的合理性和可靠性等 方面的要求。 • 平衡性既不是简单的文本特征的差异,也不是简单的比例 相当,而是两者结合起来所达到的某种动态均衡。
中介语语料库的代表性与平衡性问题
库建设过程中需要着力解决的问题。这也是中介语语料库的特
殊之处。
平衡性所涉及的三个参数
• 平衡性问题在宏观上主要涉及三个方面的参数: (一)质量参数,即整体的各部分或对应的各方面都要具备。 (二)程度参数,即体现出某些质量参数的水平差异或过程 变化情况。例如:北京语言大学所建的“HSK动态作文语 料库”收集的是参加HSK高等考试的考生作文(初中等没 有写作考试),它只反映高等水平,初中等水平无从体现, 因而无法实现程度平衡性。 (三)数量参数,即由质量参数和程度参数规定的各个要素 在数量上相等或相抵。
(三)语料库结构适用于不同研究理念和研究方法
1、语料库语言学的基本研究观念和方法主要有两种,一是基于 语料库研究法,一 是 语 料 库 驱 动 研 究 法。二者最大的区别 就是是否预作假设,对文本进行标注。 2、平衡语料库的动态平衡需要实现的三个层次的要求: 初级要 求是在特定项目的描写需求中满足对比的基本需要; 中级要求是 满足较为广泛的语言对比的基本需要; 更高的要求则是为潜在的 研究课题提供发展的空间。
基于中介语语料研究,平衡性问题所涉及的三个宏观参数
• 就质量参数而言,国别性语料( 基于不同国籍背景的语料) 和语别性语料( 基于不同母 语背景的语料) 比较多地受到关注,其他影响二语习得的因素虽有所考虑,但目前的 利用价值还不不够显著,相关的研究成果很少见 这实际说明语料库的平衡性和语料 库使用中的平衡性问题并不等同。 • 就程度参数而言,各个语料库的情况有所不同,除HSK动态作文语料库这样的受限于 客观等级的语料库之外,一般的目标都是试图实现初中高三级的平衡 。每个等级中 的成绩差异所体现出来的语言特征在一定程度上也能够折射出水平等级的不同。 • 就数量参数而言,受语料收集对象和过程的限制,数量不均衡是显而易见的事实。
(二)语料规模上可能大量和相对足量(数量参数方面的基
本目标) 1、没有大规模的语料就无法保证研究内容的丰富性和研究结论的可 靠性。另外,随着语料库量的增长,必然会出现数据稀疏( 虽有却罕) 的问题,而且还有可能避免规模不足的语料库所带来的数据缺失( 该 有未有) 问题。就此而言,语料库的总规模应该以大取胜 2、足量不是对语料库的总规模而言,而是针对特定的研究项目特定 的专题语料库。 3、平衡是在一定规模基础上的平衡,规模是在某种平衡背景下的规 模。语料库的平衡是相对足量平衡( 基本量) 和绝对广量平衡的结合, 前者侧重于语料收集的深度,后者侧重于语料收集的广度。这就必然 使我们在语料库建设过程中将可能大量和相对足量有机结合在一。
就中介语语料库而言,质量参数和数量参数往往受到很大的限制,跟母语语料库常
常受制于建库者的取舍不同,中介语语料库在这些方面实现得不够充分基本上都是 受到客观条件的限制。就此而言,母语语料库和中介语语料库质的本质差异导致量
的平衡性显著不同
二、中介语语料库平衡性的基本目标
语料库语料库的平衡性问题实际上就是语料库 中各类语料在类型和数量上的协调问题
各类语料在质的分布和量的分布上的均衡问题
基本目标:尽可能地保证语料库所应具有的品 质和规模,满足使用者对质与量之间关系的认 识和研究
(一)参数选择合理、充分(质量参数方面的基本目标)
1、从理论上来说,影响学习者习得进程的各种因素都应该成为中 介语语料库建设中必然要考虑的参数。参数的选择和参数系统的层 次是决定平衡性的最根本的因素。 2、参数选择的合理性指中介语语料库建设中影响中介语形成和发 展的一般因素都要有所体现,即合乎习得之理。这主要体现在两个 方面。一是学习者的背景信息,而是学习者所产出的文本信息。总 体而言,就是力求做到参数选择的多样性,最大限度地保持相关信 息的完整性,为后续研究提供坚实的基础。 3、参数选择的充分性主要是基于特定研究目标而体现出来的平衡 性要求
浅评
• 优点: • 在主题探讨平衡性问题时,拓 • 缺点: • 对本文所探讨的问题纵向研究 不够,自身的见解不够,多是 引用别人的观点或对别人的观 点用自己的话语总结 • 两次提及建立面向应用的语料
展的宽度比较广,如:平衡参
数的调整,对建立面向应用的 语料库的建议与呼吁
• 对如何建立语料库也提出了一
论中介语语料库的平衡性问题
施春宏 张瑞朋
摘要:这篇论文以汉语中介语语料库为例,从质量参 数、程度参数和数量参数这三个方面的内在关联来讨论中 介语语料库的平衡性问题。 文章认为,实现中介语语料库 平衡性要在参数选择合理充分的前提下,语料规模做到可 能大量和相对足量相结合,在语料库结构安排上适用于不 同的研究理念和研究方法。为此,需要遵循目标驱动、质 稳量足的基本原则,采取急用先建、循序渐进的基本策略。
些有建设性的建议。如:语料 库最重要的目标是描写和解释
库,陈述其重要性和急迫性,
并在论文论述中多次用“理论 上”一次,而并没有提出一些
语言编译现象,建立相应的语
料库,必然要对制约语言变异 的因素做出合理而充分的说明
具体切实的建议,有一种“站
着说话不腰疼”的意味
平衡性问题在一定程度上涉及代表性问题,如 同样是书面
语,来自大报大刊的和来自小报的有差异;面向不同年龄段的有
差异,这样在理论上必然会导致一个文本代表着一种类型 。所 以从理论上说,每个文本(如平时作业、考试作文、口头测试
记录等)都有语料的价值,都值得录入语料库中,很难说哪一
种语料更有代表性,最需要做的工作就是根据合适的参数将它 归入相应的类型和层次中。因此,平衡性问题才是中介语语料