对外汉语教材等级词频统计模块构建_一种辅助对外汉语教材词汇难度评量的工具[1]
自然语言处理中的词频统计工具推荐
自然语言处理中的词频统计工具推荐自然语言处理(Natural Language Processing,简称NLP)是计算机科学与人工智能领域的一个重要分支,旨在使计算机能够理解和处理人类语言。
在NLP中,词频统计是一个常见且重要的任务,它可以帮助我们了解文本中不同词汇的使用频率,从而为后续的文本分析和处理提供基础。
本文将介绍几款值得推荐的词频统计工具,帮助读者在NLP研究和应用中更高效地进行词频统计分析。
一、NLTK(Natural Language Toolkit)NLTK是Python中最常用的自然语言处理库之一,它提供了丰富的工具和函数,用于处理文本数据。
NLTK中的FreqDist类是一个非常便捷的词频统计工具,它可以统计文本中每个词汇的出现次数,并提供了多种方法来获取高频词汇、低频词汇以及词汇的频率分布情况。
此外,NLTK还提供了其他有用的功能,如词性标注、分词等,使得用户可以在一个库中完成多个NLP任务。
二、WordCloudWordCloud是一个用于生成词云图的Python库,它可以根据文本中词汇的出现频率,生成一个形状各异、色彩丰富的词云图。
通过词云图,我们可以直观地看出文本中各个词汇的重要程度。
WordCloud库提供了灵活的参数设置,可以调整词云图的外观效果,如字体、颜色、形状等。
在进行词频统计时,将统计结果可视化为词云图,不仅能够更好地理解文本,还能够增加可视化效果,使得分析结果更加生动。
三、Stanford CoreNLPStanford CoreNLP是由斯坦福大学开发的一款强大的自然语言处理工具,它提供了多种功能,包括分词、词性标注、句法分析等。
在词频统计方面,Stanford CoreNLP可以帮助用户进行更复杂的文本处理。
通过使用Stanford CoreNLP,用户可以获得更详细的词汇信息,如每个词汇的词性、命名实体等,从而更全面地进行词频统计。
虽然Stanford CoreNLP的使用稍微复杂一些,但其功能的强大性和准确性使其成为研究者和开发者的首选工具之一。
文本分析工具PatCount在外语教学与研究中的应用
文本分析工具PatCount在外语教学与研究中的应用一、本文概述随着信息技术的飞速发展,自然语言处理技术在外语教学与研究领域中的应用日益广泛。
其中,文本分析工具PatCount作为一款功能强大的自然语言处理工具,其在外语教学与研究中的应用也逐渐受到广泛关注。
本文旨在探讨PatCount在外语教学与研究中的实际应用,分析其优势与局限性,并提出相应的改进建议,以期对外语教学与研究领域的创新发展提供有益的参考。
本文将首先介绍PatCount的基本功能及其在外语教学与研究中的应用场景,包括词汇分析、句法结构分析、文本分类等方面。
随后,通过具体案例分析,展示PatCount在外语教学与研究中的实际应用效果,如提高教学效率、辅助学术研究等。
在此基础上,本文将深入探讨PatCount在外语教学与研究中的优势与局限性,分析其在外语教学与研究领域中的适用性与局限性,并提出相应的改进建议。
本文将对PatCount在外语教学与研究中的应用前景进行展望,以期为相关领域的研究与实践提供有益的参考。
二、PatCount工具概述PatCount是一款功能强大的文本分析工具,它以其独特的算法和精准的数据处理能力,为外语教学与研究领域提供了有力的支持。
PatCount工具的设计初衷是为了帮助语言学者、教育工作者和研究者更加高效、准确地分析文本数据,以推动语言教学和研究的深入发展。
PatCount工具的核心功能包括词频统计、关键词提取、文本对比和语义分析等。
它能够对输入的文本进行深入的词频分析,快速统计出每个单词或短语的出现次数,从而帮助用户了解文本的基本语言特征。
PatCount还能够根据文本内容提取出关键词,帮助用户快速把握文本的主题和重点。
除了基本的文本分析功能外,PatCount还提供了文本对比功能,可以对比不同文本之间的异同点,为语言对比研究提供有力支持。
PatCount还具备语义分析能力,可以对文本进行深层次的语义挖掘,帮助用户发现文本中隐含的信息和关系。
教材词汇与汉语水平等级词汇的比较研究
纲 》 具 有 历 史 局 限性 , 词 汇 量 有 些 保 守 , 从 而 造 成 了 目前
甲级 词 乙级 词 丙 级 词 救材 级 词词 词 汇
对外 汉语教材超纲词过 多的局面 。 为 了 明确 《 纲 》 与 目前 对 外 汉 语 教 材 在 词 汇 方 面 的 大
K4 初 中 2 4 8 级 6 % 1 12 .8 18 1 . % 0 82 % 8 05 % 9 7 6 68% 1 97 0 191.O l33 .5 5 9
.
汉语 教学界普遍认可并广泛使用的部分教材的生词表 中的覆 盖情况 ,并根据 “ 现代汉语研究语料库 ” “ 现代汉语研究语 料库 ( 口语部分)”以及 “ 中介语语料库 ”中的词频数据对
学 大 纲 和 编 写 教 材 方 面 产 生 了 巨 大 的 影 响 。然 而 《 纲 》 大
所 “ 定 ”的教 学词表并 未在现有 的教材 中得 到很好 的落 规 实。到2 世纪末 ,词汇量大 且重现率低成 为对外汉 语教材 0
中 普 遍 存 在 的 问题 之 一 。 杨 德 峰 统 计 分 析 了 5 教 材 的 词 套
教 材 中出现 的 “ 纲词 ”是 否 可 以接 受 进行 了分 析 。 超 二 、 《 纲 》词 汇和 超 纲 词汇 在教 材 词 表 中 的分布 情 况 大 我 们 调 查 的 汉 语 教 材 共 i 套 ( 9 ) ,包 括 综 合 、 0 2册
l ( 中级 2 0 3 4 9 1 5 4 % 3 . % 9 0 4 192 . % 2 8 6 8 6 2 5 2 . % 0 3 4 l . % 4 7 3 3 46
册 )、 汉 语 初 级 教 程 ( 1~3 )、汉 语 教 程 ( ~3 , 不 册 1 册
对外汉语教材等级词频统计模块构建_一种辅助对外汉语教材词汇难度评量的工具[1]
——————————收稿日期:2009年4月7日 第19卷 现代教育技术 V o1. 19 2009年第7期 Modern Educational Technology No.72009 对外汉语教材等级词频统计模块构建——一种辅助对外汉语教材词汇难度评量的工具梁少丽 宋继华(北京师范大学 信息科学与技术学院,北京100875)【摘要】在对外汉语教材的编著过程中,用词频度和难度直接影响教材编著的质量。
根据《汉语水平词汇与汉字等级大纲》(以下简称《大纲》)8000多等级用词目、词性、难度等级三个属性,设计并实现对外汉语教材编著系统难度等级词频统计模块,并在20万教材语料基础上,进行实验。
实验证明,在速度上取得了较为良好的效果。
【关键词】对外汉语教材编著系统;词频检索统计;汉语词汇等级;键树【中图分类号】G40-057 【文献标识码】A 【论文编号】1009—8097(2009)07—0086—04一 引言教材编写是对外汉语教学资源建设的重要环节,如何提升教材编写的速度和质量,使人们从教材编写过程中那些诸如查找生词、控制词汇、加注拼音等费时费力而且容易出错的繁琐工作中摆脱出来,现代技术手段的有机融入是非常必要的。
正如崔永华教授所说的那样:“只有语言学、语言教学和现代技术的完美结合,才能让编写教材变得这么方便、快捷、准确、得心应手。
”【1】对外汉语教材编著系统应运而生,陈锋在其硕士论文《对外汉语教材编写辅助系统的设计与实现》[2]中提到编写教材的流程图如图1所示。
随着计算机、网络、语料库等技术的飞速发展,现代教育技术在对外汉语教学中的应用范围不断拓展,这为对外汉语教材编著系统的技术实现提供了可靠的保障。
图1 编写教材的流程图如何控制教材编写难度等级以适应不同水平教材使用者的需要,同时避免汉语教学内容的盲目性和随意性,一直是教材编写者面对的重要问题。
编写者控制教材难度,主要是通过量化语言点,即对词汇、语法、功能、文化进行分级,检查教材语料分级语言点覆盖以及分布情况,并反复修改教材内容,来达到控制教材水平的目的。
汉语水平词汇与汉字等级大钢
• 5000 词界标包括3000 常用词和2000次常 用词,是中等汉语水平的词汇量界标, 也是对外汉语中级教学阶段的词汇量要求。 常用词的语科覆盖率为 91% 左右 • 8000 词界标包括 3000 常用词, 2000 次 常用词和 3000 通用词,是高等汉语水平的 词汇量界标,也是对外汉语高级教学阶段 的词汇量要求。 常用词的语科覆盖率为 95% 左右
• 《词汇与汉字大纲》的研制主要参考和借 鉴了前人对汉语字词的统计与分析结果, 即一些具有较大影响的动态性频度统计词 典,词表,字表 。 包括 《现代汉语频率词典》 (北京语言学院,1985) 《现代汉语常用词频词典》 (北京航空航天大学,1989)等等
• 在进行大钢编制时,依据了多学科定量统 计与群体性定性分析相结合,语言学科学 原则与对外汉语教学需要相结合的总原则。
《词汇与汉字大纲》 词汇与汉字大纲》 收入总词汇 8822 个 分为4 个等级, 包括 • 甲级 词 1033 个 • 乙级词 2018 个 • 丙级词 2202 个 • 丁级词 3569 个 除按级别排列外,还进行了音序排列,并对收 入的每个词汇都标准了词性和汉语拼音。
《现代汉语常用词表》分为三级; 现代汉语常用词表》 • 一级 常用字1000 • 二级常用字1500 • 三级词常用字 1000 的分级为重要参照, 运用定性与定量相结合的综合集合方法, 辅以定向性联想添加来处理。
现代汉语语料库词语频率表
现代汉语语料库词语频率表(最新版)目录1.现代汉语语料库词语频率表的概述2.现代汉语语料库词语频率表的构成3.现代汉语语料库词语频率表的作用和意义正文一、现代汉语语料库词语频率表的概述现代汉语语料库词语频率表是对现代汉语词汇使用频率进行科学统计和整理的工具。
通过对大量现代汉语文本进行分析,语料库词语频率表可以清晰地展示词语在实际应用中的出现频次,为我们更好地了解和掌握现代汉语词汇提供了有力的数据支持。
二、现代汉语语料库词语频率表的构成现代汉语语料库词语频率表主要由以下几个部分组成:1.词条:即需要统计其出现频率的词语。
词条分为单字词和多字词,如“的”、“了”、“一”、“二”等。
2.频次:指词语在文本中出现的次数。
通过统计不同词语的频次,可以了解其在文本中的使用频率。
3.频率:指词语的频次与总字数之比,用以衡量词语在文本中的出现概率。
频率越高,表示词语在文本中越常用。
4.占比:指词语的频次与总词数之比,用以衡量词语在文本中的重要程度。
占比越高,表示词语在文本中越关键。
三、现代汉语语料库词语频率表的作用和意义现代汉语语料库词语频率表在多个领域具有重要的作用和意义:1.对于语言研究者来说,词语频率表是分析和研究现代汉语词汇特点的重要依据。
通过对词语频率表的分析,可以揭示词汇使用的规律和特点,为语言学研究提供有力支持。
2.对于教育工作者来说,词语频率表有助于优化教学内容和方法。
根据词语频率表,教师可以了解学生应该掌握的词汇范围和优先级,从而提高教学效果。
3.对于翻译工作者来说,词语频率表可以作为翻译词典的重要补充。
通过参考词语频率表,翻译者可以更加准确地把握原文词汇的重要性和翻译策略。
4.对于文字工作者来说,词语频率表有助于提高写作质量。
根据词语频率表,作者可以避免使用过于频繁的词汇,从而提高文章的可读性和新鲜感。
词频统计的主要流程
词频统计的主要流程引言词频统计是一种非常常见且实用的文本分析方法,它可以揭示文本中词语的使用情况和重要性。
在文本挖掘、自然语言处理、信息检索等领域中,词频统计被广泛应用于文本预处理、特征提取和文本分类等任务中。
本文将介绍词频统计的主要流程,包括数据预处理、构建词汇表、计算词频和排序等关键步骤。
我们将逐步深入探讨这些步骤,并给出详细的示例代码,以帮助读者更好地理解词频统计的过程和方法。
数据预处理在进行词频统计之前,需要对原始文本进行预处理,以便去除无用的标点符号、停用词等干扰因素,并将文本转换为合适的形式进行处理。
数据预处理的具体步骤如下: 1. 将文本转换为小写字母,以避免大小写的差异对统计结果造成影响。
2. 去除标点符号,包括句号、逗号、双引号等。
3. 去除停用词,停用词是指在文本分析中无实际含义的高频词汇,如“的”、“了”、“是”等。
常用的停用词列表可以从开源项目或自然语言处理工具包中获取。
4. 进行词干提取,将词语的不同形式转换为其原始形式。
例如,将单词的复数形式、时态变化等转换为词干形式。
5. 分词,将文本按照词语为单位进行切分。
常用的中文分词工具包有jieba、snownlp等。
下面给出一个示例代码,展示如何对原始文本进行数据预处理:import reimport stringfrom nltk.corpus import stopwordsfrom nltk.stem import SnowballStemmerimport jiebadef preprocess_text(text):# 将文本转换为小写text = text.lower()# 去除标点符号text = text.translate(str.maketrans('', '', string.punctuation)) # 去除停用词stop_words = set(stopwords.words('english')) # 英文停用词text = ' '.join([word for word in text.split() if word not in stop_words]) # 进行词干提取stemmer = SnowballStemmer('english')text = ' '.join([stemmer.stem(word) for word in text.split()]) # 中文分词text = ' '.join(jieba.cut(text))return text# 示例文本text = "Hello, world! This is a sample text."preprocessed_text = preprocess_text(text)print(preprocessed_text)以上代码演示了如何对英文文本进行预处理。
对外汉语教材中课文词语汉译英的原则和方法
对外汉语教材中课文词语汉译英的原则和方法(原作者:卢伟Email: 提交:xuyanfei ) 点击:3727 票数:233等级:近年来国内正式出版的对外汉语教材,尤其是供以英语为母语的外国学生自学以及在入门和初级阶段作课堂教学之用的汉语教科次出现的词语通常在生词表中附有英文释义或对应词语。
把这类现代汉语中词频较高的常用词语译成英文似乎只是举手之劳,翻典找出对应词语便大功告成。
然而,事实上词语英译并不都是如此简单。
由于汉英词语之间的语义关系错综复杂,因词语英译不际负迁移”的事例,在对外汉语教学实践中屡见不鲜。
因此,有必要从外语学习或第二语言学习的角度出发,考察以英语为母语习汉语的实际情况,探讨汉语作为外语的教科书中课文词语的汉译英问题。
对外汉语教学的特点决定了对外汉语教材中课文词语的汉译英不但具有一般情况下词语英译的共性,而且还具有它独特的个性。
英时也必须确立与之相适应的原则。
首先,对于外国人学习汉语而言,汉语是一种外语,所以对外汉语教学实质上是一种外语教学或第二语言教学。
成年的外国学生前,母语的语言系统和本族文化系统早已在头脑里根深蒂固。
在学习汉语过程中,母语系统和本族文化系统中与汉语和汉文化相的因素必然干扰和阻碍汉语学习,造成所谓的“语际负迁移”和“文化负迁移”。
我们把对外汉语教材中课文的词语译成英文,实际为母语的学生提·供了汉英词汇语义对比转换的基础。
学生根据所给的某个词语的英文对应词或释义所蕴含的语义信息,从自己词汇”(mentall exicon)中去检索和提取与之相对应的英文词语,并建立起汉英词语之间的语义联英词语的语义完全对应时,就可能产生“语际正迁移”,促进学生正确地理解和使用汉语词语;语的语义不完全对应时、则可能导致“语际负迁移”,妨碍学生正确地理解和使用汉语词语。
因汉译英时,如果能够先在研究学生母语和本族文化的基础上来进行汉语语义解释和汉英词语语义析,然后再动笔翻译、无疑将有助于学生防止和克服母语和本族文化的干扰。
对外汉语初级阶段语块构建研究共3篇
对外汉语初级阶段语块构建研究共3篇对外汉语初级阶段语块构建研究1对外汉语初级阶段语块构建研究随着全球化进程不断加速,汉语不再只是中华民族的语言,越来越多的外国人开始学习汉语。
而对于外语学习者来说,语块的掌握是有效地学习语言的重要手段之一,因为语块是一定意义上的语言最小单位,掌握了语块,外语学习者可以更快地识别和掌握语言规律,从而迅速提高语言表达能力。
因此,对于对外汉语初级阶段语块构建的研究,具有重要的意义。
一、语块的概念语块又称为词块(phrase),是一个汉语语言单元,是汉语语言表达中最常用、最自然的单位,它由几个字组成,构成了一个有语法意义的整体,具有固定的形式和语法功能。
语块是词汇和语法的综合体现,是形式上的固定词组,先于语法规则,而后者则是通过整合固定的词块形成的。
二、语块的特点1. 固定性汉语中的语块是固定的,它们不是通过单词拼接来组成的,而是具有固定的格式和结构。
例如:“早上好”、“下午好”、“晚上好”等,在汉语中是固定的问候语,不能随意替换其中的单词位置。
2. 具有特定意义语块不同于单个词语,它具有固定的短语和句型,能够传达特定的意义。
例如:“一点儿也不”、“不但……而且……”等语块,在传达语义的同时,也传达了特定的语言信息。
3. 具有语法功能语块不仅有固定的语法形式,而且还能遵循一些特定的语法规则,例如主谓宾语结构、定语从句等等。
因此,外语学习者在掌握语块的同时,也能够更好地理解和运用汉语语法规则。
三、对外汉语初级阶段语块的构建1. 基础语块的掌握在对外汉语初级阶段,外语学习者需要掌握一些最基础、最常用的语块,例如问候语、日常交流用语等等。
这些语块语法简单、常用频繁,掌握它们有助于外语学习者更快地进入汉语语境之中,从而更好地理解和运用汉语语言。
2. 语块的分类和归纳对外汉语初级阶段,外语学习者需要了解不同类型的语块,并对它们进行分类和归纳。
例如表示时间、表示数量、表示原因等等语块都有自己的特点和构成方法,通过对这些语块的分类和归纳,外语学习者可以更好地理解和记忆汉语语言规律。
一种新型词频统计方法及其在对外汉语教学中的应用
而且可以更换词典 ,使 统计更加灵活。我们 的教学实践证 明,该词 频统计软件的结果对于对外汉语教学和
教材编写都起到 了很好的指 导作用。 关键词 :对外汉语教 学 词频统计 分词 最大匹配法
1 言 . 引
汉语 国际推广 活动 的深入 发展对对 外汉语教材 编写和 教师教 学提 出 了越 来越高 的要求 。
的规模 。该方 法 的另 外一 个优 点是 可 以灵活 地 更换 词典 ,这 在 教学 活动 中尤其 重要 。例 如
我们 可 以将 词典 换 为 《 汉语 水平 词 汇与汉 字等 级大 纲》① ,这 样就 可 以统 计 出一本 教材 中与 《 纲》相对 应 的各 等级 词汇 的分 布情 况 。 大
参 学 21 1 知 0 0・
一
种新型词频统计方法及其在对外汉语教学巾的应用
杨 泉 冯志伟
要:在对外汉语教 学活动 当中,我们需要用到各种形式的词 频统计结果。为满足这种 需求 ,本文
摘
在现有词频统计方法的基础上提 出了一种快速准确的词频统计方法。我们在词频统计过程 中首先 引入 了可 替换的标准词典,另外还专 门建立 了专有词 汇词典 ,这样不仅可以减少冗余词的 出现 ,提 高统计的速度 ,
一
个最基 础 的词频 统计 算法主 要包括 以下几 个部分 :
( )将被 统计 文 本读入 计 算机 内存 ,转化 成字符 串 。计算机 对 于 串变 量 的存储 ,主要 1
有两种 方法 :数组 表示 和指 针表示 。
( )汉字 的识 别与 词语 匹配 。字符 的识别是 词频统 计 的前提条 件 ,按照 G 2 .0《 2 B 3 28 信 1
区位代表的含义
外 文字 母 及 其 它 图形 字 符 第 一 级 汉 字
对外汉语词表研制的新进展——简评《音节和汉字词汇等级划分》词汇部分
汇等级划分》 以下简称《 ( 等级划分》 正式 出版 , ) 这 是面向全球汉语 国际教育的第一个 国家标准。《 等 级划分》 经过 l 是 7年的不断思考 、 积淀和梳理 , 以
及香 港 1 1年 3万多学 员 的长期 实践 , 了两年 九个 用 月 的时 间研制 出来 的 , 由国 家语 委 语 言 文 字规 范 并 ( 准) 标 审定 委 员 会 审 定 , 中华 人 民共 和 国教 育 部 、 国家语 言文字 工作 委员会 发布 。依 据汉字 、 节 、 音 词 汇 的统计 频度 与覆 盖 率 , 照 中国对 外 汉 语 教学 和 参
的日渐成熟 , 大纲》 比, 等级划分》 与《 相 《 在对语料 的把握 上更加科学合理。筛选 《 纲》 大 的主要依据 是当时国内影响较大的四个动态性频率统计词典和
收 稿 日期 : 0 1 0 2 1 — 5—1 0
26 .亿余字次 , 三媒 体综合语料 达l .9 余字次 。 53 亿 海量语料库的出现无疑使统计结果更加符合汉语的
进展。
一
、
语料选取的跟进
从语料库 的规模上看 ,等级划分》 《 选用 的语料 库远远大于《 大纲》 。以《 现代汉语频率词典》 为例 ,
整 个语 料共 12万 字 , 8 这样容 量 的语料 , 当时 已经 在 是 比较 大 的语 料 库 了。 随着 语 料库 语 言 学 的 发展 ,
・
4 ・ 6
21 0 1年第 6期
翟颖华 : 外汉语词表研制的新进展 对
于 18 90年代 , 等级 划分》 用的语料在考虑 时 而《 所
间均衡性的同时 , 当向当代部分倾斜 , 适 重点选取了 20 20 05~ 0 8年这 四年的语料。语料 在时间上 的跟
对外汉语词汇教学应把握的几个原则
对外汉语词汇教学应把握的几个原则一、本文概述《对外汉语词汇教学应把握的几个原则》一文旨在探讨和阐述在对外汉语词汇教学中应当遵循的几个基本原则。
词汇是语言学习的基石,对于非母语者来说,掌握足够的词汇量是进行有效沟通的关键。
本文将从对外汉语教学的实际出发,分析并提出在词汇教学中应当遵循的原则,以期提高对外汉语词汇教学的效果,帮助学习者更好地掌握汉语词汇,提升汉语水平。
文章将围绕这些原则展开讨论,并结合实际教学案例进行分析,以期对对外汉语词汇教学实践提供有益的参考和指导。
二、词汇教学的基本原则在对外汉语词汇教学中,我们应遵循以下几个基本原则,以确保教学的有效性和学生的顺利学习。
实用性原则:词汇教学应首先关注常用词汇的教学。
常用词汇是语言交际的基础,对于初学者来说,掌握一定数量的常用词汇是首要的。
因此,词汇的选择应以实用性为导向,优先教授那些在日常交际、学习、生活等场景中频繁使用的词汇。
系统性原则:词汇教学应具有系统性,避免孤立地进行词汇教学。
词汇之间往往存在联系,如近义词、反义词、上下义词等。
在教学中,我们应充分利用这些联系,帮助学生建立词汇网络,形成系统的词汇知识。
文化性原则:词汇往往承载着丰富的文化内涵。
在词汇教学中,我们应注意介绍词汇的文化背景,帮助学生理解词汇的文化含义,避免产生误解或误用。
同时,通过词汇教学,也可以增强学生的跨文化交际能力。
趣味性原则:为了提高学生的学习兴趣和积极性,词汇教学应注重趣味性。
可以通过游戏、故事、歌曲等多种形式进行词汇教学,让学生在轻松愉快的氛围中学习词汇。
渐进性原则:词汇教学应遵循学生的认知规律,由易到难、由浅入深地进行。
对于初学者,应从简单的词汇开始教学,逐渐增加词汇的难度和复杂性。
也要注意新旧词汇的衔接和过渡,确保学生能够顺利掌握新词汇。
通过遵循这些基本原则,我们可以更加有效地进行对外汉语词汇教学,帮助学生更好地掌握词汇知识,提高语言交际能力。
三、词汇教学方法与技巧在对外汉语词汇教学中,教学方法与技巧的运用至关重要。
Chinesepod网对外汉语教学课程中生词英译的语义等值问题
Chinesepod网对外汉语教学课程中生词英译的语义等值问题【摘要】Chinesepod网对外汉语教学课程中生词英译的语义等值问题一直备受关注。
本文从语义等值的重要性、困难与挑战、分析、解决方法和实践案例等方面进行探讨。
通过对Chinesepod网生词英译的问题进行深入分析,提出了一些解决方法,并给出了相关实践案例。
最后总结了Chinesepod网对外汉语教学课程中生词英译的语义等值问题,并展望未来研究。
这篇文章旨在帮助汉语学习者更好地理解生词的英译,提高汉语学习的效率和质量。
【关键词】Chinesepod网, 对外汉语教学, 生词英译, 语义等值问题, 研究背景, 研究目的, 重要性, 困难与挑战, 分析, 解决方法, 实践案例, 总结, 未来研究展望.1. 引言1.1 研究背景对于学习者来说,生词英译不仅仅是简单地将中文单词翻译成英文单词那么简单。
在实际的语言运用中,生词英译的语义等值问题成为一个亟待解决的难题。
因为不同语言之间的词汇并不是一一对应的,很多时候一个中文词在英文中可能没有直接的对应译词,或者同一汉语词在不同语境下可能对应不同的英语词汇。
对Chinesepod网对外汉语教学课程中生词英译的语义等值问题进行研究,不仅有助于提高对外汉语学习的效果,也对中文和英文之间的语义转换提出了新的挑战和思考。
在这样的背景下,本研究旨在探讨Chinesepod网生词英译中存在的问题,并提出解决方法,为未来的对外汉语教学贡献力量。
1.2 研究目的研究目的是通过对Chinesepod网对外汉语教学课程中生词英译的语义等值问题展开深入分析,探讨其在汉语学习中的重要性和影响。
通过研究生词英译的困难与挑战,探讨其中存在的语义差异和表达方式的不同,为解决这些问题提供可行的方法和建议。
结合实践案例,探讨如何更有效地进行生词英译,提高学习者的语言水平和交流能力。
通过对Chinesepod网生词英译的实践案例进行研究分析,总结出解决这一问题的最佳实践方法,为未来研究提供新的思路和方向。
对外汉语教材中课文词语汉译英的原则和方法
对外汉语教材中课文词语汉译英的原则和方法近年来国内正式出版的对外汉语教材,尤其是供以英语为母语的外国学生自学以及在入门和初级阶段作课堂教学之用的汉语教科书,其课文首次出现的词语通常在生词表中附有英文释义或对应词语。
把这类现代汉语中词频较高的常用词语译成英文似乎只是举手之劳,翻检一部汉英词典找出对应词语便大功告成。
然而,事实上词语英译并不都是如此简单。
由于汉英词语之间的语义关系错综复杂,因词语英译不慎而导致“语际负迁移”的事例,在对外汉语教学实践中屡见不鲜。
因此,有必要从外语学习或第二语言学习的角度出发,考察以英语为母语的外国学生学习汉语的实际情况,探讨汉语作为外语的教科书中课文词语的汉译英问题。
对外汉语教学的特点决定了对外汉语教材中课文词语的汉译英不但具有一般情况下词语英译的共性,而且还具有它独特的个性。
因此,在汉译英时也必须确立与之相适应的原则。
首先,对于外国人学习汉语而言,汉语是一种外语,所以对外汉语教学实质上是一种外语教学或第二语言教学。
成年的外国学生在学习汉语之前,母语的语言系统和本族文化系统早已在头脑里根深蒂固。
在学习汉语过程中,母语系统和本族文化系统中与汉语和汉文化相异或貌似实异的因素必然干扰和阻碍汉语学习,造成所谓的“语际负迁移”和“文化负迁移”。
我们把对外汉语教材中课文的词语译成英文,实际上是为以英语为母语的学生提·供了汉英词汇语义对比转换的基础。
学生根据所给的某个词语的英文对应词或释义所蕴含的语义信息,从自己头脑里的“心理词汇”(mentall exicon)中去检索和提取与之相对应的英文词语,并建立起汉英词语之间的语义联系。
当汉英词语的语义完全对应时,就可能产生“语际正迁移”,促进学生正确地理解和使用汉语词语;当汉英词语的语义不完全对应时、则可能导致“语际负迁移”,妨碍学生正确地理解和使用汉语词语。
因此,词语汉译英时,如果能够先在研究学生母语和本族文化的基础上来进行汉语语义解释和汉英词语语义的对比分析,然后再动笔翻译、无疑将有助于学生防止和克服母语和本族文化的干扰。
《对外汉语教学入门》笔记周小兵主编解析
《对外汉语教学入门》笔记周小兵主编解析对外汉语教学入门笔记周小兵,李海鸥上编主要介绍学科建设以及教学方法,中编主要介绍语言要素以及文化教学,下编主要讲语言技能教学机测试。
第一编一教学简论1(语言学习的基本概念第一语言第一语言是指孩子最早习得的语言,也就是从父母或者周围其他人哪里自然习得的语言。
第二语言第二语言是指在第一语言之后再学习的其他语言。
目的语目的语是指学习者正在学习的语言。
它的涵盖性强,可以包括第一语言,第二语言,母语,外语,本族语,非本族语,标准语,方言等。
不管是什么语言,只要是一个人正在学习并希望最终掌握的语言,都可以成为目的语。
习得与学习习得是指从周围环境中通过自然学习过的某种能力。
比如说,幼儿站立,行走,饮食的能力,就是自然习得的。
习得无需专门的教师,专门的教学。
习得理论包括强化论,传递论,内在论,认知论等。
学习是从阅读,听讲,研究,实践,训练中获得知识和技能。
多数情况下,学习是指在专门场所由专门教师实施的专门教学,应该有教学计划,教材,教学实施和测试。
学习包括信号学习,刺激—反应学习,连锁学习,多种辨别学习,言语联结学习,概念学习,原理学习和解决问题的学习等。
2(第一语言习得和第二语言学习的差异儿童第一语言习得和成人第二语言学习的区别主要表现在主体,动机,环境,方式,教育者及相关因素,过程和文化等方面。
3(基础学科和相关学科对外汉语教学的产生本身就是多学科交叉的结果,相关学科主要有神经生理学,心理学,语言学,教育学等。
二( 第二语言习得研究第二语言习得研究始于20世纪70年代,并很快成为应用语言学中最有影响的部分。
1(对比分析行为主义学习理论习惯和偏误是行为主义学习理论的两个重要概念。
对比分析的内容对比分析假说的心理学基础是行为主义心理学。
假说有两派:强硬派和温和派。
对比分析的语言学基础是结构主义语言学。
它强调对语言进行细致描述。
对比分析遭遇的批评 20世纪60年代以来,对比分析假说在发展中受到的批评主要来自一下三个方面:非干扰性偏误的事实,理论批评和来自实践的批评。
建立对外汉语学习词典层级体系的构想
建立对外汉语学习词典层级体系的构想高媛媛【摘要】文章围绕学习词典的学习功能,讨论了对外汉语学习词典在数量和编纂质量上的不足以及体系上的缺失,在此基础上提出建立对外汉语学习词典层级体系的构想,建议编纂既符合汉语特点又能满足学习者需求的对外汉语学习词典.这一层级体系不仅要根据汉语语言特点细化汉语学习词典,还要为不同母语的学习者编纂有针对性的学习词典,要丰富语言辨析词典和偏误词典,考虑编纂语言技能学习词典,同时应照顾汉语学习者专业学习的需求.文章分析了对外汉语学习词典体系应包括的各子系统的内容及意义,倡导构建分层分级的对外汉语学习词典体系.【期刊名称】《云南师范大学学报(对外汉语教学与研究版)》【年(卷),期】2011(009)003【总页数】7页(P11-17)【关键词】汉语;第二语言学习;学习者词典;词典编撰;层级体系【作者】高媛媛【作者单位】北京大学对外汉语教育学院,北京100871【正文语种】中文【中图分类】H195;H164在对外汉语学习词典的研究领域,目前学界关注的是如何建立面向学习者的、符合汉语特点的学习词典,以及如何对词典进行技术操作来实现学习词典的学习功能。
对外汉语学习词典如何符合学习者的要求,如何符合汉语语言文化的特点,是对学习词典编纂工作提出的两条基本要求。
对外汉语学习词典作为汉语词典家族的新成员,将为词典学研究提供新的研究领域和编纂思路。
一、关于语言学习词典及其功能语言学习词典是为提高学习者的语言水平而编纂的、反映该目的语言的特点、符合学习者心理需要和学习需求的工具书。
要理解学习词典的内涵和外延,首先要明确以下几个概念:首先,语言学习词典与语言教科书关系如何。
语言教科书是供语言学习者和语言教师使用的课堂教具和教学媒介,具有示范和训练的功能,目的是供语言教学使用;而语言学习词典是存储目的语相关信息并按照一定的次序编排的工具书,是供语言学习者学习目的语时查阅、参考和使用的资料汇编。
COLT-高立群-对外汉语课堂教学量化工具的设计构想
对外汉语课堂教学量化工具的设计构想*高立群孙慧莉*本研究得到教育部人文社会科学研究项目(项目号: 06JA740009)和北京语言大学校级规划项目(项目号: 06GH08)资助,特致谢忱!提要课堂教学是对外汉语教学过程中最重要的一个环节,但由于缺乏有效的客观研究方法和量化工具,导致这方面的研究进展缓慢。
本文首先梳理了国外语言课堂教学研究的主要展,并对COLT量表、IRF话语分析模式以及T-unit句长分析法等常用的观察工具和分析模式进行了评述。
在此基础上,本文借鉴COLT量表的分类系统和操作方式,结合国内对外汉语课堂教学的特点,设计了对外汉语课堂观察量表。
该量表分观察对象、课堂活动和教师语言三个部分,对每部分的设计和使用都进行了详细的说明。
关键词对外汉语课堂教学量化工具一引言现代课堂教学研究最早是出于教师培训的需要。
为深入了解教学过程,把握影响有效教学行为的因素,上世纪50年代,许多研究者开始对课堂教学进行研究。
最早对第二语言课堂教学模式进行研究的是在60年代。
一些研究者利用自然教学实验对不同的语言教学方法进行了比较研究。
Scherer&Wertheimer(1964)在科罗拉多大学对传统的语法翻译(grammar-translation)教学法和听说教学法进行了两年的对比研究。
后来Smith(1970)又在中学对这两种教学法行了四年的对比研究。
这两项研究的结果都表明,听说法并没有获得比传统的语法翻译法更好的教学效果。
这显然出乎许多研究者的预料,不过由此人们也逐渐认识到课堂教学要远比一般人想象的复杂。
由此开始,尤其是进入80年代以后,越来越多的研究者开始致力于对第二语言教学中课堂行为的研究,其研究内容涵盖教学对第二语言学习的作用、教师的语言、学习者的课堂学习行为以及师生的互动。
在对外汉语教学领域,很早就有学者关注课堂教学(黎天睦、姚道中, 1980;施光亨,1981;佟慧君, 1987;马欣华, 1988;岳维善, 1988;崔永华, 1992;孙德坤, 1992)。
话语秩序与对外政策构建:对《政府工作报告》的词汇变化分析
话语秩序与对外政策构建:对《政府工作报告》的词汇变化分析尤泽顺;陈建平【期刊名称】《广东外语外贸大学学报》【年(卷),期】2009(20)2【摘要】本文以Fairclough的话语与社会互动分析及van Dijk的社会认知分析为视角,对1993-2007<中国政府工作报告>中对外政策部分进行历时词汇分析.结果表明,中国对外政策的话语构建是通过对不同类型词汇进行选择和协作使用来完成的:高频词和与中国对外政策基本原则相关的词汇充当了"话语秩序",限定了话语构建的边界;与世界重大事件及中国对外政策调整相关的词构成了"新话语";新老话语之间的竞争和互动最终形成了<报告>的对外政策话语.对外政策话语反映并参与建构社会现实;政策实践反过来(再)加强或(再)生产新的话语,改变"话语秩序"的界限.【总页数】6页(P44-49)【作者】尤泽顺;陈建平【作者单位】广东外语外贸大学,广州,510420;广东外语外贸大学,广州,510420【正文语种】中文【中图分类】H0【相关文献】1.对外汉语教材等级词频统计模块构建——一种辅助对外汉语教材词汇难度评量的工具 [J], 梁少丽;宋继华2.英汉新闻语篇中词汇复现的形式、功能与口译——以“2011杨洁篪外长就中国外交政策和对外关系答记者问”为例 [J], 杨林3.社会转型进程中温州市公共政策体系的构建--基于温州市2000年以来的政府工作报告 [J], 任冬梅;李春来4.大陆对台政策的话语秩序与词汇建构——基于1993~2012年《政府工作报告》语料 [J], 许雅缘;毛浩然5.“日本政治、社会、对外政策最新变化分析与研究”研讨会综述 [J], 江澍;侯瑞方因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
——————————收稿日期:2009年4月7日 第19卷 现代教育技术 V o1. 19 2009年第7期 Modern Educational Technology No.72009 对外汉语教材等级词频统计模块构建——一种辅助对外汉语教材词汇难度评量的工具梁少丽 宋继华(北京师范大学 信息科学与技术学院,北京100875)【摘要】在对外汉语教材的编著过程中,用词频度和难度直接影响教材编著的质量。
根据《汉语水平词汇与汉字等级大纲》(以下简称《大纲》)8000多等级用词目、词性、难度等级三个属性,设计并实现对外汉语教材编著系统难度等级词频统计模块,并在20万教材语料基础上,进行实验。
实验证明,在速度上取得了较为良好的效果。
【关键词】对外汉语教材编著系统;词频检索统计;汉语词汇等级;键树【中图分类号】G40-057 【文献标识码】A 【论文编号】1009—8097(2009)07—0086—04一 引言教材编写是对外汉语教学资源建设的重要环节,如何提升教材编写的速度和质量,使人们从教材编写过程中那些诸如查找生词、控制词汇、加注拼音等费时费力而且容易出错的繁琐工作中摆脱出来,现代技术手段的有机融入是非常必要的。
正如崔永华教授所说的那样:“只有语言学、语言教学和现代技术的完美结合,才能让编写教材变得这么方便、快捷、准确、得心应手。
”【1】对外汉语教材编著系统应运而生,陈锋在其硕士论文《对外汉语教材编写辅助系统的设计与实现》[2]中提到编写教材的流程图如图1所示。
随着计算机、网络、语料库等技术的飞速发展,现代教育技术在对外汉语教学中的应用范围不断拓展,这为对外汉语教材编著系统的技术实现提供了可靠的保障。
图1 编写教材的流程图如何控制教材编写难度等级以适应不同水平教材使用者的需要,同时避免汉语教学内容的盲目性和随意性,一直是教材编写者面对的重要问题。
编写者控制教材难度,主要是通过量化语言点,即对词汇、语法、功能、文化进行分级,检查教材语料分级语言点覆盖以及分布情况,并反复修改教材内容,来达到控制教材水平的目的。
在实际操作中,由于词汇的可控制性最强,所以,水平等级教材主要是在词汇上控制难度[1]。
基于以上论述,本文将尝试着设计并实现对外汉语教材编著系统中的难度等级词频统计模块。
以《大纲》[3] 8000多等级词汇为难度等级依据,统计模块将分别统计出汉语教材语料词汇中甲、乙、丙、丁、超纲词频率,以及这些词在教材各处的分布情况,以确定教材的用词难度,教材编写者可依据该模块得出的统计结果对教材用词进行相应的调整以控制教材的难度水平。
二 难度等级词频统计模块设计与实现目前,出现了一些辅助对外汉语教材编著工具,主要有储诚志博士设计的《中文助教》[4]和厦门大学卢伟等人开发的“基于WEB 的对外汉语教材编著系统”。
《中文助教》通过8000多万字的现代汉语平衡语料库处理分析得出常用度等级生词,提供了使用频度分析[1];卢伟等人开发的对外汉语编著系统中,利用《大纲》对教材语料进行等级词语检索统计以实现教材的定量分析与控制[5]。
这两类工具的教材难度定量分析任务,主要还是通过词汇难度划分来实现的,因此,本文将借鉴此思路,使用《大纲》作为教材难度等级词频分析的重要依据。
《大纲》(1992年)由国家对外汉语教学领导小组办公室修订完成,它不仅为对外汉语教学词汇量的界定、等级的划分、词性的确定等方面提供了较为科学的依据。
同时它也是现阶段国内对外汉语教学设计、教材编写、课堂教学的主要依据,有着严谨的结构和权威性[6]。
本文难度等级词频统计模块设计将直接参考《大纲》中的词汇的词性、难度等级等信息。
1设计思路本文的设计思路如下图2所示:图2 难度等级词频统计模块设计思路图汉语是以字为单位,词与词之间没有明显的边界信息。
当句子长度和句子结构复杂性增加,句中出现的词数量随之增多,除了检索过程中词汇歧义问题将越发突出外,词检索次数也越发频繁。
为了解决这些问题,本文首先使用分词模块对教材语料做分词处理,让处理后的语料得到精确的边界、词性信息;然后,在检索统计模块中,根据分词后语料携带的各种信息,参考《大纲》中给出的词汇、词汇难度等级、词性三者对应关系,做归类统计操作,获得词频、词性词频、词等级难度词频、超纲词数目以及等级词汇和超纲词汇在不同语篇中分布等各类信息。
其中,词汇、词汇难度等级、词性对应关系如图3所示:图3 《大纲》词汇等级与词性的对应关系2 检索统计模块实现文本检索依赖于关键词模式匹配。
多关键词模式匹配是从目标文本中一次查找匹配多个关键词的过程。
文献[7]中借用键树结构[8](图4所示)的双链树形式保存关键字,使用了多关键词模式匹配进行检索。
它的具体做法是:将所有待搜索关键词保存在键树结构中,用叶子结点标志关键词结束,并且在叶子结点中也保存了关键词的频率信息;检索统计时,使用广度优先搜索来匹配目标文本串和树中多个关键词,如果目标文本串在键树中存在一条从根到叶子节点的路径,统计频率加一,否则,放弃对当前的操作,继续处理下一个词。
图4 键树的双链树结构本文在文献[7]的基础上,以《大纲》词汇作为关键词集,在深入分析《大纲》中8000词的基本特征规律、存储特征及词首字在区位码中的分布情况基础上,设计哈希表与键树相结合的存储结构,实现对外汉语教学编著系统中的词汇等级难度检索统计功能。
(1)基于哈希表与键树相结合的存储结构受关键词首字取值以及关键词词长影响,《大纲》关键词存入键树后,形成了一棵根节点孩子兄弟分支深度达到2000多层,而其它分支深度不超过5层的键树结构。
如果能将关键词的首字以某种方式进行分类,重新组织键树结构,将能有效的缩短最长分支的长度。
由此,我们考虑到了汉字区位码,利用《大纲》关键词首字在区码的均匀分布情况,解决以上问题。
汉字在区位码中占72区,其中16区到55区为一级汉字;56区到87区为二级汉字。
《大纲》中关键词首词有2057个,一级汉字有2495个,二级汉字只有8个,绝大部分首字分布在一级汉字中。
对这2495个首字在一级汉字区的深入分析,我们发现这些汉字几乎是等概率分布于各区中,数据如图5所示。
图5 《大纲》词汇首字在一级汉字区中的分布情况本文采用哈希表和键树相结合的存储结构,利用关键词首字区码分割《大纲》关键词键树,将其转化为多颗子键树存储在哈希表中,使每个子键树和哈希表中唯一的存储位置相对应。
改造后的结构如图6所示:图6 改进后的哈希表键树结构(2)构建存储结构步骤:①采用汉字GB-2312码与区号的对应关系,作为哈希映射函数。
插入前,找出关键词首字,使用首字的GB-2312码计算出区码,获得哈希表中当前关键词待插入位置。
汉字区位码与GB-2312码对应关系为:GB-2312码每个字符都用两个字节表示,第一字节为“高字节”,由字符的区号值加上32而形成;第二字节为“低字节”,由字符的位号值加上32。
②确定子键树在哈希表中位置后,查找子键树中是否已存在该关键字,如果不存在,则将关键字插入子键树中;如果存在,直接转入步骤③③检查关键字叶子的结点中,相关的词性、难度等级信息是否建立。
如果不存在相关信息,就建立词性、难度等级间的对应关系;否则,继续插入下一关键词。
例如:“把”字在难等级词表中出现了两次,一次为甲级,对应介词、量词;第二次为丙级,对应动词。
检查“把”字时,也需要两次确认词性、难度等级间的对应关系。
3 实验我们的检索统计实验语料来自于《新实用汉语课本》、《菲律宾华语课本》、《今日汉语》、《当代中文》、《基础商务汉语》等5部汉语教材,语料多达20万字。
以《现代汉语语法信息词典详解》[9]基本词类中定义的18个词性,附加词类中定义的5个词性(前接成分、后接成分、成语、习用语、简称略语)为标准,使用中科院ICTCLAS分词系统(研究版)进行分词,对单独使用键树结构和哈希表与键树相结合存储结构,在语料量和关键字数量上,进行检索统计对比。
硬件环境为Inter Pentium(R) D CPU 3.0 Hz,内存2.0 G;软件环境为Window XP,MyEclipse 6.0,JRE1.6。
实验结果如表1所示。
表1键树结构和改进后的哈希表键树结构检索统计实验对比上表对比分析,语料量大小直接影响检索速度;而在语料量相同的情况下,使用改进后的哈希表与键树相结合存储结构分别存储《大纲》4000词和8000词作为关键词进行检索,两者耗时相差不大。
此外,我们选用畅销海内外的《实用汉语课本》第一册到第五册教材课文,进行词频、词性词频、词等级难度词频、超纲词数目等统计操作。
经过重叠词、地名、人名、时间词、数量词过滤后,得到如表2所示数据。
表2 《新实用汉语课本》系列教材统计结果通过对《新实用汉语课本》1-5册的定量分析,总体来看,随着教材水平层次的加深,甲级占比例逐渐减少,乙、丙、丁级则逐渐上升。
一般情况下,对外汉语教学大纲根据教学目标将教材分为初级、中级、高级,按照对外汉语教学领域经验,初级教材超纲词包括《大纲》丙、丁级词,中级教材超纲词包括《大纲》丁级词。
文献[10]给出对外汉语教材编写和选用的一些参考值,如下表3所示。
我们借用这种标准来衡量《新实用汉语课本》。
《新实用汉语课本》1-2册为基础水平,第一册词汇总体上符合难度要求、第二册的词汇超纲量超出标准9个百分点;第三册、四册作为初级到中级衔接,我们将其按中级标准做处理,第三册、第四册、第五册的超纲词汇比例分别为:25.7%、23.4%、31%。
因此,《新实用汉语课本》3-5册存在超纲情况,并且是略高于标准中的超纲范围。
表3 语言教学内容调整幅度最后,我们选定了一些《大纲》词汇和超纲词汇,测试了这些词汇在《新实用汉语课本》系列教材课文语料中的分布情况,来检验教材循序渐进性(系统性)。
如《大纲》甲级词汇“比较”,以动词词性在第4册50课和第5册55课中各出现1次,以副词词性在8篇课文中出现,其中第4册48课6次,第3册36课和第4册45课各3次;再如超纲词汇“聊天”共出现了4次,第3册27课2次,32课1次,第4册39课1次。
这些也体现了该教材在词汇方面采取了螺旋式的安排方式,有利于学习者的掌握。
三结论本文基于《大纲》资源,利用现代教育技术对教材中词汇进行系统的计量分析,通过构建了辅助对外汉语教材词频等级统计模块,为教材中语料词汇难度定量分析提供了基础。
今后,随着外汉语词汇教学中对词汇常用义项日益重视,要求我们下一步工作主要集中在一个方面,即参考其它词汇教学大纲或词典,用已有的模块统计大规模教材语料,确定词汇的常用义项,人工对词义项划分难度等级,将词义级的词汇频度统计引入到我们的系统中。
——————————参考文献[1]王飙.编教软件《中文助教》评述[J] .国际汉语教学动态与研究,2006,2:98-102.[2]陈峰,对外汉语教材编写辅助系统的设计与实现[D].南京:南京师范大学,2008.[3]国家汉语水平考试委员会办公室考试中心.汉语水平词汇与汉字等级大纲[S] .北京:经济科学出版社,2001.[4]《中文助教》网站[EB/OL].</Jianti%20ChineseTA%20Feature.htm> [5]卢伟.基于WEB的对外汉语教材编著系统理论依据与设计开发[J].外语电化教学,2006,6:30-35.[6]李泉.对外汉语课程、大纲与教学模式研究[M].北京:商务出版社,2006:113-114.[7]马志柔,叶屺.一种有效的多关键词词频统计方法[J] .计算机工程,2006,32(10):190-193 .[8]严蔚敏,吴传民.数据结构(C语言版)[M].北京:清华大学出版社,1996:247-248.[9]俞士汶.现代汉语语法信息词典详解[M](第二版).北京:清华大学出版社,2003:41-42.[10]国家对外汉语领导小组办公室,高等学校外国留学生汉语教学大纲(长期进修) (第三版) [M],北京:北京语言大学出版社,2007:18.Construction of an Approach for Counting Chinese Graded Words and Characters——A Tool for Assessing Difficulty Level of Word in Chinese Language Teaching Materials Writing SystemLIANG Shao-li SONG Ji-hua(College of Information Science and Technology, Beijing Normal University, Beijing 100875, China)Abstract: In the process of writing teaching material of teaching Chinese as a foreign language, Graded Words and Characters directly influence quality of the teaching material. In this paper, on the basis of Graded Words and Characters for Chinese Proficiency, we design Statistics modules for obtaining various frequencies of words in teaching material and showing the distributions of them. We do an experiment with teaching corpus of 200000 characters and get a good performance.Keywords: Word Frequency Counting; Graded Words and Characters for Chinese; Tri-Tree。