“日语学习者书面语语料库”介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

“日语学习者书面语语料库”介绍
1. “日语学习者书面语语料库”是上海交通大学文科科研创新基金项目“学习者笔语语料库及日语教学研究”(项目负责人:张建华;课题编号:08TS1)的部分研究成果。

2. 本语料库是国内高校日语专业学生的作文语料库,收录了上海交通大学、东北师范大学、上海师范大学、上海外国语大学、南开大学等5所高校319名学生的1826篇作文,涵盖了第3学期至第8学期不同学习阶段,字数共计为1127709字。

3. 本语料库包括两种版本的作文语料:标注语料和原始语料。

标注语料是把学生的作文人工录入电脑,并经人工标注各种中介语偏误的语料,原始语料是指学生原始作文的电子扫描语料。

语料的标注包括下列内容:
(1)书写标注:包括汉字错误标注,假名及送假名错误标注等。

(2)词语标注:包括各种用词错误标注、多词标注、缺词标注、以及词的时态、语体和语序等错误的标注。

(3)句子成分标注:包括句子成分多余或残缺的错误标注,句子成分的位置、语体、时态等错误的标注,以及句式和标点符号错误的标注。

(4)篇章标注:包括段落划分错误及格式错误的标注。

4. 为了方便用户能够更充分地使用这个语料库,语料库还提供了作文信息和作者信息。

作文信息:包括作文序号、作者代码、写作学期、文章字数、文章文体、作者的日语学习时间、以及写作是否受时间限制或使用参考书和词典等信息。

作者信息:包括作者的学校、性别、母语等信息。

5. 建设本语料库的根本目的是为用户提供一个考察和研究的平台,为日语教学和研究服务。

运用本语料库可以进行日语教学的多方面研究。

例如:日语中介语研究、第二语言习得研究、日语教学理论研究、日语教材研究、语言测试研究、与日语教学相关的日语本体研究等等。

这些研究对于提高日语教学、日语教材开发、日语本体研究等方面的水平,都具有重要意义。

6. 张建华负责本语料库建设的全面工作,参加各项具体工作的人员是:
参加收集作文语料工作的有:野水まゆみ、吕寅秋、竹中稔和、稻森信昭、桂玉植
参加系统查询检索软件开发的有:杜若飞、幺恩鹏、陈博
参加错误赋码器开发的有:阎腾达、李剑砺
参加标注语料和校对标注工作的有:于杨、陈崇君、葛惠君、朱晔、尹雅萍、邹励耘、黄金、翟四可、屈凌、郭庆瑶。

参加作文语料及相关信息整理工作的有:葛惠君、太文惠、何勇、刘丽瑾、朱晔、尹雅萍、邹励耘、王璇。

参加录入作文和整理电子扫描图片工作的有:上海交通大学日语系2007届、2008届、2009届及2010届的部分同学。

吕寅秋、金文峰、张云凤、何涪嘉参加了前期的部分语料标注工作,伊藤纯英为本语料
库提供了近千余篇作文语料。

7. 在建设本语料库的过程中,我们得到了上海交通大学文科建设处、教务处及外国语学院的大力支持。

此外,原东北师范大学日籍日语教师伊藤纯英为本语料库捐献了个人收集的宝贵资料,上海交通大学计算机科学与工程系ACM班2010届学生杜若飞同学为开发和维护语料库检索系统做了许多细致的工作,在此一并表示诚挚的谢意!。

相关文档
最新文档