现代汉字研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 十口心思,思国思家思社稷;
• 八目尚赏,赏风赏月赏秋香。
• 回文联
• 风送香花红满地,雨滋春树碧连天。
• 香山碧云寺云碧山香,黄山落叶松叶落山黄。
2018/9/5
4、近体诗词 • 回文诗 • 苏东坡 《题金山寺回文体》: • 潮随暗浪雪山倾,远浦渔舟钓月明。 • 桥对寺门松径小,槛当泉眼石波清。 • 迢迢绿树江天晓,霭霭红霞海日晴。 • 遥望四边云接水,碧峰千点数鸥轻。
现代汉字研究
第一节 汉字的特点
• 一、汉字和汉语基本适应 • 1、用单音节的汉字来记录单音节的语素,两者基本 适应。 • 汉字的基本单位是字,都是单音节的。与汉字对应 的汉语单位是语素,也以单音节为主。 汉语以单音节语素为主,同音现象很多,产生了在 书面上区别同音语素的需要。汉字用不同形体的方块 字记录同音语素,是它们在书面上有了区别,便利了 交际。
2018/9/5
分组讨论:
• 一、有人根据汉字字形可以表意,认为汉字是表
意文字。你对这个问题怎么认识? • 二、你认为汉字有哪些特点?其中哪些是优点? 哪些是缺点? • 三、有人说:“汉字是科学、易学、智能型、国
际性的文字、”谈谈你对这个问题的看法。
2018/9/5
第四节 现代汉字的字频统计与分析
三、专门用字: 通用字和常用字是面向全社会各行各业的,而以 社会某个特定的群体用字为对象的就是专门用字。 1、扫盲用字表
•
• •
瑟瑟
隽永
踧踖 觳觫
与其失于偏严,宁可失于偏宽。 现代汉字总字量——10000多个
(二)现代汉字的来源 丁方豪 《现代汉字造字法探索》
传统汉字、新造字、简化字、借用字
2018/9/5
二、通用字,常用字,罕用字 1、通用字——书写现代汉语一般要用到的字。
2、常用字——频度和使用度高的字。 常用字主要是识字教学用字。 3、通用字包括常用字
2018/9/5
• 2、汉字适应汉语同音语素多的特点。
•
•
赵元任 《施氏食狮史》 石室诗士施氏,嗜狮,誓食十狮。施氏时时适 市视狮。十时,适十狮适市。是时,适施氏适市。
•
氏视是十狮,恃矢势,使是十狮逝世。氏拾是十
狮尸,适石室。石室湿,氏使侍拭石室。石室拭, 氏始试食是十狮。食时,始识是十狮,实十石狮 尸。试释是事。
——苏新春
2018/9/5
•
第三节
汉字文化圈的过去和现在
• 一、汉字文化圈的过去
• • • • 汉字文化向外传播主要有三条路线: 向南:壮字和喃字 向东:谚文和假名 向北:契丹字、女真字和西夏字
2018/9/5
方块壮字
2018/9/5
越南的喃字
2018/Hale Waihona Puke Baidu/5
朝鲜谚文
2018/9/5
日文假名
2018/9/5
根据这个规律,我们可以知道: • (1)汉字的常用字非常集中。 • 字频统计中前2400字,覆盖率高达99%。 • (2)字频统计中序号在6600以后的字,不管有多少字种, 总的覆盖率不超过0.001%。
2018/9/5
(二)常用字笔画趋简率
•
王凤阳:“应用频率高的字一般地趋向简化。”
• 1、书法
2018/9/5
2018/9/5
2、篆刻
2018/9/5
2018/9/5
3、对联
• 拆字联: • 蚕为天下虫,鸿是江边鸟。 • 踏破磊桥三块石,分开出路两重山。 • • 冻雨洒窗,东两点西三点。 切瓜分客,上七刀下八刀。
2018/9/5
• 合字联 • 二人土上坐,一月日边明。
• 古木枯,此木成柴;女子好,少女更妙。
2018/9/5
4、选取通用字和常用字的标准 (1)字的频度 (2)字的使用度:综合考虑频度高低和分布的广狭得出 的概念。 (3)字的构词能力和构字能力 (4)生活常识 5、通用字的字量——约7000字 1988年,国家语委与新闻出版署联合发布《现代 汉语通用字表》 ,收现代汉语通用字7000。 6、常用字的字量——约3000字 1988年,国家语委与国家教委联合发布《现代汉 语常用字表》 ,收现代汉语常用字3500个。其中一级 常用字2500个,二级次常用字1000个。 2018/9/5
2018/9/5
第五节
• 一、现代汉字的总字数
现代汉字的字量
• •
字形数:凡是字形不同的就算是不同的字,这样得 到的字数是字形数。 字种数:字形虽然不同,如果所表示的是同一个语 素,就算一个字,这样得到的字数是字种数。
2018/9/5
(一)《现代汉字表》的研制 根据字性审定汉字
• 审定字性要划清两条界线: • 一是现代汉语用字和古代汉语专用字的界线; • 二是现代汉语用字和现代汉语方言用字的界线。
2018/9/5
• • • • • • • • • •
• Shī Shì shí shī shǐ Shíshì shīshì Shī Shì, shì shī, shì shí 10 shī. Shì shíshí shì shì shì shī. 10 shí, shì 10 shī shì shì. Shì shí, shì Shī Shì shì shì. Shì shì shì 10 shī, shì shǐ shì, shī shì 10 shī shìshì. Shì shí shì 10 shī shī, shì shíshì. Shíshì shī, Shì shǐ shì shì shíshì. Shíshì shì, Shì shí shì shí shì 10 shī. Shí shí, shǐ shì shì 10 shī, shí 10 shī shī. Shìshìshìshì .
2018/9/5
二、字频统计的应用
•
• • • •
字频统计是汉字计量研究的基础,另外还可从中发 现汉字使用的规律,推进我们的汉字研究。 (一)汉字效用递减率 字频统计的对象是动态的字,也就是使用状态的字。 周有光对各家统计结果进行分析归纳,抽象出汉字出 现频率不平衡规律: 最高频1000字的覆盖率大约是90%,以后每增加1400 字大约提高覆盖率十分之一。或者说,以后每增加 1400字,欠缺率减少了9/10,只是原来的1/10。
2018/9/5
1977年10月,新华印刷厂印出《汉字频度表》,包括 五部分: 《政治理论频度表》;《新闻通讯频度表》;《科学 技术频度表》;《文学艺术频度表》;《综合频度表 》。 • 由于《汉字频度表》的单字是按频度排列的,不便 检索,后来由中国文字改革委员会的郑林曦、高景成 等校对编成了《按字音查汉字频度表》,1980年出版。 • 1984年,用计算机重新计算,并又增加了些新内容, 编成《汉字频度统计》,1988年4月由电子工业出版社 出版。共有字种5991个。
•
活跃在出版物和媒体上、有生命力的汉字数量非常有限,
高频字非常集中,通用字和常用字数量只有数千。
• 《现代汉语通用字表》收字7000,覆盖率99.999%以上 • 《现代汉语常用字表》收字3500,覆盖率99.48%
2018/9/5
• 2006年出版的《中国语言生活状况报告》统计: • • 最常用的581个汉字能覆盖全部媒体语料的80%, 934个汉字就覆盖了全部媒体语料的90%,
2018/9/5
契丹字
2018/9/5
女真字
2018/9/5
西夏字
2018/9/5
二、汉字文化圈的现在 • (一)中国
中国是汉字的故乡,也是汉字的基地。 简化字是 标准汉字。 • 台湾仍旧使用传统汉字。1980年公布了《标准行 书范本》,其中有不少简体字与大陆《简化字总表》 的字相同或相似。 • 香港和澳门的华人除了分别使用英文和葡文外, 主要使用汉语和汉字。以前使用繁体字,回归祖国后, 简化字在逐渐流行,香港在1984年有人提出了“繁 简由之”的口号,适应了正在变化的形势。 •
• 1999
2018/9/5
汉字字库
91251字
•
汉字为什么会越来越多呢?
• 1、随着社会生活的发展,为了表现新的事物,逐渐创造出
的汉字。——汉字库的主体
• 2、大批的异体字和不规范字 • 3、汉字文化圈国家过去使用的汉字 • 4、新加坡、越南、马来西亚等周边国家的汉字。这些字属 于国际标准的字符集汉字。
汉字和汉文化
• 一、汉字是汉文化的一部分
• • • • 文化有广义和狭义之分 广义:人类在社会实践中所创造的物质财富 和精神财富的总和。 狭义:社会意识形态,以及与之相适应的制 度和组织结构。 我们这里取广义的文化。
2018/9/5
• 二、汉字具有丰富的文化内涵
• 1、有些字的结构显示了先民的生活和意识
字频: 汉字的使用频度,是指在一定的历史时期内经抽样 取得的文字资料里,每一个汉字的使用次数与抽样资 料总字数的比例。 计算公式: 汉字统计分静态统计和动态统计。 静态统计是统计字典、字表里的汉字,字典里的字 头是统计对象。 动态统计是统计图书报刊里实际使用的汉字,统计 每个字在样本里出现的次数,并且计算出它在全部样 本字数里所占的比例。
2018/9/5
(二)新加坡,马来西亚,泰国
• 新加坡 • 1976年5月发布修订本《简化字总表》,所列简化 字与中国的完全相同。 • 马来西亚 • 1981年2月正式颁布《简化汉字总表》,所列简化 字与中国的完全一致。 • 泰国 • 1983年12月同意所有华文学校都可以教授简化字。 发行《简化字与繁体字对照手册》。
2018/9/5
一、综合性的字频统计 1、《语体文应用字汇》(1928年6月,商务印书馆) 现代学者中最早从事汉字字频统计研究的是教育家陈 鹤琴。 第一本现代汉字字频统计的著作。 2、《汉字频度表》、《汉字频度统计》 1974年9月“汉字信息处理系统工程”(简称“七四八 工程” )科研立项。 子项目:研制《信息处理用标准汉字表》。
•
•
2314个汉字的覆盖率达到99%。
使用频率高的常用字是我们开展汉字教学时应该关注 的重点。
2018/9/5
五、汉字结构复杂,但信息量大,视觉分辨率高
•鼠 说 • mouse say
2018/9/5
四、汉字用于机械处理和信息处理比较困难。 五、汉字用于国际文化交流比较困难。
2018/9/5
第二节
2018/9/5
• 4、谜语
• 画时圆,写时方。冬时短,夏时长。
• 三十上下模样,恰似花儿一样。
• 上头去下头,下头去上头。 • 清明节前后。
2018/9/5
• 5、避讳 • 6、文字狱
•
“汉字就是这样,它早已超越了记载口头语 言的纯书面符号的范围,而成为汉民族文化生 活中的一种工具、一种样式。它融入到民族的 文化生活中,承载着汉民族的精神娱乐、文化 传递、消遣休闲的方式与内容。”
2018/9/5
• • • • • • • • •
二、汉字是形音义的统一体。 三、汉字有较强的超时空性。 四、汉字数量繁多但高频字集中 秦 《仓颉》《博学》《爰历》 3300字 汉 《说文解字》 9353字 宋 《通志*六书略》 24235字 清 《康熙字典》 47035字 1971年 张其均 《中华大字典》 49888字 1994年 冷玉龙 《中华字海》 85568字
2018/9/5
3、《汉字频率表》
1986年6月,北京语言学院语言教学研究所编成《 现代汉语频率词典》,由北京语言学院出版社出版。
《汉字频率表》共有字种4574字。 4、《现代汉语字频统计表》 1992年1月,语文出版社出版,统计得到7754个字 种。这次统计对多音字的频率按音项分别计算,这 比过去把多音字作为一个单字来统计更科学。统计 得到13个字频统计表。
• • 男 炮 变动 • 瓷 女 袜 取 为 葬
• 2、有些字形的演变反映了相关事物的发展变化 • 3、新字的产生和旧字的消亡反映出某些文化因素的
《说文解字》收录了104个“马”字部的字。駒、馼、 騏、駁、騅、骄、笃、駫、骄、骇、驚等。 2018/9/5
2018/9/5
2018/9/5
三、以汉字为本体产生的文化现象
2018/9/5
(三)日本 朝鲜 韩国
• 日本 • 日本《当用汉字表》和人名用汉字合计2229个,与中 国规范汉字相比,字形相同的有1212字,占54.37%, 相近的242字,占10.86%。 • 朝鲜 • 1946年废除了汉字,全用谚文。1968年开始恢复汉 字教学,并发行了四种汉字教科书,使用汉字1500个。 • 韩国 • 1948年颁布《谚文专用法案》,限制使用汉字。 1972年制定了《教育基础汉字表》,收字1800个。 韩国的书面语至今仍是汉字谚文混用。