汉英句法翻译“连”字句语义分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( 4) 连接, 连续。例如: ④上从晋阳连战, 乘胜逐北。(《汉书# 高帝 纪下》) ( 5) 联合, 联络。例如: ⑤政善战者服上刑, 连诸侯者次之。(《孟子 # 离娄上》) ( 6) 牵连, 连累。例如: ⑥禁尚有连于己者, 理不得相窥, 惟恐不得 免。(《韩非子· 制分》)
《分词规范》所规定的分词原则包括在概 述、具体说明和分词举例附录三个部分中。 其要点有:
1)空格和标点符号是分词单位的分割标志; 2)用“结合紧密、使用稳定”作为划分汉 字串为分词单位的基本原则;
3)四字成语及“结合紧密、使用稳定”的 四字词组一律为分词单位。五字及五字以 上的谚语、格言等如分开后违背原有组合 的意义,则不予切分,是一个分词单位; 否则就切分。 如:“不管三七二十一”不切分,而切分 “失败/是/成功/之/母”。有转义的 词或词组在转义环境下一律为分词单位, 否则予以切分。如:“妇女/能/顶/半 边天”。
汉语自动分词是汉语语言理解与信息处理的基础,汉语习 惯是不分词连写,所以普通中国人对于什么是词是模糊的, 因此通过分词规范来界定一下什么样的汉字组合是一个词是 非常必要的。
由多家单位集体研究形成的《信息处理用现代汉语分词规 范》(以下简称《分词规范》)于1992年由国家技术监督局批 准为国家标准(GBl3715),已经被一些系统所采纳。该规范规 定了现代汉语的分词原则,其目的是推进汉语信息处理的规 范化和兼容性。
汉语自动分词研究的主要内容包括: 1)分词规范问题:即确定什么是词、哪些可以作为分 词的单位; 2)切分算法问题:即如何进行词的切分,以建立符合 实际含义的词的边界;
3)歧义消除问题:即采取什么样的方法消除切分歧义;
4)未登录词识别问题:即如何进行词典中未登录词 (Unknown Word),如地名、人名和译名的识别。
“连”字的虚义衍生 ( 1) 表示/ 包括在内。例如: ⑩余著此经以来, 一千七百余年, 凡传三人, 连子四矣。( 晋# 葛洪《神 仙传》) lv 有三个徒弟, 名唤孙悟空, 猪悟能, 沙悟净, 连马五口, 欲上西天拜佛 取经。(《西游记》) lw苦瓠连根(自) 苦。(《古尊宿语录》) ( 2) 表示/ 从0。例如: lx连太太起, 里里外外的都不干净。(《红楼梦》) ( 3) 语法标记, 与/ 都/ 也0等呼应, 形成/ 连0字句的固定格式。例如: ly没有老孙, 你连水也不能彀哩! (《西游记》)
Байду номын сангаас
“连”字的实义衍生 ( 1) 古代的一种行政单位。例如: ①五家而伍, 十家而连, 五连而暴, 五暴而长, 命之曰 某乡。(《管子# 乘马》) ( 2) 姻亲关系。例如: ②(吕嘉) 男尽尚王女, 女尽嫁王子兄弟宗室, 及苍梧 秦王有连。(《史记# 南越列传》)( 司马贞索引: 连者, 连姻也。) ( 3) 现在军队的一种编制单位, 由若干排组成。例如: ③民相连而从之, 遂成国于岐山之下。(《吕氏春 秋· 审为》)
4)缩略语、非汉字符号串、音译外来词一律 不切分,为一个分词单位; 5)分词单位DHJL化音构成一个分词单位, 如“花儿、悄悄儿”等; 6)切分单位中还存在小于词的单位——语素 (词素),如“新华社/四月/五/日/讯”, 中的“讯”字。
二、“连”字句的语义分析
1、“连”字探源 “连”字的原始意义 “连”是古代一种人拉的车(负车),以 单车拉,有别于“辇”。这种车与拉车的 人之间必须形成一种“相属不绝”的关系, 否则车不能前行。
“连”字句的形成 意义的虚化必然伴随句法功能的变化, 而任 何语言符号都是按其语义密度大小被赋予 意义的。
强调: “连…也/都…”表示强调,有学者认为强 调“说到的事物和其他事物之间的一致 性”;或者“强调和突出动作的主体”; 或者“强调和突出动作的对象”
( 7) 牲畜交配。例如: ⑦马牛乃言, 犬彘乃连。(《吕氏春秋· 明 理》)( 高诱注: 连, 合。) ( 8) 属于。例如: ⑧又有薮曰云, 连徒洲。金林竹箭之所生也。 (《国语· 楚语下》) ( 9) 兼得。例如: ⑨一钓而连六鳌, 合久而趣, 归其国。(《列 子· 汤问》)
.
《分词规范》为了满足计算机处理的需要、 同时避免语言学上关于词的定义的争论, 确定了以分词单位作为将句子切分开的基 本单位。通常用/号表示分词单位之间的 分割符。 分词单位的定义如下:分词单位是“汉 语信息处理使用的、具有确定的语义或语 法功能的基本单位。它包括本规范的规则 限定的词和词组。”
隐含比较 用一种极言其甚的方法表示一种隐含的比 较,表达某种言外之意; “递进/递降”说 表示一种由深到浅、由重至轻、逐步降级 的关系。 “标举极端事例”说 除了表示加合外,表示标举极端事例
“连都”说; 连接单句内的两个成分
对于屈折语如德语、俄语、英语等语言来 说,句子中的词根据其语法意义通常产生 一些词形变化,这些变化由构形附加语素 所承担,通常称之为形态变化。
汉语的书面表达方式是以汉字作为最 小单位的,但是在自然语言理解当中词是 有意义的最小处理单位。把没有分割标志 即没有词的边界的汉字串转换到符合语言 实际的词串,即在书面汉语中建立词的边 界,这就是汉语自动分词(Chinese Word Segmentation)的任务。
汉英句法翻译
2014.10.28
一、机器翻译 二、“连”字句语义分析
一、机器翻译
词法分析 “词法分析”(Morphological Analysis)是一 个泛指的概念,泛指机译系统从接收到 输入串开始到对输入串进行句法层面的分 析之前,对输入串所进行的词一级的处理。
这里的词法分析是指词的形态变化的 分析,即所谓形态还原。而像汉语这样的 孤立语,它没有词的形态变化,但是却存 在着书写时不区分词而连写的形式。所以, 这时的词法分析就需要把词和词切分开来。