汉英句法翻译“连”字句语义分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。





( 4) 连接, 连续。例如: ④上从晋阳连战, 乘胜逐北。(《汉书# 高帝 纪下》) ( 5) 联合, 联络。例如: ⑤政善战者服上刑, 连诸侯者次之。(《孟子 # 离娄上》) ( 6) 牵连, 连累。例如: ⑥禁尚有连于己者, 理不得相窥, 惟恐不得 免。(《韩非子· 制分》)


《分词规范》所规定的分词原则包括在概 述、具体说明和分词举例附录三个部分中。 其要点有:
1)空格和标点符号是分词单位的分割标志; 2)用“结合紧密、使用稳定”作为划分汉 字串为分词单位的基本原则;




3)四字成语及“结合紧密、使用稳定”的 四字词组一律为分词单位。五字及五字以 上的谚语、格言等如分开后违背原有组合 的意义,则不予切分,是一个分词单位; 否则就切分。 如:“不管三七二十一”不切分,而切分 “失败/是/成功/之/母”。有转义的 词或词组在转义环境下一律为分词单位, 否则予以切分。如:“妇女/能/顶/半 边天”。


汉语自动分词是汉语语言理解与信息处理的基础,汉语习 惯是不分词连写,所以普通中国人对于什么是词是模糊的, 因此通过分词规范来界定一下什么样的汉字组合是一个词是 非常必要的。

由多家单位集体研究形成的《信息处理用现代汉语分词规 范》(以下简称《分词规范》)于1992年由国家技术监督局批 准为国家标准(GBl3715),已经被一些系统所采纳。该规范规 定了现代汉语的分词原则,其目的是推进汉语信息处理的规 范化和兼容性。

汉语自动分词研究的主要内容包括: 1)分词规范问题:即确定什么是词、哪些可以作为分 词的单位; 2)切分算法问题:即如何进行词的切分,以建立符合 实际含义的词的边界;



3)歧义消除问题:即采取什么样的方法消除切分歧义;
4)未登录词识别问题:即如何进行词典中未登录词 (Unknown Word),如地名、人名和译名的识别。

“连”字的虚义衍生 ( 1) 表示/ 包括在内。例如: ⑩余著此经以来, 一千七百余年, 凡传三人, 连子四矣。( 晋# 葛洪《神 仙传》) lv 有三个徒弟, 名唤孙悟空, 猪悟能, 沙悟净, 连马五口, 欲上西天拜佛 取经。(《西游记》) lw苦瓠连根(自) 苦。(《古尊宿语录》) ( 2) 表示/ 从0。例如: lx连太太起, 里里外外的都不干净。(《红楼梦》) ( 3) 语法标记, 与/ 都/ 也0等呼应, 形成/ 连0字句的固定格式。例如: ly没有老孙, 你连水也不能彀哩! (《西游记》)





Байду номын сангаас
“连”字的实义衍生 ( 1) 古代的一种行政单位。例如: ①五家而伍, 十家而连, 五连而暴, 五暴而长, 命之曰 某乡。(《管子# 乘马》) ( 2) 姻亲关系。例如: ②(吕嘉) 男尽尚王女, 女尽嫁王子兄弟宗室, 及苍梧 秦王有连。(《史记# 南越列传》)( 司马贞索引: 连者, 连姻也。) ( 3) 现在军队的一种编制单位, 由若干排组成。例如: ③民相连而从之, 遂成国于岐山之下。(《吕氏春 秋· 审为》)

4)缩略语、非汉字符号串、音译外来词一律 不切分,为一个分词单位; 5)分词单位DHJL化音构成一个分词单位, 如“花儿、悄悄儿”等; 6)切分单位中还存在小于词的单位——语素 (词素),如“新华社/四月/五/日/讯”, 中的“讯”字。


二、“连”字句的语义分析

1、“连”字探源 “连”字的原始意义 “连”是古代一种人拉的车(负车),以 单车拉,有别于“辇”。这种车与拉车的 人之间必须形成一种“相属不绝”的关系, 否则车不能前行。



“连”字句的形成 意义的虚化必然伴随句法功能的变化, 而任 何语言符号都是按其语义密度大小被赋予 意义的。

强调: “连…也/都…”表示强调,有学者认为强 调“说到的事物和其他事物之间的一致 性”;或者“强调和突出动作的主体”; 或者“强调和突出动作的对象”




( 7) 牲畜交配。例如: ⑦马牛乃言, 犬彘乃连。(《吕氏春秋· 明 理》)( 高诱注: 连, 合。) ( 8) 属于。例如: ⑧又有薮曰云, 连徒洲。金林竹箭之所生也。 (《国语· 楚语下》) ( 9) 兼得。例如: ⑨一钓而连六鳌, 合久而趣, 归其国。(《列 子· 汤问》)
.


《分词规范》为了满足计算机处理的需要、 同时避免语言学上关于词的定义的争论, 确定了以分词单位作为将句子切分开的基 本单位。通常用/号表示分词单位之间的 分割符。 分词单位的定义如下:分词单位是“汉 语信息处理使用的、具有确定的语义或语 法功能的基本单位。它包括本规范的规则 限定的词和词组。”




隐含比较 用一种极言其甚的方法表示一种隐含的比 较,表达某种言外之意; “递进/递降”说 表示一种由深到浅、由重至轻、逐步降级 的关系。 “标举极端事例”说 除了表示加合外,表示标举极端事例

“连都”说; 连接单句内的两个成分

对于屈折语如德语、俄语、英语等语言来 说,句子中的词根据其语法意义通常产生 一些词形变化,这些变化由构形附加语素 所承担,通常称之为形态变化。

汉语的书面表达方式是以汉字作为最 小单位的,但是在自然语言理解当中词是 有意义的最小处理单位。把没有分割标志 即没有词的边界的汉字串转换到符合语言 实际的词串,即在书面汉语中建立词的边 界,这就是汉语自动分词(Chinese Word Segmentation)的任务。
汉英句法翻译
2014.10.28

一、机器翻译 二、“连”字句语义分析
一、机器翻译
词法分析 “词法分析”(Morphological Analysis)是一 个泛指的概念,泛指机译系统从接收到 输入串开始到对输入串进行句法层面的分 析之前,对输入串所进行的词一级的处理。


这里的词法分析是指词的形态变化的 分析,即所谓形态还原。而像汉语这样的 孤立语,它没有词的形态变化,但是却存 在着书写时不区分词而连写的形式。所以, 这时的词法分析就需要把词和词切分开来。
相关文档
最新文档