Stanford依存句法关系解释

Stanford依存句法关系解释
Stanford依存句法关系解释

ROOT

要处理文本的语句IP:

简单从句NP:

名词短语VP:

动词短语PU:

断句符,通常是句号、问号、感叹号等标点符号LCP 方位词短语PP:

介词短语CP

由的'勾成的表示修饰性关系的短语DNP

由的'勾成的表示所属关系的短语ADVP

副词短语ADJP

形容词短语DP:

限定词短语QP:

量词短语NN :

常用名词NR:

固有名词NT:

时间名词PN :

代词VV:

动词VC:

是CC

表示连词VE:

有VA: 表语形容词AS:

内容标记(如:

了)VRD

动补复合词CD:

表示基数词DT:

determiner表示限定词EX

existential there 存在句FW:

foreign word 外来词IN:

prepositi on or conjun cti on, subord in ati ng 介词或从属连词JJ adjective or numeral, ordinal 形容词或序数词JJR

adjective, comparative 形容词比较级JJS

adjective, superlative 形容词最高级LS:

list item marker 列表标识MD :

modal auxiliary 情态助动词PDT:

pre-determiner 前位限定词POS

genitive marker 所有格标记PRP

pronoun, personal 人称代词RB

adverb 副词RBR

adverb, comparative 副词比较级RBS

adverb, superlative 副词最高级RP

particle 小品词SYM:

symbol 符号TO:

” to ” as preposition or infinitive marke为介词或不定式标记WDT:

WH-determiner WH 限定词WP:

WH-pronoun WH 代词WP$:

WH-pronoun, possessive WH所有格代词WRB:

Wh-adverb WH副词关系表示abbrev:

abbreviation modifier,缩写acomp:

adjectival complement,形容词的补充;advcl :

adverbial clause modifier,状语从句修饰词advmod:

adverbial modifier 状语age nt:

age nt,代理,一般有by的时候会出现这个amod:

adjectival modifier 形容词appos:

appositional modifier,同位词attr:

attributive,属性aux:

auxiliary,非主要动词和助词,如BE,HAVE SHOULD/COU等到auxpass passive auxiliary被动词cc:

coord ination,并列关系,一般取第一个词ccomp:

clausal complement从句补充complm:

complementizer,引导从句的词好重聚中的主要动词conj :

conju net,连接两个并列的词。

cop:

copula。

系动词(如be,seem,appear等),(命题主词与谓词间的)连系csubj :

clausal subject,从主关系csubjpass

clausal passive subject主从被动关系dep:

dependent 依赖关系det:

determiner决定词,如冠词等dobj :

direct object 直接宾语expl:

expletive,主要是抓取thereinfmod :

infinitival modifier,动词不定式iobj :

in direct object,非直接宾语,也就是所以的间接宾语;mark:

,mwe marker,主要出现在有“ that ” or “ whether ”“ because ” ,:

“ when”

multi-word expression,多个词的表示neg:

negation modifier 否定词nn:

noun compound modifier 名词组合形式npadvmod:

noun phrase as adverbial modifier名词作状语nsubj :

nominal subject,名词主语nsubjpass

passive nominal subject, 被动的名词主语num:

numeric modifier,数值修饰number:

element of compound number,组合数字parataxis:

parataxis:parataxis,并列关系partmod :

participial modifier 动词形式的修饰pcomp:

prepositional complement,介词补充pobj :

object of a preposition, 介词的宾语poss:

possession modifier,所有形式,所有格,所属possessive possessive

modifier, 这个表示所有者和那个 'S勺关系preconj : preconjunct, 常常是出现在“either ” , “both ”,的情况下erpre”et: predeterm iner,前缀决

定,常常是表示所有prep:

prepositional modifierprepc :

prepositi onal clausal modifierprt:

phrasal verb particle,动词短语punct:

punctuation,这个很少见,但是保留下来了,结果当中不会出现这个

purpcl :

purpose clause modifier, 目的从句quantmod :

quantifier phrase modifier,数量短语rcmod:

relative clause modifier 相关关系ref :

referent,指示物,指代rel :

relativeroot :

root,最重要的词,从它开始,根节点tmod :

中文复杂名词短语依存句法分析

优先出版 计 算 机 应 用 研 究 第32卷 -------------------------------- 基金项目:国家自然科学基金项目(61173095),国家自然科学基金重点项目(61133012) 作者简介:陈永波(1990-),男,山东禹城人,硕士研究生,无,主要研究方向为自然语言处理、句法分析、机器学习等(chenyongbo1990@https://www.360docs.net/doc/8b9465242.html,);汤昂昂(1990-),男,硕士研究生,无,主要研究方向为自然语言处理、信息检索、机器学习等;姬东鸿(1967-),男,博士,博导,主要研究方向为自然语言处理、语义网技术、机器学习、数据挖掘等; . 中文复杂名词短语依存句法分析 * 陈永波,汤昂昂,姬东鸿 (武汉大学 计算机学院,武汉 430072) 摘 要:针对中文复杂名词短语的依存句法分析进行了研究,提出简单边优先与SVM 相结合的依存句法分析算法。算法的每一步迭代根据边的特征于每一对相邻子树之间的无向边中选择最优者,然后利用支持向量机根据边两端子树的特征确定该边的方向,即得到两棵子树的中心语之间的依存关系。实验证明对于复杂名词短语的依存句法分析,算法准确率比简单边优先算法有明显提高,且优于基于最大生成树算法的中文句法分析器。算法分析效率更高,时间复杂度为O (n2logn )。 关键词:中文复杂名词短语;依存句法分析;决策式算法;支持向量机;特征 中图分类号:TP391.1 文献标志码:A Dependency parsing of Chinese complex nominal phrase CHEN Yong-bo, TANG Ang-ang, JI Dong-hong (Computer School, Wuhan University, Wuhan 430072, China) Abstract: This paper developed Easy Arc First Algorithm Combined with SVM, and used it in dependency parsing of Chinese Complex Nominal Phrase. In each iteration step, the algorithm finds out the optical non-directional arc among arcs linking neighboring subtrees according to their features, and determines the arc ’s direction using SVM. Results of experiments show that accurate rate of the algorithm is significantly higher than Easy First Arc Algorithm, and higher than Chinese parser based on MST algorithm. Time complexity of the algorithm is O(n2logn). Key Words: Chinese complex nominal phrase; dependency parsing; deterministic algorithm; SVM; feature 0 引言 复杂名词短语的语义解释是自然语言处理领域最具挑战性的课题之一[1]。研究复杂名词短语的依存句法分析算法,对句子依存分析计算复杂性的简化和准确率的提高具有重要意义 [2]。当前主流的依存句法分析算法可以分为三类:基于转换的 算法、基于图的算法和同时基于图与转换的算法。基于转换的算法计算简单,而准确率较低;基于图的算法准确率高,但计算复杂。Yoav 等[3]结合前两种方法,提出了简单边优先算法。该算法能较好地处理长句,却不能移植到复杂名词短语的句法分析。针对复杂名词短语的内部结构特征,本文提出了简单边优先与SVM 相结合的依存句法分析算法。算法考虑了复杂名词短语的内部结构特征,在降低计算复杂度的同时有效地保证了准确率。实验证明该算法能良好地应用于复杂名词短语的依存分析,且准确率和效率高于基于最大生成树算法的中文句法分析器。 本文内容主要分为五部分:本部分为引言;第一部分介绍 复杂名词短语的定义及其语义结构;第二部分介绍依存句法分析的定义及目前的主流算法;第三部分介绍简单边优先与SVM 相结合的依存句法分析算法;实验及结果分析在第四部分。 1 复杂名词短语 1.1 定义 本文的研究对象是指包含至少三个词语且不含助词“的”的复杂名词短语。下面1)和2)给出了两个复杂名词短语的例子。 1) 多种语言现象 2) 多种语言习得 研究复杂名词短语的识别和依存分析对于句子分析的简化和准确率的提高具有重要意义。目前国内外对于复杂名词短语语义结构的研究主要集中在NN 二词短语,而对于多词名词短语的研究比较少见。但多词名词短语的语义结构远非二词名词短语所能涵盖。例如1)中如果没有“现象”,“多种”语义上指向“语言”;如果添上“现象”,则很可能指向“现象”。相比

Stanford依存句法关系解释

ROOT:要处理文本的语句 IP:简单从句 NP:名词短语 VP:动词短语 PU:断句符,通常是句号、问号、感叹号等标点符号 LCP:方位词短语 PP:介词短语 CP:由‘的’构成的表示修饰性关系的短语 DNP:由‘的’构成的表示所属关系的短语 ADVP:副词短语 ADJP:形容词短语 DP:限定词短语 QP:量词短语 NN:常用名词 NR:固有名词 NT:时间名词 PN:代词 VV:动词 VC:是 CC:表示连词 VE:有 VA:表语形容词 AS:内容标记(如:了) VRD:动补复合词 CD: 表示基数词 DT: determiner 表示限定词 EX: existential there 存在句 FW: foreign word 外来词 IN: preposition or conjunction, subordinating 介词或从属连词 JJ: adjective or numeral, ordinal 形容词或序数词 JJR: adjective, comparative 形容词比较级 JJS: adjective, superlative 形容词最高级 LS: list item marker 列表标识 MD: modal auxiliary 情态助动词 PDT: pre-determiner 前位限定词 POS: genitive marker 所有格标记 PRP: pronoun, personal 人称代词 RB: adverb 副词 RBR: adverb, comparative 副词比较级 RBS: adverb, superlative 副词最高级 RP: particle 小品词 SYM: symbol 符号 TO:”to”as preposition or infinitive marker 作为介词或不定式标记WDT: WH-determiner WH限定词

句法结构中的语义分析

句法结构中的语义分析 学习要点:掌握句法结构分析中运用语义关系、语义指向、语义特征三种语义分析方法,并且能够运用这些分析法解释一些常见的语言现象。 句法结构是句法形式和语义内容的统一体。对句法结构不仅要做形式分析,如句法层次分析、句法关系分析、以及句型分析等,还要做种种语义分析。句法结构中的语义分析主要指语义关系、语义指向、语义特征三种分析法。 一、语义关系 (一)句法关系和语义关系 在句法结构中,词语与词语之间不仅发生种种语法关系,主谓、述补、述宾、偏正、联合等,而且发生种种语义关系。语义关系,语义学中指语言成分所表示的客观对象之间的关系,我们所说的语义关系是指动作和动作者、动作和受动者、动作和工具、动作和处所、事物和事物之间的关系等。句法关系和语义关系可能一致,也可能不一致。 ⑴吃面条。/削苹果。(句法、语义关系一致。) ⑵我吃完了。/饼干吃完了。/文章写好了。(句法、语义关系不一致) 前者“我”与“吃”是动作者(施事)和动作的关系,后者“饼干”和“吃”是受动者(受事)和动作的关系,结果和动作的关系。 一种句法结构关系,可能包含着多种语义关系,如:修理家具。/挖了一个坑。/来了一个客人。/写毛笔。(述宾关系,受事、结果、施事、工具。)反之,一种语义关系也可能构成多种句法结构关系。 ⑶沙发上坐着一个人。 ⑷那个人坐在沙发上。 ⑸那个人在沙发上坐着。 这几个句法结构的语义关系基本相同,“人”“沙发上”与“坐”之间都是“施事”“处所”与“动作”的关系;但句法结构关系却不一样。 (二)动词和名词语义关系的类别 汉语句法结构中的语义关系是多种多样的,句法分析的重点是动词跟名词性词语之间的语义关系。在各种语义关系中,名词性成分担任了一定的语义角色,如“受事、结果、施事、工具”等,这实际上也就是揭示了名词性成分跟动词之间的关系。名词性词语经常担任的语义角色主要有: 1、施事:指动作的发出者(可用介词“被、叫、让、给”引进) 他在看书。/小狗啃完了骨头。/敌人被我们打败了。 2、受事:指动作行为的承受者(可用介词“把、将”引进)。 小牛吃草。/张三修桌子。/毛把花瓶打碎了。 3、系事:指连系动词联接的对象(?) 我们是教师。/小王成了大学生。 4、与事:指动作行为的间接的承受者(送、还?)(可用介词“给”引进)。 张三还李四一支笔。/我给兰兰送去一些巧克力。 5、结果:指动作行为产生的结果。 编草帽。/烙饼。/做烟斗。/打毛衣。/盖大楼。

空间句法的新方法_比尔_希利尔

54 世界建筑2005/11 1 步行可达指数。图中显示了影响伦敦哈罗兹,金茨桥区域的步行活 动的重要因素。/Walkability Index.Bar chart showing significantfactors influencing pedestrian movement in the area aroundHarrods in Knightsbridge, London, as identified by the WalkabilityIndex.2 同一地区的步行活动预测图显示出了对新的联系(金茨桥和海德公园之间)的需求,可以同其他重要因素联系起来。预测等级通过不同 空间句法是一种研究城市的方法,主要是了解社会和经济因素是如何逐步影响并形成空间的。用当今的流行术语来说就是把城市看成是自组织系统。 空间句法最为人所知的方面也许是它建立了在建筑环境里分析空间模式或者说分析空间组构的方法。这些方法不仅揭示了城市中的空间结构,而且把它们和人的移动、停留和交流方式相联系。空间句法还能预测设计和规划所带来的中长期效果,因此,能让设计者和规划者在工作中遵循社会和经济发展规律,而不是违背它们。 这些研究方法已经在一段时间内得到了成功地运用,其中包括轴线分析法(用来分析城市街道网络和步行系统)和“可视性分析”(用来分析公共空间内的视域模式)。但是同时新的分析方法正不断地由伦敦大学学院空间句法实验室以及它的商业合作伙伴空间句法有限公司开发和研究出来。本文将简要地介绍其中一些发展。 组构的修正:步行可达指数 正如空间句法理论所说,空间组构强烈地影响人的流动,但并不意味着组构完全决定了人流或者它的作用是放之四海皆准的。在一些案例中,组构的影响比较弱,所以,要理解人流模式或者预测设计结果就需要一些其他额外的信息。这些附加的信息包括一些相关因素,如交通节点、土地利用、临街建筑、基础设施、主要吸引物和美学因素等。 现在这些其他因素都通过最近研发的一项称为步行可达指数的技术整合到了组构模式上。步行可达指数是 建立在统计学方法的多重回归分析(MRA)的基础上。多重回归分析是经验性地分析数据,以此来决定每个元素作为人流模型中所起的可变量作用。多重回归分析模型可以更好地理解与人流模式相关的问题,因为它强调了因素的相对重要程度,比如建筑高度、交通节点或者活跃的临街行为等等,有时它们和局部整合度(影响人流的主要组构量度)一样重要。 同时,改变不同的输入变量的值,例如那些步行道的宽度或者活跃临街行为的数量,都可以帮助预测可能发生的人流模式。事实上,这些因素的结合是可以被分析和修改的,这也就有了一个灵活性的方法。 步行可达指数在一些地区尤其有效,这些开发对空间结构、人流和土地利用的影响不同步,比如伦敦的大象城堡(Elephant and Castle)地区(它的总图设计采用了很多空间句法分析)。实际上,对于这样一个技术的需求正好说明路网结构、人流和土地利用三者之间的协调发展是一个发育良好的城市的产物。这也许是为什么传统城市更为人称道的主要原因。这并不意味着城市必须设计得和过去一样,但是却意味着它们设计的根据应借鉴那些具有活力的城市的经验。 更精确尺度的组构:线段分析 空间句法的一个很大优势在于它可以同时在城市宏观和微观尺度上分析空间。线是都市分析的一个主要单位(这反映了一个事实:城市空间本质上是一个线性空间网络)。但是这并不是我们需要了解的最精确的尺度,因为这些线在交点之间的不同线段经常是起着不同作用的。同样重要的是要考虑到不同城市存在非常不同的几 何形式,从更加网格状到更加有机状。 为解决这些问题,现在发展出了一种新的句法模式。它仍然是建立在线网的基础上,但是它的基本单位是交点之间的线段。这种模式不仅能在更精确的尺度上进行结构分析,而且可以通过不同的方式定义一个节点和另外一个之间的距离来进行不同类型的分析:实际路程距离(从点A到点B多远),最少转弯距离(一条路线有多少转弯),最小角度距离(两点之间的实际路径与连接两点的直线所形成的偏差角度大小)。这些不同的分析方法从不同的方面反映了都市的复杂程度。 尽管这种新模型还在研究测试中,但是它已经被证明对于分析城市最微观尺度的土地利用变化非常有效。这个模式现在被用来分析更精确的人流模式,同时它也指明了路程、几何和拓扑3个元素的作用使得城市空间网络本身形成了人流。这个领域的重要新成果在不久的将来公布,某种程度上可能是惊人的成果。 主观的组构:空间中智能行动者 现在来介绍最新的发展:EVAS空间中智能行动者。它是从视线分析(VGA)方法发展而来,已经被运用在很多公共空间项目上,包括最近的特拉法加广场(Trafalgar Square)的重新设计。 EVAS创造了虚拟环境(它建立在地图或者建筑图纸基础上),然后给虚拟的智能行动者赋予限制视角的朝前的视域。当这些智能行动者四处活动时,他们用“感知—行动”的规律来指导他们的运动行为,例如他们会被某个进入视野的特殊物体所吸引。如果环境改变(例如模拟一个新设计),EVAS会显示人流模式如何相应变 空间句法的新方法 NEW METHODS IN SPACE SYNTAX 比尔?希利尔,克里斯?斯塔茨/Bill Hillier, Chris Stutz 作者简介:比尔?希利尔 ,伦敦大学学院巴特雷特研究生院教授 兼院长,空间句法咨询公司非执行董事。 克里斯?斯图兹,空间句法咨询公司副主管。 收稿日期:2005-10-09 1 2 颜色来表达,红色最高,蓝色最低。/Pedestrian movement forecast map of same area with proposed new link (betweenKnightsbridge and Hyde Park), incorporating likely effects oflayout/configuration and other significant factors. Forecastlevels for each segment are represented on a colour scale, withhighest levels red and lowest levels blue. 影响步行活动的因素/Factors influencing movement 非常重要/Very significant 不重要/Not significant 重要/Significant 空间布局/Spatial layout 零售/Retail 地铁/Tube 特殊因素/Special 静止边界/Inactive frontages 哈罗兹/Harrods

句法分析工具指南(parser guideline)

PARSER GUIDELINE S tanford parser 一个简易的Stanford parser系统只需要包含四类文件,它们分别是:①java包(最新版本为stanford-parser-2011-04-20.jar)、②模板(英文:englishFactored.ser.gz/englishPCFG.ser.gz/wsjFactored.ser.gz/wsjPCFG.ser.gz。中文:chinesePCFG.ser.gz /chineseFactored.ser.gz/xinhuaFactored.ser.gz/xinhuaPCFG.ser.gz)、③输入文件(一般为.txt后缀的分词文件(、④输出文件(一般为.parse后缀的成分句法树文件或是以.dep 后缀的依存句法树文件) 1.英文句法分析 举例: Java -mx1g -cp stanford-parser-2011-04-20.jar edu.stanford.nlp.parser.lexparser.LexicalizedParser -maxLength 100 –outputFormat oneline -sentences newline -outputFormatOptions removeTopBracket englishFactored.ser.gz input.txt > output.std_Factored_parse 参数解释: ①-mx1g:给java虚拟机分配的最大内存为1g(大小可自行设置)。 ②-cp :为了加载java包stanford-parser-2011-04-20.jar。 LexicalizedParser:parser类. ③-maxLength:指定句子单词长度最大为100。 ④–outputFormat:指定输出句子的格式。 outputFormat具体选项值如下: Oneline:成分句法分析输出文件的格式为每行一句的广义表形式的树结构。Penn:成分句法分析输出文件的格式为层次化树的形式。默认选项为penn。latexTree:格式类似于penn Words:只给出分词格式。如: 继续播报详细的新闻内容。 wordsAndTags:给出分词文本和标记。如: 继续/VV 播报/VV 详细/VA 的/DEC 新闻/NN 内容/NN 。/PU rootSymbolOnly:只给出ROOT结点 typedDependencies:给出依存句法分析结果。 mmod(播报-2, 继续-1) rcmod(内容-6, 详细-3) cpm(详细-3, 的-4) nn(内容-6, 新闻-5) dobj(播报-2, 内容-6) conllStyleDependencies、conll2008:conll格式(每行一词,每词十项)如下: 1 继续_ VV _ _ 2 _ _ _ 2 播报_ VV _ _ 0 _ _ _ 3 详细_ VA _ _ 4 _ _ _ 4 的_ DEC _ _ 6 _ _ _ 5 新闻_ NN _ _ 6 _ _ _ 6 内容_ NN _ _ 2 _ _ _

基于空间句法的网络城市评价体系研究

基于空间句法的网络城市评价体系研究 李云飞 【摘要】:在经济全球化和知识经济迅猛发展的背景下,城市的网络化特征越来越明显,“网络中的城市”和“城市中的网络”已成为学术界研究的热点。本文试图从空间句法的视角来研究“城市中的网络”。不同于传统定性分析方法,空间句法提供了一种全新的、理性的、可量化的对城市网络的空间表示与分析方法。本文通过选取空间句法理论中跟城市形态相关度比较高的四个参数——全局整合度、局部整合度、可理解度、空间智能度,来构建网络城市结构的评价体系。并以长沙为实例,通过对长沙市三个不同时期的现状和城市总体规划空间结构特点的研究,分析城市内部的发展潜力以及城市整体空间结构发展趋势,为实现长沙城市空间的可持续发展提供决策支持;2009年长沙城市空间现状网络的空间智能度印证了长沙市芙蓉CBD选址的合理性;2009年长沙市现状网络的全局整合度与长沙市高层建筑布局规划研究结果进行对比,发现两者具有很大的相似性,反证了长沙市高层建筑布局规划研究结论的合理性。 【关键词】:网络城市空间句法城市空间 【学位授予单位】:中南大学 【学位级别】:硕士 【学位授予年份】:2009 【分类号】:TU984.113 【DOI】:CNKI:CDMD:2.2009.240867 【目录】: ?摘要3-4 ?ABSTRACT4-8 ?第一章绪论8-17 ? 1.1 研究背景与意义8-11 ? 1.1.1 研究背景8-10 ? 1.1.2 研究意义10-11 ? 1.2 研究思路与内容11 ? 1.2.1 基本思路11 ? 1.2.2 研究内容11 ? 1.3 本文框架11-12 ? 1.4 国内外相关研究综述12-17 ? 1.4.1 国外相关研究13-14 ? 1.4.2 国内相关研究14-17 ?第二章空间句法概述17-39 ? 2.1 空间句法的产生和发展17-18 ? 2.2 组构18-19 ? 2.3 网络19

Stanford依存句法关系解释

ROOT 要处理文本的语句IP: 简单从句NP: 名词短语VP: 动词短语PU: 断句符,通常是句号、问号、感叹号等标点符号LCP 方位词短语PP: 介词短语CP 由的'勾成的表示修饰性关系的短语DNP 由的'勾成的表示所属关系的短语ADVP 副词短语ADJP 形容词短语DP: 限定词短语QP: 量词短语NN : 常用名词NR: 固有名词NT: 时间名词PN : 代词VV: 动词VC: 是CC

表示连词VE:

有VA: 表语形容词AS: 内容标记(如: 了)VRD 动补复合词CD: 表示基数词DT: determiner表示限定词EX existential there 存在句FW: foreign word 外来词IN: prepositi on or conjun cti on, subord in ati ng 介词或从属连词JJ adjective or numeral, ordinal 形容词或序数词JJR adjective, comparative 形容词比较级JJS adjective, superlative 形容词最高级LS: list item marker 列表标识MD : modal auxiliary 情态助动词PDT: pre-determiner 前位限定词POS genitive marker 所有格标记PRP pronoun, personal 人称代词RB adverb 副词RBR adverb, comparative 副词比较级RBS adverb, superlative 副词最高级RP

particle 小品词SYM: symbol 符号TO: ” to ” as preposition or infinitive marke为介词或不定式标记WDT: WH-determiner WH 限定词WP: WH-pronoun WH 代词WP$: WH-pronoun, possessive WH所有格代词WRB: Wh-adverb WH副词关系表示abbrev: abbreviation modifier,缩写acomp: adjectival complement,形容词的补充;advcl : adverbial clause modifier,状语从句修饰词advmod: adverbial modifier 状语age nt: age nt,代理,一般有by的时候会出现这个amod: adjectival modifier 形容词appos: appositional modifier,同位词attr: attributive,属性aux: auxiliary,非主要动词和助词,如BE,HAVE SHOULD/COU等到auxpass passive auxiliary被动词cc: coord ination,并列关系,一般取第一个词ccomp: clausal complement从句补充complm: complementizer,引导从句的词好重聚中的主要动词conj :

空间句法的简易应用

空间句法的简易应用 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

空间句法的简易演示 1、研究方法 空间句法主要有三种研究方法:凸多边形法、轴线底图法、视区分割法,建筑和城市研究多采用前两种方法,本演示说明只针对前两种方法进行简单演示。 凸多边形法: 凸空间定义:假设一个空间内部,任意两点之间可以相互看见(all see all)(如图)。 凸多边形法:适用于将建筑空间转换为二维平面图,进而计算空间之间的相互关系,通过准确描述空间结构,来观察人的行为和社会活动,反作用于研究建筑空间的合理性和功能性。 左边空间为凸空间,右边空间由于部分点之间视线遮挡,不能定位为凸空间。 轴线底图法适用于城市范围内的空间和道路空间可达性的研究。 2、软件应用 (1)凸多边形法演示——以单层建筑平面为例 在网络上下载UCL 的Depthmap10进行安装,并打开软件。 Ctrl+N,新建一个graph文件。 在此之前,我们按照建筑平面进行凸空间整理,以下图空间为例,首先在CAD里进行凸空间绘制。 绘制完成后将CAD文件另存为“dxf”文件,用于导入Depthmap中。 按Ctrl+I,导入Depthmap中,并将文件转化为“Convex Map”(凸空间模型,转为Convex Map;轴线模型,转为Axial Map;线段模型,转为Segment Map。),软件才可以进行凸空间运算。

运算完成后,得到有颜色的结果,对于有数值的,空间句法采用是颜色级别显示策略,如果一个元素是灰色的,说明这个元素是没有数值的,需要在CAD里重新绘制。 然后设定空间之间的连接关系,常用按钮为Link和Unlink,。 点击“Select”退出编辑,然后进行运算。 在Depth Map→Axial/Convex/Pesh→Run Graph Analysis,弹出对话框。 对话框中的参数设置,最上面为Rdius,设置计算半径,数值选择有“n, 3,5,7,9,11”,以任意一个空间元素为中心,再以“全系统”、“半径3”、“半径5”、“半径7”等以此类推为限制条件,分别进行某个算法的计算。每一项都要打上勾,最后一项的意思是“以什么为权重”,凸空间模型一般选择“Connectivity”,在研究城市课题的空间句法模型中,经常需要考虑“米制距离”,一般是在轴线模型中,这时应选择weight by“Length”。 点击“OK”后,就会出现软件计算完成的结果,窗口左侧出现了参数选择栏,可拖动参数选择栏右边的滚动条进行上下浏览,不宜用鼠标滚轮,滚轮一动,易造成右侧图形的消失,这时可以用“Recenter” 这个命令,将图形最大化显示。 至此,凸空间模型的软件操作已经告一段落,接下来即是结合建筑与城市规划的知识进行读图分析。 (2)轴线底图法——以城市为研究对象,采用轴线模型,进行道路可达性分析操作演示。 主要分析流程 选择研究范围:可以以环城高速作为边界,或者选择规划边界作为研究边界,并设置一个足够大的缓冲区。 在CAD里进行轴线绘制,注意要点如下: (1)交接处要稍微出头,确保连接关系的正确表达; (2)对空间的概括要准确,尽量按照“最长也最少”的原则选择更简化、更合理的表达方式。 S形街道的轴线绘制示例交通转盘的轴线绘制示例

基于依存句法的实体关系抽取

龙源期刊网 https://www.360docs.net/doc/8b9465242.html, 基于依存句法的实体关系抽取 作者:周亮俊 来源:《电子技术与软件工程》2016年第24期 本文首先介绍了自然语言处理的概念,并给出了自然语言处理模型,与此同时,分析了依存句法的有关问题,包括其公理以及具体分析方法等,最后阐述了基于依存句法的实体关系抽取过程。 【关键词】计算机自然语言处理依存语法实体关系抽取 计算机技术与人工智能的结合,形成了自然语言处理,使得人与计算机的结合更加紧密,依存句法能够实现对实体关系的抽取和对自然语言的分析,进而使自然语言处理成为可能,这对于信息抽取效率的提高以及人与计算机之间联系的加强意义重大。 1 自然语言处理 1.1 自然语言处理的概念 自然语言处理,是计算机领域的一种技术,是计算机技术发展到一定阶段,与人工智能逐渐结合的产物。自然语言即人类的常用语言,自然语言处理的意义在于,对上述语言进行处理,使其能够被计算机所识别,进而将其应用于计算机软件系统当中,使软件的研发以及修改等得以实现的一种技术。鉴于语言本身存在复杂性的特点,因此自然语言处理的实现也十分复杂,建立相应的计算模型,是使处理过程能够有效实现的基础。 1.2 自然语言处理模型 自然语言处理模型由自然语言(N)、问题(P)、模型(M)、算法( A)、输入集(I)与输出集(O)几种因素组成。自然语言属于人类的语言,计算机作为机器,不能够对其进行识别,将其转换为问题,能够使其与计算机的识别要求相适应,与此同时,使其以模型的方式体现,可以使自然语言处理得以实现。在充分考虑输入集的前提下,应用相应的算法,将其与在问题的基础上所得到的模型相结合,能够产生输出集,最终完成自然语言处理过程。 2 依存句法 依存句法的应用,是实现自然语言处理的基础。在依存句法的基础上,自然语言能够以依存树等形式存在,为语言的处理提供了便利条件。 2.1 依存句法公理 依存句法的公理主要包括以下几方面内容:

经典英语句法分析材料

学法指导:英语学习要重视句子分析 Module 1 前言:为什么要学习句子分析 英语句子分析能力,只是英语语言能力的一部分,但该能力是学英语的基础,是你学习其他语法的工具(比如学定语从句非谓语动词等等)。具备了英语句子成分分析能力,最直接的作用就是帮你弄懂句子,尤其是长难句。 学会英语句子成分分析,至少在以下两个方面对大家有所帮助: 一、能听懂英语课。在英语课上(高中英语或更高级),英语老师不可避免的要讲到主语、谓语、宾语、定语、壮语、补语,而这时就有一部分同学(英语语法特别差的)听不懂课,老师一提到这个什么什么是来作状语的,他们就糊涂了:什么是状语呀???而且,年级越高,语言越复杂,老师提到这些东西的频率就越高。上课听不懂的地方越来越多,很多同学慢慢的就不感兴趣了,就没有任何学英语的感觉了,甚至就不学了,或有意无意地逃避英语学习。这是很多英语差生的基本发展轨迹。 二、能帮你读懂英语文章及相关英语学习资料。教材上(特别是高年级)都会讲到语法,会有大量的例句,其中不乏长难句,不可避免的要涉及句法分析,有部分同学就会弄不懂;至于大家买的资料,无论是要点讲解还是习题详析,也都离不开句法分析。很多时候,老师会安排大家自主学习,基础差的同学就会有重重困难,其中,句子成分知识的缺乏,是一个重要的基本的原因。. 以阅读活动为例,据编者多年的高中英语 教学经验分析,同学们的英语阅读困难主要在 两方面: 其一、单词关。基本的核心的词汇严重匮乏,满眼都是生词,是不可能看懂句子的。记 单词是硬功夫,只能靠自己去下工夫解决。记 单词基本没有什么特别的捷径,主要是按照记 忆规律,重复记忆。一些具体的记忆策略,比 如联想记忆、在课文中记忆,在句子中记忆等等,都是很高效的。 其二、语法关。主要指英语句子结构的分析。因为,如果你不懂句法分析,即使你单词 关过了,句子中大部分单词都认识,还是有可 能看不懂句子。这是因为,你不知道哪个(些)单词和哪个(些)单词是放在一起的,或者说,你不会根据句子成分分析来划分意群。 编者无意在此过分强调语法的重要性,号 召大家都成为语法专家。比如,有些同学语法 不好,英语成绩却照样能达到一定程度,这部 分同学靠的是通过多读多背获得的语感。语感 和语法对于学生来说都很重要,语感是从感性 角度出发的,不一定正确,语法是从理性分析 角度出发的,正确率要高一些。如果能把二者 结合在一起,正确率无疑会达到最高。那样的话,大家就可以成为英语高手了,至少是英语 考试的高手。 那么,从最基础的东西说起,我们要掌握 什么呢?首先,大家头脑中要有词类的概念, 然后学会简单句五种基本句型及句子成分的分析,再然后就是并列句和复合句的分析。 祝福读到这份材料的,所有对英语不死心、对自己有信心的同学们!愿大家早日彻底 告别稀里糊涂学英语的历史! Real knowledge, like everything else of value, is not to be obtained easily , it must be worked for, studied for, thought for, and more than all, must be prayed for. ----- Thomas Arnold 真知如同珍宝,不是轻易获得的,必须学习、钻研、思考,最重要的是必须有强烈的求 知欲。 -- 托马斯?阿诺德 Come on !!!Good luck!!!

再论“空间句法”(图文整理详细版)

再论“空间句法”(图文整理详细版) 作者:张愚王建国 国内建筑界对空间句法的了解,多数仅限于由赵冰翻译的《空间句法——城市新见》一文[1]。发表于1985年第一期《新建筑》上的这篇文章,简要介绍了早期的空间句法方法在城市空间形态研究方面的应用,但未全面介绍其方法背景、原理和其他应用,因此,至今很多人仍颇有不解或“持保留态度”[2]。多年来,空间句法在各方面已有长足发展,国内杂志却鲜有论及。本文试图比较清晰地介绍和评析空间句法的理论、方法、实践及其最新研究进展。 简单地说,空间句法是一种通过对包括建筑、聚落、城市甚至景观在内的人居空间结构的量化描述,来研究空间组织与人类社会之间关系的理论和方法(Bafna, 2003)。它是由伦敦大学巴利特学院的比尔•希列尔(Bill Hillier)、朱利安妮•汉森(Julienne Hanson)等人发明的。早在1974年,希列尔就用“句法”一词来代指某种法则,以解释基本的但又是根本不同的空间安排如何产生[3]。到1977 年,空间句法研究则略具雏形。经过二十余年的发展,空间句法理论已经深入到对建筑和城市的空间本质与功能的细致研究之中,并得到不断完善;由此开发出的一整套计算机软件,可用于建成环境各个尺度的空间分析;而且在建筑和城市设计中进行了广泛的应用。如今,空间句法的研究和应用已经在世界范围内普遍展开。 1997年,首届世界性的空间句法研讨会在伦敦举行;其后于1999年和2001年又在巴西利亚和亚特兰大举行了第二和第三届。2003年6月,在伦敦刚刚举行的第四届研讨会上,来自世界数十个国家和地区的82篇论文,从不同角度对空间句法进行了广泛深入的探讨。另外,日趋成熟的空间句法分析技术,已经成功应用于商业咨询。理查德•罗杰斯、诺曼•福斯特、泰瑞•法雷尔等知名事务所,在众多建筑和城市设计项目中雇请空间句法咨询公司进行空间分析,为其设计提供了有力的引导和支持。 由于篇幅所限,本文以解释构形概念为主线,重点从空间知觉的角度简析空间句法的方法原理,使读者能真正理解并实际运用它;而对于空间句法的理论概念和具体应用成果仅作扼要介绍。 1. 构形与建筑学 1.1 构形的含义 构形(configuration),从字面上看,是指“轮廓由其各部分或元素配置决定的外形”(据美国传统辞典)。希列尔将构形定义为“一组相互独立的关

038、基于空间句法的城市历史街区的功能优化——以哈尔滨市道外传统商市风貌保护区为例

基于空间句法的城市历史街区的功能优化 ——以哈尔滨市道外传统商市风貌保护区为例 周慧 摘要:历史街区的功能优化应遵循保护和更新相结合的原则,无视于原有居民改善生活环境需求的历史街区保护违背了“发展”的本质内涵。本文旨在基于空间句法理论基础上,以哈尔滨市道外传统商市风貌保护区为例,通过模拟历史街区的整体布局特征、街区组织特征和视觉效果,解析道外商市功能布局的特征规律,包括功能类型选择与句法整合度、街区利用潜力与空间可识别性、商业活力分布与拓扑距离的关联分析,进而提出历史街区的功能优化设计策略,包括调节街区核心街道的功能、根据空间可识别性挖掘街道利用潜力、根据街区活力分布建立公共节点,并在此基础上从功能类型选择、街区利用潜力、街区活力分布三个层面归纳一些风貌保护区的控制与引导对策。从而,探索以空间句法模拟分析研究城市历史街区功能优化的技术路径。 关键词:功能优化、历史街区、商市风貌、空间句法 1道外传统商市风貌保护区概述 1.1区位信息 道外区地处哈尔滨市区中东部,是历史悠久的老城区,地域广阔,位置适中,是全市八区十县(市)的区位中心,与呼兰、松北两个行政区隔江相望,与道里、南岗、香坊、阿城四个行政区接壤,南与香坊区幸福乡、城高镇接壤,东与香坊区向阳乡、阿城区毗邻,北与呼兰区隔江相望。(见图1) 图1:道外区的区域地理位置

1.2历史沿革 道外区是哈尔滨市的老城区,旧称傅家甸,地处哈尔滨市区中东部,北临松花江,作为哈尔滨市的开埠地,1736年(清乾隆元年)这里就已有人烟生息,1907年光绪帝在此设立行政厅,1929年建立滨江市,1956年改称道外区。数百年的历史沉淀了道外区独特的中华巴洛克建筑文化——欧式立面、清水砖墙、雕花围檐、砖木结构。来自商贾云集,街景繁华,257个传统大院在此形成了全国面积最大的“中华巴洛克”建筑街区。(见图2、图3) 图2:哈尔滨近代建筑发展阶段 为保护其珍贵的历史文化价值,政府于2003年划定哈尔滨道外传统商市历史文化街区,占地53.11公顷。截至目前,已有5.4%的街区基本完成改造,94.6%处于待改造阶段。此次研究针对已改造和待改造街区分别进行。作为哈尔滨的发源地,历史街区内至今仍保存大量历史建筑和历史风貌地段,形成了以中华巴洛克为主兼容古典主义、文艺复兴和新艺术运动等时期的建筑风格,它们都是哈尔滨近代发展史的见证。区内有些建筑属国家级保护建筑,而且大多数保存完好,这是改造和更新历史街区的触媒点,也是人们文化和娱乐休闲旅游的吸引点。 图3:哈尔滨市与道外区历史发展沿革各阶段

句法分析方法的拓展与演变

句法分析方法的拓展与演变 ——————从歧义分化看汉语析句方法的拓展和演变语言学及应用语言学07050102026 普加成 摘要:歧义现象是由于脱离了一定的语境而产生的,为了分化歧义句语法学家们引进了和拓展了很多的析句方法。从句子成分分析法、层次分析法、变换分析法、语义特征分析法、配价分析法到语义指向分析法,句法分析逐步走上兼顾形式和意义的道路。汉语析句方法的发展使歧义句式更能分化,可以这么说歧义的分化对于汉语析句方法的拓展和演变有重要的作用。 关键字:歧义分化;汉语;析句法;拓展 歧义现象是指一个语言片段可以做两种或两种以上的语义解释。歧义又叫“同形”,一个着眼于内容,一个着眼于形式,这是一个问题的两个方面。歧义必须以同形作为前提,不同形就无所谓歧义。深入了解歧义现象,并且能够进行分化,这对我们加深对汉语句法结构复杂性、精细性的了解有重要的意义,同时对掌握句法结构的分析方法也很有帮助。 歧义句的产生是由于脱离了一定的语境才产生的,其实很多的歧义句在书面上才产生的,因为在日常的生活中它有自己的特殊的语境,交谈的双方是能够很好的理解的,当然我们不是否认有的时候说话人和听话人有意的把它理解为歧义的现象,。歧义句当它进入到某一个具体的语言环境里,如对话、上下文、某一特定的时间、地点、条件或情理、背景、对象等等时,因为受到它们的制约,歧义自然就消失了。 所谓“句法分析”,是指从句法的角度来解释说明种种语言的现象。比如说,为什么“咬死了猎人的狗”有歧义,而“咬死了猎人的猫”没有歧义?同样,为什么“放大了一点”有歧义,而“放大了一寸”没有歧义?为了解释这些现象,我们就得想出一些分析方法来,并尽可能从理论上加以说明。从句法的角度来解释说明种种语言现象的说明方法,一般就称之为“句法分析法”,相关的理论就是“句法分析理论”。 歧义句要从理论上说明为什么有歧义,我们用的方法是通过不断的句子分化来实现的,可以说歧义句的分化的发展和汉语析句方法的拓展有着重要的关联。我们认为歧义句分化是推动汉语析句方法拓展和演变的一个重要方面,下面本文就试图通过论述来证实这一个观点,我们将通过介绍各种句子分析方法来证实。 一、句子成分分析法 句子成分分析法顾名思义就是分析句子的基本成分,这种分析方法是我们在初中阶段分析句子的基本方法,也是我们学外语时老师用的方法,这种分析方法也叫中心词分析法。这种分析方法的要点大致如下: 1、分析的对象是单句。 2、认定一个句子有六大句子成分——主语、谓语、宾语、补足语、形容词性 附加语(即今天一般所说的定语)、副词性附加语(既今天我们所说的状

基于句法分析和机器学习的中文自动问答系统研究

基于句法分析和机器学习的中文自动问答系统研究自动问答系统是为了应对信息爆炸的客观挑战和满足信息时代人们对于快速、准确地获取信息的主观需求而发展起来的。它逐渐成为自然语言处理和自然语言理解领域的前沿。 本文首先对问答系统的整个框架结构进行了剖析,对问答系统的三个关键模块的实现任务和解决方案进行了细致的综述。其次本文提出了基于汉语问句句型分析和支持向量机相结合的中文问题分类方法。 本文还提出了基于最大熵模型对候选答句进行二分类的方法对答案进行抽取。综述部分全面介绍了问答系统三个关键模块的实现任务和解决方案,着重剖析和总结了问答系统中两个最关键的子模块:问题分类和答案抽取的实现方法。 本文分析指出,对问句进行句法分析的分类特征抽取和基于机器学习的分类方法成为问题分类的技术发展趋势;句法分析和机器学习成为答案抽取里面两个最重要的组成部分。问题分类模块中,本文首次提出根据距离疑问词最近原则确定问句中的谓语动词,根据疑问词和谓语中心语的距离信息对汉语问句进行句型分析。 然后,在此分析的基础上,提取出疑问词、谓语动词、主语和宾语作为问题分类的特征。最后采用支持向量机作为问题分类的机器学习算法,取得了良好的实验结果,准确率达到95.87%。 答案抽取模块中,本文首次提出把答案的抽取问题转化成一个对候选答句进行二分类的问题。首先,在对问句进行句型分析的基础上,提取出问句词及词性序列、查询关键词、疑问词、主语、谓语和宾语作为问句特征集;然后,对候选答句进行浅层句法分析,提取出候选答句词序列,候选答句词性序列和正确答案词性

标记作为答句特征集;基于问句特征集和答句特征集得到组合特征集;最后,引入最大熵模型,在组合特征集的基础上训练答案抽取的分类器。 良好的实验表现证明了这种方法的可行性。

语料库的类型

语料库的类型 [作者:李文中转贴自:Corpora and the ELT点击数:97 文章录入:neilruan ] 语料库来自拉丁词corpus,原意为“汇总”、“文集”等,复数形式为corpora或corpuses。语料库是“作品汇集,以及任何有关主题的文本总集”(OED)是“书面语或口头语材料总集,为语言学分析提供基础”(OED)。语料库是“按照明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”(Sinclair,1986:185-203)。语料库是按照明确的设计标准,为某一具体目的而集成的大型文本库(Atkins and Clear,1992:1-16)。 Renouf认为,语料库是“由大量收集的书面语或口头语构成,并通过计算机储存和处理,用于语言学研究的文本库”(Renouf, 1987:1)。 Leech指出,大量收集的可机读的电子文本是概率研究方法中获得“必需的频率数据”的基础,“为获得必需的频率数据,我们必须分析足量的自然英语(或其它语言)文本,以便基于观测频率(observed frequency)进行合乎实际的预测。 因此,就需要依靠可机读的电子文本集,即可机读的语料库”(Leech, 1987:2)。综上所述,语料库具有以下基本特征: 1〕语料库的设计和建设是在系统的理论语言学原则指导下进行的,语料库的开发具有明确而具体的研究目标。如二十世纪六十年代初的BROWN语料库主要目的是对美国英语进行语法分析,而随后的LOB语料库基本按照BROWN语料库的设计原则收集了同年代的英国英语,目的是进行美国英语和英国英语的对比分析和语法分析。 2〕语料库语料的构成和取样是按照明确的语言学原则并采取随机抽样方法收集语料的,而不是简单地堆积语料。所收集的语料必须是语言运用的自然语料(naturally-occurred data)。 3)语料库作为自然语言运用的样本,就必须具有代表性(representativeness)。Chomsky曾经批评语料库不过是试图用很小的样本代表巨量的甚至无限的实际语言材料,其结果必然存在偏差,缺乏代表性,“自然语料库存在如此严重的偏差,以至于对其所进行的描述将不过是一个词表而已”(Chomsky, 1962:159)。这种批评对任何以概率统计为基础手段的研究都是有价值的(McEnery, 1996:5)。 但是,目前的计算机语料库可以通过控制抽样过程和语料比例关系来缩小偏差,增强语料的代表性。决定语料代表性的主要因素不外乎样本抽样的过程和语料量的大小。语料库抽样一般采取随机抽样方法。一种做法是在抽样前首先确定抽样的范围,如BROWN语料库和LOB语料库分别是以1961年全年的美国英语和英国英语出版物作为抽样范围i[i];再就是确定语料的分层结构,进行分层抽样,如把语料按文类(genre)和信道(channel, 如书面语和口语等)进行分层,如图2.1所示。从各种语料的抽样比例上又可分为‘均衡抽样’(balanced)和‘塔式抽样’(pyramidal)。前者对各种语料按平均比例抽取,而后者对不同的语料进行不等比例抽取。 4)语料库语料以电子文本形式储存并且是通过计算机自动处理的。巨量语料以纯文本形式存储在磁盘上,以便语料库索引软件检索和处理。也可以通过转换软件把其它格式的文件如超文本(htm 或html)格式转换为纯文本。另外,语料库具有一定的容量。语料库的大小取决于语料库的设计原则和研究需求,以及建库过程中语料资源的获取难度及其它因素。计算机语料库实际上提供了一种人机交互,这种交互方式随着语料库工具的发展而逐步加强其自动化特性。Leech认为这种人机交互有以下四种渐进的模式:(1)‘数据检索模式’。计算机以便利的形式提供数据,人进行分析。(2)‘共生模式’。计算机提供部分经过分析的数据,人不断改善其分析系统。(3)‘自我组织模式’。计算机分析数据并不断改善其分析系统,人提供分析系统参数及软件。(4)‘发现程序模式’。计算机基于数据自动划分数据范畴并进行分析,人提供软件(Leech,1991:19)。 计算机自动处理包括自动词性附码(tagging)、自动句法分析(parsing)等。其基本处理和分析过程包括以下几个步骤: 语音分析(phonetic analysis)指音段分析,主要用于语音识别和语音合成。 正字分析(orthographic analysis)指对文本中各种非文字符号、标点、大小写问题等进行处理和歧义消除。 形态分析(morphological analysis)即词性指定和附码。语料库自动附码软件通过概率统计和分析,对所给句子每一个词指定一个或多个词性码。结果显示分列显示和行显示两种。目前语料库自动词性附码准确率一般在97%以上。 句法分析(syntactic analysis)是指句子成分切分、句法关系识别、以及句法分析。语义分析(semantic analysis)和语用分析对语篇进行语义指定和意义解释。 5)基于语料库的研究以量化研究为基石,以概率统计为基本手段,以“数据驱动”为基本理念。其基本方法是通过对实际语言运用的抽样,确定其对语言整体的代表性,通过对样本特征的描述概括整体特征。在量化分析中,首先对特征进行分类,并统计各个特征的频率,通过建立复杂的统计模型对观测到的数据进行解释。分析结果可对研究对象总体进行概括。量化分析能够使我们发现在某一种语言或语言变体中哪些现象反映了语言的真实特征,那些现象仅属于偶然的个例。针对某一语言变体而言,我们还可以确切地知道某一语言现象的显著性,从而确认该现象是规范的还是异常的(McEnery,1997:3)。 6)语料库既是一种研究方法,又代表着一种新的研究思维,并以当代先进的计算机技术为技术手段。 7)语料文本是一连续的文本或话语片断(running text or continuous stretches of discourse),而不是孤立的句子和词汇。在语料库研究中,对某一搜索词的语法关系、用法、以及搭配的观察是通过分析提供的语境(context)进行的。语料库索引提供的语境可分为以下几种:(1)指定跨距,即使用者指定以搜索词为中心左右相邻的词数;(2)意元语境,即以某一意义单元结束为一微型语境,在语料库索引中意元的确定是以意义结束符号如“,;”等为标识的;(3)句子语境,即以句子终结符号如“. !”等为标识;(4)可扩展语境,即对搜索词所在语境可无限扩展。这对研究词汇的语法关系、词汇用法、词汇搭配、词丛(word cluster)、词汇在连续语篇中呈现的范型(pattern)、以及主题词汇之间的意义关系提供了可靠而方便的途径。如“necessarily”一词在《新英汉词典》中作为“necessary”词条下该词的副词形式,定义为“必定,必然”;Oxford Advanced Learner’s Dictionary of Current English把它列为一个单独的词条,给出的定义为“adv as a necessary result; inevitably”;各种英语教科书中对该词的定义和解释也大同小异。在上海交大科技英语语料库(以下简称JDEST)中搜索“necessarily”这个词,发现该词在全库中出现264次,频率最大的搭配词“not”出现在该词左边第一个位置,观察搭配频数为136。全库中出现5次以上的三词词丛有20组,同时含有“not”和“necessarily”的词丛有18组。通过索引行统计和词丛统计可以看出(见图2.4示例),“necessarily”一词最典型的用法是与“not”

相关文档
最新文档