卓尔精灵语言简介

卓尔精灵语言简介
卓尔精灵语言简介

卓尔精灵语言简介

卓尔精灵的口语就像其他精灵语言一样丰富、优美,听起来犹如音乐一般。卓尔精灵能轻易地复述其它语言的声音。他们大都是优秀的复述者,可以模仿转述他无意中听见的讲话,而且大半部分(55%左右,随着此卓尔精灵对这种语言的熟悉的程度提高而提高)字词和语调都与说话者所讲的无异。

多数卓尔精灵都没怎么接触过地表的语言(流亡者、奴隶贩子和冒险者是比较主要的例外)。一位居住在地底城市而且很少外出冒险的卓尔精灵会两种语言:卓尔精灵的日常语言,或者叫"地底卓尔语"(各个聚居地之间会有些细微差异,就好像通用语的重读、发音和词汇会因为国家地域的不同而不同一样);以及卓尔精灵很久以前发明的用手势姿态和面目表情来传达的无声语言。

卓尔精灵的“寂语”-有时也被称为“手语”-是一种和口语一样详尽的语言。本书中并未给出这种语言的具体细节,这样做基于下面两个原因:第一是伊尔明斯特认为某些秘密还是应该保留的,我自己也十分赞同这点。第二,进一步发展充实这些姿态和表情属于地下城主发挥创造性的领域,这样可以鼓励玩家进行角色扮演,并且在游戏中加入些不确定性。而且,熟练做出一种无声语言的细微动作和复杂组合需要好几个月的集中训练。一个卓尔精灵口语的入门词汇表会在《词汇选摘》一章列出。

“地底卓尔语”(也被称为“低等卓尔语”或“卓尔精灵语”)是卓尔精灵的日常用语,其中混杂着过时的表达方式、交易行话甚至其它语言中的词汇(特别是侏儒语、矮人语、地表精灵语和人类巫师的术语)。它的结构和通用语-诸国度中人类和大部分种族之间交流所使用的语言-很相像,与地表之下使用的通用语的分支"地底通用语"更是相似。当书写时,它平滑的字母像极了古代精灵语和托若斯语的自由手写体,但那些对精灵语和通用语都很熟悉的人只能推敲出卓尔精灵文字约14%的大意。

地底卓尔语是一种活生生的、不断变化着的语言,而且随着地域和时代的不同而不同(但卓尔精灵的语言因为聚居地的孤立、口口相传的缓慢速度以及坚固的社会等级而不像地表语言那样变化迅速)。地下城主可以随意加入新的词汇和短语,其它文章资料中也会有一些未在这里给出的词汇。

进入卓尔精灵聚居地的外来者们有时可能会听见“高等卓尔语”,一种古老的、现在很少使用的语言。

一般只有罗尔丝的神职人员才能听懂使用它(用在神术咒语中,或在司祭之间想交谈但又不想让在场的低级卓尔精灵明白意思的时候使用)。高等卓尔语包含一些特别的手势(与寂语大不相同),对此不太熟悉的卓尔精灵有时管它叫"秘密符号"。

冒险者应该了解卓尔精灵在战斗中通常不开口说话。如果受伤或受到惊吓,他们会呼出罗尔丝之名,或者出言咒骂。

卓尔精灵之间比较普遍的咒骂是"Ssussun pholor dos!"—“光照在你头上!”("light upon you!"),或者简单地喊一声"Ssussan"-“光!”("light!")。卓尔精灵对其它种族的咒骂通常是"Vloth ~ dos!"—“黑暗吞了你!”("darkness take you!")。

如果想要在战斗中召集伙伴或呼求援助,卓尔精灵会高喊它家族的名字-一个哈勒德家族的卓尔精灵可能会喊"Hlaund ulu usstan!")—“哈勒德家族的都过来!”("Hlaund to me"),或者"Hlaund ultrin!"-“哈勒德家族万岁!”(" Hlaund supreme!")。

本章列出了很多卓尔精灵的名字,它们本身十分有用,而且还可以作为一个卓尔精灵名字"风格"的指南,以方便读者创造新的名字。

人类应该注意,卓尔精灵名字所表示的性别并不一定和人类社会中与其类似的名字(或名字后缀)相同。没有一个卓尔精灵贵族会使用一个与常用词汇(比如《词汇选摘一章中的词语》)相似的字作为自己的名。任何信仰的卓尔精灵都不会使用与任何卓尔精灵神祗的名字相似的字作为自己的名字-使用自己社会信奉的神祗之一作为自己的名字是种亵渎,使用与母神名字过于类似的字做名字则会带来厄运。

下面这些卓尔精灵名字可以在托瑞尔或其它世界上(或者,下)见到。罗尔丝积极地促进卓尔精灵在各个世界间扩散,以强化自己的力量,并且保护这一种族的生存。卓尔精灵在各个世界的扩张殖民也使卓尔精灵的名字广为传播。

女性卓尔精灵的名

阿克迪娜Akordia艾厄瑞玛Elvraema

艾伦妮塔Alaunita厄瑞达Erelda

艾勒丝汀Alystin菲尔瑞Faeryl

安格丝特Angaste菲林德瑞Felyndiira 埃杜勒丝Ardulace菲佛瑞Filfaere

安瑞Aunrae格瑟Gaussra

巴塔哪Baltana格厄杜瑞拉G'eldrlia

布勒博瑞娜Belarbreena吉娜菲Ginafae 布里沙Briza格瑞娜Greyanna

布瑞娜Burryna麦塔Meta

查丽丝瑞Chalithra黑勒温Halavin

查瑞塔Charinida赫丽丝特Halisstra

查丝塔Chessintra艾丽弗瑞Ilivarra

达赫妮Dhaunae艾勒玛Ilmra

德丽娜瑞Dtlynrae艾玛瑞Imrae

德瑞辛提Drisinti尹迪勒Inidil

伊克丽夫达Eclavdra艾瑞Irae

伊凡莎丽Elvanshalee伊瑞特Irruit

伊莫瑞Iymril瑞尔茹Rilrae

沃弥丝Warmiss莎博Sabal

艾赫勒娜ihaelryna莎贝瑞Sabrae 扎丽Jhulae莎娜恩Shi'nayne

杰森玲Jyslin莎瑞那茹ShriNeerune 丽奥Laele莎杜瑞尔娜Shurdriira

拉瑞娜达Larynda莎塔拉Shyntlara 丽娜蕾LiNeerlay席娜菲StNafay

丽杜芦Lirdnolu莎佩瑞娜Ssapriina 勒泰丽尔Ltialyrr泰勒布娜Talabrina 马烈丝Malice泰勒丝Talice

玛雅Maya崔尔Triel

麦卡玲Micarlin特瑞丝特T'risstree 米诺玲Minolin沃凡瑞拉Ulviirala

莫娃雅丝Molvayas艾莫瑞Umrae 米瑞玛Myrymma维克娜Viconia

奈丝瑞Nathrae沃娜Werna

娜德伦Nedylene瓦勒杜瑞Vlondril 努勒瑞NuIllira维尔娃Waerva

奥罗瑞Olorae乌昂多Wuyondra

普勒丝塔Pellanistra席勒瑞Xullrae 普埃尔Phaere苏乌Xune

普亥若Phyrra艾丝瑞娜Asraena

库瑞娜Quarra泽娜Zarra

库维夫Quave泽贝玛Zebeyima

库维伊Qwe泽丝特拉Zesstra

茹法Rauva泽丽法Zilvra

男性卓尔精灵的名

阿丁力克Adinlrahc玛拉格Malaggar 阿莱克Alak玛索吉Masoj

艾顿Alton麦润德Merinid

艾麦里卡Amalica莫云Mourn

安特莱布Antatlab纳芬Nalfein

贝瑞吉Baragh纳洛明Nilonim

比勒格Belgos纳恩Nyrn

比依恩Beanyon关诺达Ghaundar 宾赫特Bhintel尼姆Nym

布茹赫尔Bruherd瑞伊塔Ryltar

卡里麦尔Calimar奥莫斯Omareth 查斯玛Chaszmyr奥戈罗斯Orgoloth 狄宁Dinin费瑞尔Pharaur

迪泼瑞Dipree克利雯Cuevven

迪沃格Dlvolg库伊德Quild

崔斯特Drizzt莫诺Monor

杜阿格斯Duagloth瑞克拉诺Riklaunirn 杜尔因Durdyn玛泽恩Mzzen

艾利坎特Elkantar瑞厄德Ryld

费勒润Filraen萨巴尔Sabrar

加尔卢司Gelroos瑟德泽Seldszar

甘德尔Ghaundan沙尔Shar

戈莫斯Gomph纳多Nadal

格德尔Guldor斯卢根Solaulkin

呈契聂特Hatch'net索恩Sorn

韩达尔Houndaer索泽顿Szordrin

伊姆云Ilmryn塔伦Tarlyn

伊芬瑞Ilphrin泰斯伦Tathlyn

伊斯特罗Istolil泰布润Tebryn

瑞安赫Ranaghar图卢斯Tluth

伊斯多维尔Istorvir泰瑟博克Tsabrak 贾拉索Jaraxle乌勒蕴Urlryn

杰格德Jeggred维勒斯Valas

凯拉诺Kalannar维润Vorn

卡尼斯Kelnozz维兹伦Vuzlylyn

克瑞斯特Krenaste维尔文Welverin

科德罗Krondorl沃德Wode

勒斯那尔Lesaonar亚斯顿Yazston

利莫Lyme扎克纳梵Zaknafein

(译者注:虽然正文中反复说明卓尔精灵的名字不会和卓尔精灵神祗的名字相近。但列出的男性卓尔精灵名字中的关诺达Ghaundar和卓尔精灵诸神之一的关纳德Ghaunadaur十分相近,和它的别名关纳达Ghaunadar更是只有一字之差。这也许是作者的疏忽,但更可能是和多数卓尔精灵对关纳德的态度有关,关纳德本身并不是真正意义上的卓尔精灵神,它被列入卓尔精灵神系中仅仅是因为不少反对罗尔丝的卓尔精灵敬拜它,而不像罗尔丝、维瑞雯等那样"本身"就是卓尔精灵神。所以关诺达这个名字可能是被那些不承认关纳德是卓尔精灵神祗的卓尔精灵使用。此外,沙尔Shar这一名字和人类的黑夜女神莎尔Shar同名,虽然同为邪恶神祗,但罗尔丝和莎尔之间并没什么友好往来,所以大部分卓尔精灵起名时大抵不用避这位人类女神的讳,但由于维瑞雯和莎尔之间的同盟关系,信仰维瑞雯的卓尔精灵应该不会使用沙尔作为名字。)姓氏

卓尔精灵的姓氏数量很多而且变化多端。只有那些贵族出身,或者在贵族家族中担任要职(比如侍父、武技长、先锋司令)的平民出身者可以把自己家族的名称作为姓氏使用。传统上,没有任何家族名的前部发音会和"罗尔丝"相同,而且没有任何卓尔精灵会使用"罗尔丝"或它的任何变体(“罗丝”、“罗依丝”)-除非此卓尔精灵是罗尔丝女神的神使。

卓尔精灵姓氏

阿巴德Abadr沃润雯Ornrivvin

艾伯伦Abbylan法厄Pharn

阿杰斯Argith菲尔伦Phillorn

博克本Blacrabban奎雯Quavein

布伦德斯Blundyth罗润多Rhorndull

卡波尔Coborel若斯特Rrostarr

卡洛拉Coloara希讷尔Seerear

克莫勒Cormrael萨姆拉Ssambra

达勒Dalael沃玛Werma

杜特密Dhutmyi特林顿Tlintarn

艾泼赭Elpragh托尔格Torgh

菲利法Filifar泰斯伦Tisarran

哲勒尔Gellaer沃兹Uoze

格恩Ghaun维勒顿Veladorn

格兰纳斯Glannath瓦莫尔Vrammyr

赫尤恩Hune维恩Vrinn

赫鲁安Hyluan维格罗斯Waeglossz

伊勒斯顿Illistyn维顿Wyndyl

吉拉文Jhalavar席润恩Xarann

贾斯屯Juszturn斯勒汀Xlityn

凯拉泽Khalazza雅恩特Yauntyrr

勒贝尔Lhalabar亚斯洛Yauthlo

墨恩Men雅博格维泼瑞敏Ybegwlprymmin 墨勒泽尔Mlezzlir扎赫瑞斯Zahresz

纳斯Naerth左兰德Zolond

诺姆Nonme

已知卓尔精灵家族名

埃林纳赫尔Aleanrahel格迪普Godeep

阿勒维Aleval赫勒维润Helviiryn

艾伯尼Arabani莫恩德Maund

阿克赫诺德Arkhenneld寒特Hun'ett

艾梵德Auvryndar肯纳梵Kenafin

班瑞Baenrae科勒斯克Kilsek

拜森得诺格Barrison'del'arrngo麦瑞特Maerret

克拉德斯Claddath迈勒姆Melarn

迪斯帕纳Despana勒罗Lylyl

迪佛DeVir纳阔尔Noquar

杜垩登Do'Urden奥斯托Ousstyl

伊瑟斯Eilservs瑞伦特Rilynt'tar

埃文赫特Everhate特肯杜斯Teken'duis

菲布兰契Fey-Branche斯姆托尔Thrmtor

佛瑞斯Freth扎维尔Zauviir

已知卓尔精灵城市名

阿比斯格尔Abaethaggar玛瑞莫达Maerimydra

埃博斯Abburth魔索布莱Menzoberranzan

比瑞格赫Baereghel奥勒达Orlydar

查森Chaulssin瑞拉文Rilauven

查尔瑞格斯特Charrvhel'raugaust沙玛斯Sshamath 查德·奈瑟特Ched Nasad沙汉提伦Sshanntynlan

查斯·瑞赫林Cheth Rrhinn瑟斯林Szithlin

厄勒赫辛鲁Erelhei-Cinlu特林德赫特T'lindhet

瑞德恩Eryndlyn特瑞伯伦Tyrybblyn

芬尼达Faneadar尤鲁特尔Uluitur

古奥杜斯Guallidurth安杜斯Undraeth

哈杜斯Haundrauth维德瑞莎尔V'elddrinnsshar

伊劳格赫Ithilaughym维斯·汉玛查Waethe Hlammachar

卢斯·德尔Llurth Dreier俞森德伦Yuethindrynn

鲁赫伦塔尔Luihaulen'tar

地底卓尔语词汇选摘

“地底卓尔语”或者说“低等卓尔语”随着地域和时代的改变而改变,其中也包括了一些来自其它语言的词汇(因为贸易、魔法研究及训练等原因)。地底卓尔语的结构和通用语类似。下面列出一些词汇和俗语以供地下城主设计卓尔精灵非玩家人物的话语和书写时使用。词汇

abban盟友、不是敌人(ally, not-enemy)

abbil同志、值得信赖的伙伴(comrade, trusted friend)

akh队伍、团体(band, group)

alur更好、较高级(better, superior)

alurl最好、首要(best, foremost)

alust前面、面对、最前线(in front, facing, in the forefront)

bauth周围、附近(around, about)

bautha躲闪、去躲闪(dodge, to dodge)

belaern财富、钱币、宝藏(wealth, coinage, treasure)

belbau给(to give)

belbol礼物(gift)

bol (未知的、来历不明的、神秘的或重要的)物品、事物(item, thing --unknown,unidentified, mysterious orimportant)

brorn惊奇(surprise)

brorna令人惊奇的事物(surprises)

cahallin食物(农产品、收获物,包括战利品,但不包括捉住的猎物和烹饪品)(food--produce or harvest,Including raid-spoils, but not hunted game or cooking)

colbauth路径、已知的道路(path, known way)

dal从(from)

darthilr妖精、地表精灵、叛徒(faeries, surface elves, traitors)

del …的(of)

doeb外(out)

dobluth放逐(outcast)

dos你(you)

dosst你的(yours)

dosstan你自己(yourself)

draa二(two)

drada第二(second)

dro生命、活着(life, alive)

elgg杀、杀死、摧毁(kill, slay, destroy)

elghinn死亡(death)

elamshin命运、罗尔丝的意志(destiny, the will of Lolth)

elend通常的、传统的(usual, traditional)

elendar继续、连续的、持续不断的、持久的(continue, continued, continuing, enduring)

faer魔法(magic)

faerl魔法的(magical)

faerbol魔法物品(magical item)

faern巫师、魔法工作者(适用于任意性别、所有种族)( wizard, magic-worker --of either sex, any race)gol地精(goblin)

golhyrr骗术、诡计、圈套(trick, ruse, trap)

goln地精(复数)(goblins)

harl向下、底下、之下(down, under, below)

haszak吸灵怪(夺心魔)(illithid -mind flayer)

haszakkin吸灵怪(复数)(illithids)

honglath冷静思考、平静、勇敢、优秀举止(clear thinking, calm, braven, good behavior)

iblith垃圾、排泄、死腐(咒骂用词)(offal, excrement, carrion--oath)

ilharn侍父(后接家族名)(patron--of House's title)

ilhar母亲、作母亲(指生下幼儿,而非养育)(mother, to mother--to give birth to young- not to comfort or rear)ilharess主母(后接家族名)(matron--of House'stitle)

ilharessen主母(复数)(matrons)

ilindith目的、目标、期盼之事(aim, goal, hoped-for event)

inth计划、策略、阴谋(plan, stratagem, scheme)

inthigg协定、条约(agreement, treaty)

izil同样(as)

jabbuk长官、大师(负责执行任务或管理事物的男性;阶级名、称

呼)(master--male in charge of some taskor office; rank or title)

jal所有的(all)

jivvin嬉戏、玩耍(残酷的逗乐、令人生气的)(fun, play--amusing cruelty, "animal spirits")

khaless信任(特别指错信的或愚蠢的)(trust--especially misplaced or foolish)

kulg阻碍物,牵制,封锁(将会阻碍或正在阻碍的,比如矿井或过道中的碎石堆)(to will, or actual -e.g.debris in a shaft or passage)

kulggen精心设计的堡垒、盾牌、或其他障碍物(deliberate rampart, shield, or other barrier)kyone警觉的/警觉地、谨慎的/谨慎地,小心的/小心地(alert/alertly, wary/warily,careful/carefully)kyorl看护、等待、守卫(watch, wait, guard)

kyorlin看护的、等候的、守卫的( watching, waiting, guarding)

lil那个(the)

llar三(three)

Ilarnbuss第三(third)

lueth和(and)

luth投、掷、猛投(cast, throw, hurl)

maglust分离的、单独的(apart, alone)

malla尊敬的(用来表示敬意的称呼) (honored --term of respect)

mrimm指南、关键、灵感(guide, key, inspiration)

mzild更、更多(more)

nau不、无(no)

natha一个(a)

nind他们、他们(宾语)、他们的、他们的所有物(they, them, their, theirs)

nindyn那些(those)

noamuth漫游者、迷途者、未知者(wanderer, lost, unknown)

obsul空地、门、豁口、裂缝(opening, door, gap or chink)

ogglin竞争者、对手、敌人(动态;所有的生物都被认为是潜在的ogglin)(rival, opponent, enemy--active;all creatures are considered potential ogglin)

olist警告、偷窃(caution, stealth)

oloth黑暗(即指自然造成的黑暗,也指魔法造成黑暗)(darkness --utter natural darkness or magicaldarkness)

orbb蜘蛛(spider)

orthae圣洁的、神圣的(holy, sacred)

phalar墓穴、战争制造者(grave, battle-marker)

phindar怪物、危险生物(特别指非智力生物)(monster, dangerous being (especially a non-intelligentcreature)

pholor上、上面(on, upon)

phuul是(复数)(are)

plynn拿,抓(take, seize)

qua'laelay争吵、争论、对抗(还没有公开冲突)(disagreement, argument, confrontation --not yet openconflict)

quarth命令(当权者的行为)(order--exercise of authority)

Quarval-sharess女神(仅指罗尔丝,其他的女神被称为

"qluar'valsharess")(Goddess--Lolth; othergoddesses are "quar'valsharess")

Quarthen命令的、指令的(ordered, commanded)

qu'ellar家族(贵族家庭的称呼)(House--titled noble family)

ragar找到、发现、揭开(find, discover, uncover)

rath后(back)

ratha后(backs)

rathrae后面(behind)

rivvil人类(human)

rivvin人类(复数)(humans)

sargh武器使用熟练、战斗力、臂力、英勇(confidence in weapons, battle-might, strength at-arms, valor)sargtlin (卓尔精灵)战士(warrior-drow)

sam!当心!警惕!(beware! warning!)

sreen危险(danger)

ssinssrigg激情、欲望、贪婪、渴望、爱情( passion, lust, greed,longing, love)

streea.自杀、为罗尔丝、一个家族或一个聚居地而死(suicide, death In the service of Lolth, a House,or acommunity)

streeaka鲁莽的、无畏的(reckless/ness, fearless/ness)

ssussun光、明亮(light, brightness)

taga比(than)

talinth想、考虑(think, consider)

thalra遇见、遭遇(meet, encounter)

talthalra集会、议会、会谈(meeting, council, parley)

thalack战争、公开的战斗(war, open fighting)

thalackz'hind袭击、从远处攻击(raid, attack from afar)

tdu是(be, to be)

tuth两( both)

ul-Ilindith命运(destiny)

ultrin至高的、最高的、征服者(指罗尔丝时使用"ultrine")(supreme, highest, conqueror --"ultrine" whenapplied to Lolth only)

ultrinnan征服、胜利、取胜、成功(conquering, victory, to win or prevail)

ulu到(to)

uss一(one)

usstan这一个(自己、我)(this one--self, I)

usstil在我位置上的(one in my place)

ust第一(first)

valsharess女王(queen)

veldrin阴影、由光亮变化提供的隐藏(shadows, concealment afforded by varying light)

velkyn看不见的、隐藏的、隐形的(unseen, hidden, invisible)

vel'uss谁(who)

velve刃(匕首、小刀、剑)(blade--dagger, knife, sword)

wael傻瓜(fool)

waela愚蠢的、不警惕的、不谨慎的(foolish, unaware/unwary)

wun在…中(in)

wund在…间、在…里、进入(among, within, into)

xal可能、也许(may, might, perhaps)

xun做、完成或实现(do, to complete or accomplish)

xund奋斗、努力、工作(striving, effort, work)

xundus做、达到、完成工作、得出具体的结果(doing, achievement, work completed or manifested in someconcrete result)

yath神堂、神堂所有的(财产、工作或命令)( temple, of the temple--property ,work, or decree)yathrin (卓尔精灵)女司祭(priestess--drow)

yathtallar高等司祭(high priestess)

yorn女神(指罗尔丝)的力量/意志/仆从生物(power/will/servant-creature of the Goddess--Lloth)俗语

Jal khatess zhah waela.

任何信任都是愚蠢的(All trust is foolish.)

Oloth zhah tuth abbil lueth ogglin.

黑暗既是朋友也是敌人(Darkness is both friend and enemy.)

Xun izil dos phuul quarthen, lueth dro.

照着命令去做,你才能活(Do as you are ordered, and live.)

Lolth tlu mallajal ultrinnan zhah xundus.

赞美罗尔丝,一切胜利都来自于她(Lolth be praised; all victory is her doing.) Rharessen zhaunil alurl.

(主母)母亲了解的最好((Matron) Mothers know best.)

Lit alurl velve zhah lit velkyn uss.

最好的小刀是看不见的那把( The best knife is the unseen one.)

Lit waela lueth waela ragar brorna ?lueth wund nind, kyorlin elghinn.

愚蠢和不谨慎的家伙总会受到惊讶,并且在惊讶中等死(The foolish and unwary find surprises-and amongthem, waiting death.)

Khaless nau uss mztld taga dosstan.

除了你自己外别相信任何人(Trust no one more than yourself.)

Nindyn vel'uss kyorl nind ratha thalTa elghinn dal lit alust.

那些注意自己背后的家伙会遇到正面来的死亡Those who watch their backs meet death from the front.Ulu z'hin maglust dal QUellaT lueth Valsharess zhah ulu z'hin wund lit phalar.

离开家族和神后就是走向墓地(To walk apart from House and Queen is to walk into the grave.)Kyorljal bauth, kyone, lueth lit Quarvalshams xal belbau dos lit belbol del elendar dro.

谨慎地注意周围的一切,这样女神才可能赏你活下去(Watch all about, warily, and the Goddess may giveyou the gift of continued life.)

Vel'uss zhaun alur taga lit Quarvalsharess?

谁能比女神更清楚?(Who know better than the Goddess?)

地底卓尔语语法(非官方资料)

地底卓尔语的句子结构和通用语大致相同。

名词复数形式

除了一些特殊变化外,以辅音结尾的单词加“en”构成复数,以原因结尾的单词加“n”构成复数。例如:单数复数

Jabbress (Mistress) Jabbressen(Mistresses)

Velve (Blade) Velven(Blades)

名词所有格

很巧的是,地底卓尔语里名词的所有格和通用语中的十分类似。所有格以原词末尾加“s”构成,如果那个词本身就以“s”结尾,则在末尾处加“'”。

Sarn lil velg'larn's inthen (Beware the assassin'sschemes)

Nindil zhah lil Valsharess' elgluth (That is the Valsharess' whip)

动词

一个动词根据数(单数或复数)、人称(第一人称、第二人称、第三人称)、语态(主动语态、被动语态)、时态(一般现在时、过去时、将来时、现在完成时、过去完成时、将来完成时)和语气(陈述句、祈使句、虚拟语气)的不同而不同。

数:除了一些特殊变化外,单数动词的末尾加“ar”。

单数复数

Lil sargtlin elggar

(The warrior kills) Lil sargtlinen elgg

(The warriors kill)

Uss jaluk elar

(One male dies) Draa jaluken el

(Two males die)

人称:动词通常有一个特殊形式只会在第三人称单数、一般现在时的时候使用。除了一些特殊变化外,动词一般现代时第三人称单数形式是在原词末尾加“e”。

Usstan belbau

(I give)

Dos belbau

(You give) Uk belbaue

(He gives)

Usstan luth

(I cast)

Dos luth

(You cast) Il luthe

(She casts)

语态:被动语态由一个“be”动词和过去分词构成。

主动语态L'Yathrin harventhe ukt karliik

(The Yathrin severs his head)

被动语态Ukt karliik zhahus harventhus a'lil Yathrin

(Hishead was severed by the Yathrin)

时态:除了一些特殊变化外,动词的过去时由原词末尾加“us”构成。

主动语态被动语态

语料库术语中英对照

Aboutness 所言之事 Absolute frequency 绝对频数 Alignment (of parallel texts) (平行或对应)语料的对齐 Alphanumeric 字母数字类的 Annotate 标注(动词) Annotation 标注(名词) Annotation scheme 标注方案 ANSI/American National Standards Institute 美国国家标准学会 ASCII/American Standard Code for Information Exchange 美国信息交换标准码Associate (of keywords) (主题词的)联想词 AWL/Academic word list 学术词表 Balanced corpus 平衡语料库 Base list 底表、基础词表 Bigram 二元组、二元序列、二元结构 Bi-hapax 两次词 Bilingual corpus 双语语料库 CA/Contrastive Analysis 对比分析 Case-sensitive 大小写敏感、区分大小写 Chi-square (χ2) test 卡方检验 Chunk 词块 CIA/Contrastive Interlanguage Analysis 中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-tagging System CLAWS词性赋码系统Clean text policy 干净文本原则 Cluster 词簇、词丛 Colligation 类联接、类连接、类联结 Collocate n./v. 搭配词;搭配 Collocability 搭配强度、搭配力 Collocation 搭配、词语搭配 Collocational strength 搭配强度 Collocational framework/frame 搭配框架 Comparable corpora 类比语料库、可比语料库 ConcGram 同现词列、框合结构 Concordance (line) 索引(行) Concordance plot (索引)词图 Concordancer 索引工具 Concordancing 索引生成、索引分析 Context 语境、上下文 Context word 语境词 Contingency table 连列表、联列表、列连表、列联表 Co-occurrence/Co-occurring 共现 Corpora 语料库(复数) Corpus Linguistics 语料库语言学 Corpus 语料库 Corpus-based 基于语料库的

浅谈自然语言处理

浅谈自然语言处理 摘要 主要阐述了自然语言处理的定义,发展历史,并对其研究内容,以及目前相关领域的应用加以讨论。最后对自然语言处理的未来发展趋势做简单的介绍。 关键词 自然语言处理 Abstract The definition and the development history of Natural Language Processing(NLP) are explained,the research content and the applications in interrelated areas of NLP are discussed.And the develop direction of NLP in the future are simply introduced. Key Words: Natural Language Processing(NLP)

0.引言 早在计算机还未出现之前,英国数学家A.M.Turing便已经预见到未来计算机将会对自然语言处理研究提出新的问题。他指出,在未来我们可以“教机器英语并且说英语。”同时他觉得“这个过程可以仿效教小孩子说话的那种办法进行”。这便是最早关于自然语言处理概念的设想。 人类的逻辑思维以语言为形式,人类的多种智能都与语言有着密切的联系。所以用自然语言与计算机进行通信是计算机出现以来人们一直所追求的目标。 1.什么是然语言处理 美国计算机科学家Bill Manaris(马纳瑞斯)在1999年出版的《计算机进展》(Advances Computers)第47卷的《从人—机交互的角度看自然语言处理》一文中,曾经给自然与然处理提出了如下定义:“自然语言处理可以定义为研究在人与人交际中的语言问题的一门学科。自然语言处理要研制表示语言能力(linguistic competence)和语言应用(linguistic performance)的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断地完善这样的语言模型,根据这样的语言模型设计各种实用系统,并探讨这些实用系统的评测技术。”这个定义被广泛的接受,它比较全面的地表达了计算机对自然语言的研究和处理。 简单来说,自然语言处理就是一门研究能实现人鱼计算机之间用自然语言处理进行有效的通信与方法的一门学科,它是计算机科学领域与人工智能领域中的一个重要方向。普遍认为它主要是应用计算机技术,通过可计算的方法对自然语言处理的各级语言单位(字,词,语句,篇章等)进行转换,传输,存储,分析等加工处理的学科,是一门融合了语言学,计算机学,数学等学科于一体的交叉性学科。 互联网技术的发展,极大地推动了信息处理技术的发展,也为信息处理技术不断提出新的需求,语言作为信息的载体,语言处理技术已经日益成为全球信息化和我国社会及经济发展的重要支撑技术。

语料库常用术语

语料库常用术语 Type 类符 Tokens 形符 例如“I see a cat and a dog”类符6个,形符7个 Type/token ratio =TTR TTR 是衡量文本中词汇密度的常用方法,可以辅助说明文本的词汇难度。但是,文本中有大量功能词出现,文本每增加一个词,形符就会增加一个,但类符却未必随之增加。这样文本越长,功能词重复次数越多,TTR会越低。因此用TTR衡量词汇密度不合理,于是,出现了标准化类符/形符比,即STTR。例如,计算每个文本1000词的TTR,均值处理,得出STTR。Frequency(频率) 例如每百万词、十万词中,某单词出现次数。常常将某个单词在两个语料库中出现的频率参照两个语料库的容量,用卡方检验或对数似然率进行对比,来确定两个库中该单词的使用是否有差异。 Wordlist词表 根据单词或词组在语篇中出现的频率大小而排列形成的列表。 Ranks Lemma词目,词元 比如go是lemma,对应各种屈折变化形式(inflections),go,goes,went,going,gone共5种屈折变化形式。在分析语言时,需要将它们全部归到go名下,这个过程叫词形还原。Keywords关键词、主题词positive keywords 正关键词negative keywords 负关键词 Concordance 索引(KWIC 语境中的关键词key words in context) 运用索引软件在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。通过前后语境,可以分析“collocation词汇搭配”“colligation 类连接、语法搭配”“semantic preference语义倾向”“semantic prosody语义韵”Collocation词汇搭配 搭配强度MI,T-score ,Z-score Colligation类连接、语法搭配 semantic prosody语义韵 词汇的语义韵大体可分为积极语义韵、中性语义韵、消极语义韵。 POS tagging 词性赋码 Regular expression regex 正则表达式

自然语言处理_NLP Dataset for Training and Testing Models(NLP训练和测试模型数据集)

NLP Dataset for Training and Testing Models(NLP训 练和测试模型数据集) 数据摘要: Three data sets from the PASCAL Recognising Textual Entailment Challenge. they are Development Set,Test Set,Annotated Test Set. 中文关键词: 训练,测试模型,开发集,测试集,带注释的测试集, 英文关键词: Training,Testing Models,Development Set,Test Set,Annotated Test Set, 数据格式: TEXT 数据用途: Information Processing 数据详细介绍:

NLP Dataset for Training and Testing Models Three data sets from the PASCAL Recognising Textual Entailment Challenge. For more information about the contest (now ended) and instructions for the data sets, please visit the official site. Development Set (58k zipped) Test Set (74k zipped) Annotated Test Set (67k zipped) 数据预览:

点此下载完整数据集

语料库语言学的发展

语料库语言学的发展 语料库顾名思义就是放语言材料的仓库。现在人们谈起语料库,不言而喻是指存放在计算机里的原始文本或经过加工后带有语言学信息标注的语料文本。现在世界上已经有了不少规模较大的语料库,有些是国家级的,有些由大学和词典出版商联合建设。另外,由于个人微机的迅猛发展和存贮数据的硬盘造价持续下降,研究者个人也开始建立适合于自己研究的小型语料库。 语料库语言学(英文corpus linguistics)这个术语有两层主要含义。一是利用语料库对语言的某个方面进行研究,即“语料库语言学”不是一个新学科的名称,而仅仅反映了一个新的研究手段。二是依据语料库所反映出来的语言事实对现行语言学理论进行批判,提出新的观点或理论。只有在这个意义上“语料库语言学”才是一个新学科的名称。从现有文献来看,属于后一类的研究还是极个别的。所以,严格地说,现在不能把语料库语言学跟语言学的分支, 如社会语言学、心理语言学、语用学等相提并论。 近年来,随着我国经济的发展,科研经费的增加,汉语语料库的建设得到了开展。1999 年我院把建立汉语语料库列为院重大课题。目前语言所正在构建三个大规模的语料库: 现场即席话语语料库,主要方言口语库和现代汉语文本语料库。在世界范围内,我国的语料库建设在规模上还赶不上欧洲的一些发达国家,特别是英国。然而,在语料库语言学的研究上,以及语料库的实际运用上,我国已经进入世界前沿的行列。 20 世纪语言研究的总特点可以用四个字概括──高度抽象。最近几十年来,语言研究的高度抽象倾向已经失去主导地位。这主要缘于两个方面的因素: 一是计算机技术,特别是基于计算机处理的多媒体技术的飞速发展;二是社会语言学、语用学、会话分析、人类语言学、计算语言学、人机对话研究、语音识别与合成等研究取得令人瞩目的成就。先前难以抓住并进行有效处理的五花八门的实际语料,现在可以对其进行大规模地的、自动的或人机配合的处理。比如个人发音特征,先前认为这跟语言学毫无关系,现在成了侦破语音学的重要内容。侦破语音学家首先建立个人发音特征语料库,这个语料库可以用来鉴别嫌疑犯。概言之,当今的语言研究由先前的高度抽象逐步走向最具体的语言的实际活动,其中

语料库简单dye 第二讲

2008/7/31 语料库简单DIY 第二讲语料库软件初探-- 语料库软件初探--MonoConcPro 2.2 本软件是Athelstan开发小组https://www.360docs.net/doc/1d4741372.html,/ ,于1996年开发的语料库比较检索工具。目前,我的服务器上提供学术性下载,下载地址: http://vu.flare.hiroshima-u.ac.jp/whistle/corpus/MoconcPro2. 2.rar (本软件为学术交流使用,所有权归本软件开发小组所有,一切商务性盈利目的的违法使用,所带来的连带责任关系与本人及本论坛无关。请慎重下载,小心使用!!!) 功能介绍: 软件主界 面 基本功能: MonoConc Pro 2.2 的软件界面比较简单。适合语料库初学者和初级研究人员使用。 本软件据作者的研究,其内部主核使用UTF-8编码,基本支持欧洲几种主要语言。当然,其主要的应用领域还是针对英语。本软件主要处理的文本素材是以TXT结尾的记事本文件,当然,本软件还可以导入RTF文档和其他格式的操作系统默认文档格式。不过,从DIY的角度来说,我们自己收集到的语料,为了免除格式,字体,行距等等文本要求,最好全部使用TXT文档,方便,省

事!用了都说好!(谁用谁知道) 我们按照自己的研究目的,研究方向,收集我们所需要的语料素材,具体的收集方法因人而异。可以从报纸杂志的电子文文档上直接下载,也可以从网站上直接下载整理好的TXT版本的小说,资料素材等,还可以直接从各大语料库中检索需要的语用素材,然后拷贝粘贴到TXT文本中。由于MonoConc Pro 强大的跨文档处理系统,一次可以同时导入多个TXT文档进行比较处理,所以我们可以把文章或者资料按照自己喜好的分类标准进行分类,然后存成不同的TXT文件名。检索的时候,只需要同时导入这些文件就可以了。(异常强大~)下载好软件,解压缩,然后打开MP22.EXE文件,你就可以看到上图那个简单的主界面了。 之后,选择File→Lord Corpus File(s),找到你需要导入处理的TXT文档,一个或者多个都可以,然后选择[打开]。指定的TXT文件就被全部导入进MonoConc Pro中了。 如果导入了过多的TXT文档,比如您导入了莎士比亚全集+马克思选+恩格斯选+列宁选+毛泽东选+邓小平选.....(不能否认,真的有这样的朋友存在)。那么,为了方便您查询检索结果所出现的文章,你可以选择File→View Corpus File/URL,这样就能看到查询结果所在的文章,还可以删除不需要的文章,或者添加新的文章,非常简单。 *这里的URL,指的是在HTTP或者FTP上,可以直接打开的文字页面的链接。一般朋友们DIY的语料库都是存在本地硬盘上的,所以基本上可以无视这个选项。不过,将来我们的个人语料库要实现点对点,点对多的平台连接。连接后,我们就可以相互查询对方个人语料库中的资料,此时在导入对方语料库中的文档的时候,就要用这个了。(这个目前还很遥远,大家还是踏踏实实做自己的DIY语料库吧!) 当我们要删除所有的文章的时候,这个时候仅仅关闭文章的窗口,是不能实

语料库语言学综述

语料库语言学综述 作者:刘美良 作者单位:柳州铁道职业技术学院,广西,柳州,545001 刊名: 科技信息 英文刊名:SCIENCE & TECHNOLOGY INFORMATION 年,卷(期):2010,""(21) 被引用次数:0次 参考文献(19条) 1.Chomsky,N Syntactic Structure 1957 2.Sinclair.John Corpus.Concordance Collocation 3.Susan Hunstom Corpora in Applied Linguistics 2006 4.Aijmer,K.Altenberg,B English Corpus Linguistics:Studies in Honour of Jan Svartvik 1991 5.杨惠中语料库语言学导论 2002 6.何安平语料库在外语教育中的应用--理论与实践 2004 7.何安平谈语料岸研究 1997(5) 8.丁信善语料库语言学的发展及研究现状 1998(1) 9.李文中2003上海语科库语言学国际会议述评 2004(1) 10.粱旭红语料库语言学研究综述 2001(1) 11.粱燕近十年我国语料库实证研究综述 2004(6) 12.刘满堂近40年英语语料库及语料库语言学研究的回顾与出展望 2004(1) 13.潘永本梁语料库语言学的目的和方法 2001(3) 14.王建新语料库语言学发展史上的几个重要阶段 1998(4) 15.许家金语料库语言学的理论解析 2003(6) 16.卫乃兴专业性搭配初探--语料库语言学方法 2001(4) 17.卫乃兴语料库语言学的弗斯学说基础 2008(3) 18.甄风超.张霞语料库语言学发展趋势瞻望--2003语料库语言学国际会议综述 2004(4) 19.吴菲国内外英语语料库的建设和发展述评 2007(6) 相似文献(4条) 1.期刊论文王虹.岳俊发.Wang Hong.Yue Jun Fa书面言语鉴定技术的发展历程-中国公共安全(学术版)2005,""(3) 书面言语鉴定技术产生于20世纪80年代中期.随着电子打印技术的普及,涉案的不留笔迹的打印文件显著增加,书面言语鉴定技术倍受关注.近年来,运用统计语言学、语料库语言学和计算机词频检索与统计等新技术获得了新的研究成果并应用于鉴定实践.书面言语鉴定技术已经发展成为文件检验学的一个新的分支,必将在司法鉴定领域发挥更大的功效. 2.期刊论文孙丰果话语分析整合研究-聊城大学学报(社会科学版)2010,""(2) 近60年来.话语分析经历了从无到有,从小到大的发展历程.话语分析要取得长足发展,需要有一个明确的概念,需要人们对其以前的发展情况进行总结和评述.对话语分析研究的评述不妨从系统功能语言学、认知语言学、语料库语言学等多角度进行.今后,话语分析研究可以从话语分析的哲学转向、心理学转向及整合批评话语分析和积极话语分析等方面展开. 3.期刊论文杨连瑞.Yang Lianrui第二语言习得研究的学科定位和进展-外语与外语教学2005,""(5) 第二语言习得是一种复杂的人文现象.作为一门新兴的交叉学科,第二语言习得研究在发展中应重视其学科性质的科学定位和学科体系的科学建构.本文在对第二语言习得研究的学科定位、学科性质和研究对象进行讨论后,回顾和评述了国外第二语言习得研究从对比分析、错误分析、中介语理论、普遍语法研究、语言类型学研究到语料库语言学研究的发展历程和研究问题,分析了目前我国开展这一学科研究的现状,并结合我国外语教学实际对目前开展这一学科的研究提出建设性意见. 4.学位论文魏琳中国英译旅游宣传材料的语料库分析2006 旅游业在全球范围内的迅猛发展使不同文化背景的人们进行文化交流变成了一种需要。在我国,旅游英语特别是网上的旅游英译材料是外国游客接触和了解我国的媒介。因此,旅游材料的翻译质量举足轻重。而目前旅游文本的翻译研究在中国还是一个比较新的话题,近年来主要是结合最新语言学

语料库语言学术语汇编Aglossaryofcorpuslinguistics.docx

语料库语言学术语汇编 ( V2.0 ) Last updated 2012-10-08 by许家金 Aboutness所言之事 Absolute frequency绝对频数 Alignment (of parallel texts)(平行或对应)语料的对齐Alphanumeric字母数字构成的 Annotate标注(动词) Annotated text/corpus标注文本 /语料库、赋码文本/语料库Annotation标注(名词) Annotation scheme标注方案 ANSI/American National Standards Institute美国国家标准学会 ASCII/American Standard Code for Information美国信息交换标准码 Exchange Associates (of keywords)(主题词的)联想词 AWL/academic word list学术词表 Balanced corpus平衡语料库 Base list/baselist底表、基础词表 Bigram二元组、二元序列、二元结构 Bi-text/bitext双语合并文本、双语分行对齐文本 (一句源语一句目标语对齐后的文 本) Bi-hapax两次词 Bilingual corpus双语语料库 Bootcamp debate/discourse/discussion(新手)训练营大辩论 /话语 /大探讨CA/Contrastive Analysis对比分析 Case-sensitive/case sensitivity大小写敏感、区分大小写 Category-based approach基于类(范畴)的方法 Chi-square test/ 2χ卡方检验 Chunk词块 CIA/Contrastive Interlanguage Analysis中介语对比分析 CLAWS/Constituent Likelihood Automatic Word-CLAWS 词性赋码系统 tagging System Clean text policy干净文本原则 Cluster词簇、词丛 Colligation类联接、类连接、类联结 Collocate n./v.搭配词;搭配 Collocability搭配强度、搭配力 Collocation搭配、词语搭配 Collocational strength搭配强度 Collocational framework/frame搭配框架 Collocational profile搭配概貌

自然语言处理

《自然语言处理》课程教学大纲 一、课程基本信息 1、课号:CS229 2、课程名称(中/英文):自然语言处理/Natural Language Processing 3、学时/学分:32/2 4、先修课程:程序设计语言 5、面向对象:本科三\四年级(ACM班) 7、教材、教学参考书: ?James Allen. Natural Language Understanding (The Second Ver.) The Benjamin / Cummings Publishing Company, Inc., 1995. ?Christopher D. Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. The MIT Press. Springer-Verlag, 1999 二、本课程的性质和任务 自然语言处理是计算机科学与技术专业的一门专业选修课。它的主要任务是使学生了解自然语言处理的主要研究内容及关键技术,并介绍自然语言处理方面的研究成果,为学生从事自然语言处理研究和开发做准备。此外,通过指导学生阅读计算语言学专业会议的论文,进行摘要和评价,并进行介绍、提问和讨论,使他们对所学课程的有关概念与目前的流行方法和技术的关系有更深入地了解。在此基础上,要求学生完成一篇有关自然语言处理主题的课程项目,使他们能用所学的知识发挥自身的能力查找有关资料和概括某一研究领域的国内外最新理 论和技术并最终加以实践。 三、本课程教学内容和基本要求 1. Overview (4)

自然语言处理大纲

课程编号:S0300010Q 课程名称:自然语言处理 开课院系:计算机科学与技术学院任课教师:关毅刘秉权 先修课程:概率论与数理统计适用学科范围:计算机科学与技术 学时:40 学分:2 开课学期:秋季开课形式:课堂讲授 课程目的和基本要求: 本课程属于计算机科学与技术学科硕士研究生学科专业课。计算机自然语言处理是用计算机通过可计算的方法对自然语言的各级语言单位进行转换、传输、存贮、分析等加工处理的科学。是一门与语言学、计算机科学、数学、心理学、信息论、声学相联系的交叉性学科。通过本课程的学习,使学生掌握自然语言(特别是中文语言)处理技术(特别是基于统计的语言处理技术)的基本概念、基本原理和主要方法,了解当前国际国内语言处理技术的发展概貌,接触语言处理技术的前沿课题,具备运用基本原理和主要方法解决科研工作中出现的实际问题的能力。为学生开展相关领域(如网络信息处理、机器翻译、语音识别)的研究奠定基础。 课程主要内容: 本课程全面阐述了自然语言处理技术的基本原理、实用方法和主要应用,在课程内容的安排上,既借鉴了国外学者在计算语言学领域里的最新成就,又阐明了中文语言处理技术的特殊规律,还包括了授课人的实践经验和体会。 1 自然语言处理技术概论(2学时) 自然语言处理技术理性主义和经验主义的技术路线;自然语言处理技术的发展概况及主要困难;本学科主要科目;本课程的重点与难点。 2 自然语言处理技术的数学基础(4学时) 基于统计的自然语言处理技术的数学基础:概率论和信息论的基本概念及其在语言处理技术中的应用。如何处理文本文件和二进制文件,包括如何对文本形式的语料文件进行属性标注;如何处理成批的文件等实践内容 3 自然语言处理技术的语言学基础(4学时) 汉语的基本特点;汉语的语法功能分类体系;汉语句法分析的特殊性;基于规则的语言处理方法。ASCII字符集、ASCII扩展集、汉字字符集、汉字编码等基础知识。 4 分词与频度统计(4学时) 中文分词技术的发展概貌;主要的分词算法;中文分词技术的主要难点:切分歧义的基本概念与处理方法和未登录词的处理方法;中外人名、地名、机构名的自

语料库语言学简史

语料库语言学简史 语料库语言学及语料库方法的作用在今天已不容忽视,但是语料库语言学的发展却经历了一段长期曲折的过程。以1957年Chomsky《句法结构》的发表为界,此前的语料库研究被语言学界广泛称为“早期的语料库语言学”;从上世纪50年代至80年代语料库语言学进入低谷;从80年代开始,语料库语言学迎来了它的“复苏期”。 1 早期的语料库语言学 利用真实语言资料进行研究,是词汇学家和语法学家的优良传统。早在1747年英语词典编纂的鼻祖Samuel Johnson就发表了Plan of an English Dictionary,将前人收集资料的最好方法作了总结,他所编的英语词典含15万条以上的引证说明,可见其所收集的资料库已相当可观。Oxford English Dictionary于1928年完成,所用的引证达400多万条,卡片1100多万张,还专门出版了中古英语手稿与文章350册,供编写OED时参考。Webster’s New International Dictionary第二版的编写参照了100多万条引证,第三版于1961年付印时,新旧引证共达1000多万条。英语语法大师Jesperson在编写《英语语法大全》(1909-1949)时,所使用的卡片数目多达30至40万张。(王建新,1998:52) 20世纪40年代,美国的语言学家Boas在研究美洲印第安语言时就使用了语料库的方法(corpus-based methodology),后来的结构主义语言学家更是如此。只不过当时还没有出现一个专门叫“语料库语言学”的词汇而已。下面是早期语料库语言学的一些主要研究领域: 1.1 语言习得研究 19世纪70年代,语言学家就系统地对幼儿语言习得进行了研究。这些研究都基于父母对幼儿话语及时记录的日记材料。即使在现代,基于原始语料的语言习得研究也没有停止(Ingram,1978)。 在以日记材料为语料的研究风行过后(通常认为从1876年至1926年),语言习得的研究主要表现为下面两种方式:(1)以大量的、不同年龄段的儿童为语言素材的来源(informant),进行语言发展和成熟的研究;(2)以少量的儿童为语言素材的来源,长期跟踪记录他们使用的语言而进行的历时研究(McEnery,Wilson,2001:3)。 1.2 拼写规范研究 德国语言学家Kading以德语大型语料(1100万词次)为基础,对德语各字母在文本中的出现频率以及字母串进行了研究。 1.3 语言教学研究 20世纪20年代,由于大量移民涌向北美,以及各英属殖民地对英语教学的需要,有好几项工程都把寻找英语语言中最常用的词汇作为了主要的研究目标(Fries 和Traver,1940;Bongers,1947)。1921年,Thorndike借助于语料库发布了英语词汇的使用频率研究报告。此项研究对后来美国以及世界其他地区的英语教学都产生了巨大的影响。1944年,Thorndike进一步完善了他的早期研究,发表了“教师3万词汇手册”(The Teacher’s Wordbook of 30,000 words)。此时,Thorndike 研究所依据的语料库已达到1800万词次。 出于教学目的而对英语词汇进行基于语料库研究最著名的例子是Michael West的“实用英语词汇表”(General Service List of English Words)。此项成果发表于1953年,它对当时英语书面语中最常用的2,000个词汇进行了具体的描述,

自然语言处理工程师岗位工作职责范本

岗位说明书系列 自然语言处理工程师岗位 工作职责 (标准、完整、实用、可修改)

编号:FS-QG-78290自然语言处理工程师岗位工作职责Job Responsibilities of Natural Language Processing Engineer 说明:为规划化、统一化进行岗位管理,使岗位管理人员有章可循,提高工作效率与明确责任制,特此编写。 简介:自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。 自然语言处理工程师职位描述(模板一) 岗位职责:

1.负责自然语言处理基础模块开发及应用,优化属性预测分类器; 2.从半结构化或非结构化数据中抽取结构化信息,建立并完善特定领域知识图谱; 3.研发知识表示、知识图谱、知识管理和知识工程相关模型及算法; 4.负责调研最前沿的人工智能技术,追踪并实验最新NLP前沿技术,参与搭建和实现相关模型。 任职要求: 1.计算机及相关专业本科以上学历; 2.熟悉自然语言处理方向常用技术,如分词、词性标注、命名实体识别,关系抽取,句法分析等; 3.熟悉信息抽取相关的算法和逻辑; 4.熟悉知识图谱的构建,熟悉图数据库,拥有知识图谱相关的开发经验优先; 5.熟悉大数据系统架构和开发框架,对深度学习和自然语言处理有深入的研究和实践的优先。自然语言处理工程师职位描述(模板二)

商务英语语料库的建设及应用

商务英语语料库的建设及应用初探 【摘要】语料库语言学作为一门新兴的语言学分支,其影响已遍及语言学研究的各领域。将语料库的方法应用于商务英语词汇教学中,发挥其语料真实丰富、计算机程序强大的重新组织语言数据的能力,既能提高学生商务词汇学习的效率和积极性,也能提高商务英语教学质量。本文从商务英语语料库的建设及其应用价值入手,以期语料库语言学为商务英语教学带来更多成果。 【关键词】商务英语语料库地方课程 商务英语(business english)是指商务场景下所应用到的英语,作为特殊目的英语(english for specific purpose)具有很强的专业性。商务英语跟普通英语(english for general purpose)最大区别之一就是专业词汇的大量使用,因此,词汇教学在商务英语教学中的作用不容忽视。语料库(corpus)是语言素材的集合体,能快速准确地提供诸如构词、搭配、语境等多方面的语料及信息。在外语学习中,语料库能够缩小课堂语言与真实语言的差距、培养学习者的语感和学习能力及研究能力,所以用语料库的方法来学习商务英语词汇既可以刺激学生的学习积极性,也可以更加准确、更加有效地掌握商务英语中专业特点较强的词汇。 1 语料库及其发展 语料库可以概述为运用随机抽样的方法,收集自然出现的连续的语言,运用文本或话语片断,并按照一定的语言学原则建成的具有

一定容量的语料体系。 语料库的发展大致经历了三个阶段:第一代语料库以20世纪60年代的brown corpus以及lob corpus为代表,由于是语料库发展的最初时期,所以规模都比较小,这个时期的语料库只能用来考查常用语言现象的频率,无法展现语言的全貌。第二阶段以20世纪80年代的birmingham collection of english language text以及longman/lancaster english为代表,这一时期的语料库建设以电子语料库的兴起为主要特征,语料库的容量不断扩大,种类不断增多。第三阶段从20世纪90年代至今,是语料库建设、研究与应用的迅猛发展阶段,功能更为强大的计算机系统软件的开发与应用致使第二代超大型计算机语料库开始出现,语料库进入了发展的黄金年代。 2 商务英语词汇及其特征 商务英语源于普通英语,并基于普通英语的基本语法、句法结构和词汇语,有普通英语的一些语言学特征。与此同时,作为应用在商务场合的英语,商务英语又是英语语言知识和商务专业知识的综合,因而又具有独有的专业特征。 2.1 在文体风格上,商务英语词汇属于庄重文体(frozen style)。庄重文体,即各体英语中正式程度最高的一种。这种“正式”一是为了在表达上追求准确、专业、标准化的效果,二是为了在思维上追求清晰和条理。许多商务词汇都表现出这一特性。

语言学常用术语

语言学常用术语

A List of Commonly-used Linguistic Terminology 语言学常用术语表 Part I General Terms 通用术语 Acquisition 习得 Agglutinative language 粘着语Anthropology 人类学 Applied linguistics 应用语言学Arbitrariness 任意性 Artificial intelligence (AI)人工智能Behaviorism 行为主义Behaviorist psychology 行为主义心理学 Bilingualism 双语现象 Cognition 认知 Cognitive linguistics 认知语言学Cognitive science 认知科学Comparative linguistics 比较语言学Computational linguistics 计算语言学 Corpus-linguistics 语料库语言学Creole 克里奥耳语;混合语 Culture 文化 Descriptive linguistics 描写语言学Design features 识别特征Developmental psycholinguistics 发展心理语言学 Diachronic/historical linguistics历时语言学 Dialect 方言 Dialectology 方言学 Displacement 不受时空限制的特性Dualism 二元论 Duality 二重性 Epistemology认识论 Etymology 辞源学 Experimental psycholinguistics 实验心理语言学 Formalization 形式化 Formal linguistics 形式语言学Forensic linguistics 法律语言学Functionalism 功能主义General linguistics 普通语言学Grammaticality 符合语法性Ideography 表意法 Inflectional language 屈折语 Inter-disciplinary 交叉性学科的Isolating language 孤立语 Langue 语言 Macro-sociolinguistics 宏观社会语言学 Mentalism 心智主义 Micro-sociolinguistics 微观社会语言学 Montague grammar蒙太古语法Neuro-linguistics 神经语言学Orthography 正字法 Orthoepic 正音法的 Paradigmatic 聚合关系 Parole 言语 Pedagogy 教育学;教授法Philology 语文学 Philosophy 哲学 Phonography 表音法 Pidgin 皮钦语;洋泾浜语Polysynthetic language 多式综合语Prescriptive linguistics 规定语言学Psycholinguistics心理语言学Psychology 心理学 Semeiology 符号学 Sociology 社会学 Speech 言语 Sociolinguistics社会语言学Structuralism 结构主义 Synchronic linguistics 共时语言学Syntagmatic 组合关系 Theoretic linguistics 理论语言学Universal grammar 普遍语法Universality 普遍性 Part II Phonology 音位学 Ablaut 元音变化 Acoustic phonetics 声学语音学Affricate 塞擦音 Allophone 音位变体

自然语言处理技术分享1

内容大概分为:自然语言处理的简介、关键技术、流程及应用。 首先,介绍一下什么是自然语言处理(也叫自然语言理解): 语言学家刘涌泉在《大百科全书》(2002)中对自然语言处理的定义为:“自然语言处理是人工智能领域的主要内容,即利用电子计算机等工具对人类所特有的语言信息(包括口语信息和文字信息)进行各种加工,并建立各种类型的人-机-人系统,自然语言理解是其核心,其中包括语音和语符的自动识别以及语音的自动合成。” 从微观上讲,自然语言理解是指从自然语言到机器(计算机系统)内部之间的一种映射。 从宏观上看,自然语言理解是指机器能够执行人类所期望的某些语言功能。这些功能包括: ①回答有关提问;计算机正确地回答用自然语言输入的有关问题 ②提取材料摘要;机器能产生输入文本的摘要 ③同词语叙述;机器能用不同的词语和句型来复述输入的自然语言信息 ④不同语言翻译。机器能把一种语言翻译成另外一种语言 自然语言处理的关键技术 自然语言处理的关键技术包括:词法分析、句法分析、语义分析、语用分析和语句分析。 1.词法分析 词法分析的主要目的是从句子中切分出单词,找出词汇的各个词素,并确定其词义。 词法分析包括词形和词汇两个方面。一般来讲,词形主要表现在对单词的前缀、后缀等的分析,而词汇则表现在对整个词汇系统的控制。在中文全文检索系统中,词法分析主要表现在对汉语信息进行词语切分,即汉语自动分词技术。通过这种技术能够比较准确的分析用户输入信息的特征,从而完成准确的搜索过程。它是中文全文检索技术的重要发展方向。 不同的语言对词法分析有不同的要求,例如英语和汉语就有较大的差距 汉语中的每个字就是一个词素,所以要找出各个词素是相当容易的,但要切分出各个词就非常难。 如”我们研究所有东西“,可以是“我们——研究所——有——东西”也可是“我们——研究——所有——东西”。

基于学习者英语语料的类联接研究概念、方法及例析

第127期2009年05月 外语电化教学 CAFLEC No.127 May2009 基于学习者英语语料的类联接研究 概念、方法及例析 许家金,熊文新 (北京外国语大学中国外语教育研究中心,北京100089) 摘要:本文主张类联接研究应兼顾词形、语法类别以及篇章和语类等不同语言层面来观察搭配行为。具体可包含:单个语法范畴的类联接、语法串分析、词形与语法范畴的类联接、不连续结构类联接、语法范畴与话语、语体的类联接等。本文结合中国英语学习者语料进行了示例分析,旨在说明可以结合类联接开展中间语对比分析、语体分析等。 关键词:类联接;学习者语料库;语料库语言学;研究方法;类联接分析器 中图分类号:H319.3文献标识码:A文章编号:1001-5795(2009)03-0018-0006 搭配(或称共现关系)是语料库语言学的核心概念之一。目前的搭配研究已不单限于词汇间的共现关系,很多学者试图借助语料库语言学的方法观察语法及其他语言相关层面的共现现象,其中以Hoey的“词汇触发”(1exiealpriming)理论涵盖层面最宽泛。Hoey将词汇间的共现关系扩展到词汇与其在篇章中的出现位置以及在不同文体中的分布等十个层面(2005:13)。事实上,对于搭配范围的不同处理,体现了不同的语境观,即对共现语境范围的不同认识。本文将基于赋码语料探讨如何兼顾词形和语法类别,以及篇章和语类等不同层面来观察搭配问题。本文示例所用语料主要为中国英语学习者英语。 1类联接及其扩展 1.1类联接 “类联接”(eolligation,又译作“类联结”或“类连接”)即语法层面的搭配关系。该术语由Firth(1957[1968]:181)提出,他将1watchedhim背后体现的“第一人称代词+动词过去时+第三人称代词”语法类别共现关系称为类联接。这一术语中的“类”即词类或语法类别之意。换言之,类联接就是有关词类或语法类别的共现关系。而新近的一些文献,如Baker,Hat-die&McEnery(2006:36)的《语料库语言学术语汇编》里对colligation这一词条的解释除了原有的句法共现关系外,还专门以window为例,说明window常和介词构成类联接。 目前的类联接研究很大程度得益于一些优良的自动词性赋码工具(如CLAWS,准确率高达96—7%)(Garside&Smith,1997)。因此通过赋码语料研究词类或语法类别的共现关系成为可能。相关研究大致分三类。一、有关赋码串(tagsequences或POSgrams)和语法搭配的总体分析(如,Aarts&Granger,1998;Tono,1999;Hunston&Francis,2000;濮建忠,2003b);二、针对某一词类的总体研究,通常以对动词的考察为主(如,Francis,Hunston&Manning,1996,1998;Mindt,1995,2002;濮建忠,2003a;孙海燕,2004;孙海燕,陈永捷,2006);三、还有一些专题研究。如Biber&Reppen(1998)关于补语从句,Gabrielatos(2007)关于if条件句的类联接,张军、李文中(2004)关于动名搭配,以及梁茂成(2008)有关情态序列的研究等。 作者简介:许家金:男,博士、副教授。研究方向:话语分析、语料库语言学。 熊文新:男,博士、副教授。研究方向:计算语言学。 收稿日期:2008-12-25 基金项目:本研究得到教育部人文社会科学研究项目(08JC740002)资助;本文的撰写还得到梁茂成教授的指导,在此一并致谢。?18?  万方数据

自然语言处理中的卷积神经网络的详细资料介绍和应用

自然语言处理中的卷积神经网络的详细资料介绍和应用 1、传统的自然语言处理模型 1)传统的词袋模型或者连续词袋模型(CBOW)都可以通过构建一个全连接的神经网络对句子进行情感标签的分类,但是这样存在一个问题,我们通过激活函数可以让某些结点激活(例如一个句子里”not”,”hate”这样的较强的特征词),但是由于在这样网络构建里,句子中词语的顺序被忽略,也许同样两个句子都出现了not和hate但是一个句子(I do not hate this movie)表示的是good的情感,另一个句子(I hate this movie and will not choose it)表示的是bad的情感。其实很重要的一点是在刚才上述模型中我们无法捕获像not hate 这样由连续两个词所构成的关键特征的词的含义。 2)在语言模型里n-gram模型是可以用来解决上面的问题的,想法其实就是将连续的两个词作为一个整体纳入到模型中,这样确实能够解决我们刚才提出的问题,加入bi-gram,tri-gram可以让我们捕捉到例如“don’t love”,“not the best”。但是新的问题又来了,如果我们使用多元模型,实际训练时的参数是一个非常大的问题,因为假设你有20000个词,加入bi-gram实际上你就要有400000000个词,这样参数训练显然是爆炸的。另外一点,相似的词语在这样的模型中不能共享例如参数权重等,这样就会导致相似词无法获得交互信息。 2、自然语言处理中的卷积神经网络 在图像中卷积核通常是对图像的一小块区域进行计算,而在文本中,一句话所构成的词向量作为输入。每一行代表一个词的词向量,所以在处理文本时,卷积核通常覆盖上下几行的词,所以此时卷积核的宽度与输入的宽度相同,通过这样的方式,我们就能够捕捉到多个连续词之间的特征(只要通过设置卷积核的尺寸,卷积核的宽度一般和词向量的长度一致,长度可以去1,2,3这类的值,当取3时就会将3个连续词的特征表示出来),并且能够在同一类特征计算时中共享权重。如下图所示 如上图所示,不同长度的卷积核,会获得不同长度的输出值,但在之后的池化中又会得到

相关文档
最新文档