计算语言学概论——应用语言学系列教材
于根元《应用语言学概论》课后练习答案
应用语言学概论课后练习及答案第一章:1、举例说明为什么有了本体语言学还要有应用语言学。
答:因为本体语言学和应用语言学两者之间不具有可比性。
一方面,语言基本上是社会现象而不是自然现象,语言的发展和使用受到多种因素的影响,语言的应用有自身的规律,无论是语言应用的哪个方面。
另一方面,人们已经而且将会进一步看到,仅从语言自身看语言是不能完全认识语言的。
语言的应用研究不仅有利于语言应用本身,而且也有利于加深对语言本身的认识。
因此,没有语言的运用,就没有语言。
要全面认识语言,真正认识语言,必须结合语言的应用来进行。
例如,为什么一个人在不同的场合会使用不同的表达方式?为什么明明是两个不同的音有人却听成相同的音?为什么同样的词语会产生不同的交际效果?离开了语言的运用,单从语言本身是无法回答这些问题的。
因此,有了本体语言学还要有应用语言学。
2、历史比较语言学让位于结构主义语言学的两个历史教训是什么?答:历史比较语言学让位于结构主义语言学的一个历史教训是:历史比较语言学家的唯我独尊和封闭的态度。
认为只有研究语言历史的语言学才是科学,其他的研究都不是科学。
第二个教训是:研究的局限性。
它只注意古语言,并不研究现有的活语言。
因此,它在经历了光辉的百年之后,逐渐被新的研究兴趣所替代。
3、说说《普通语言学教程》的作者、出版时间和历史地位。
答:《普通语言学教程》的作者是瑞士语言学家索绪尔,出版时间是1916年,历史地位:书中针对历史比较语言学的不足提出的语言学理论,奠定了现代语言学的基础,因此成为现代语言学的“圣经”。
4、说说《马氏文通》的作者、出版时间和历史地位。
答:《马氏文通》的作者是马建忠,出版时间是1898年,历史地位:是中国形成独立的语言学学科的标志。
5、说说中国形成语言学的背景。
答:中国形成语言学是在19世纪和20世纪之交,有两个背景:一是受西方学术文化的影响,一是中国传统语文学自身的发展。
当时语言学方面中国向外国所学的理论、方法及层次是比较低的;学习的方法、层次也是比较低的。
应用语言学概论
应用语言学
Applied Linguistics
7.1946年美国在密执安大学建立了英语学院,研究如何
对外国人讲授英语,并出版著名的杂志《语言学习》,
这个刊物的副题就是《应用语言学杂志》。这是世界上 第一本明确冠以“应用语言学”的杂志。从此,应用语 言学作为一门独立的语言学科,受到学术界的承认和接 受。
应用语言学是中 国近20年来发展十 分迅速的学科,它 具有交叉性、应用 性、边缘性的特点, 对社会生活和经济 的许多方面都有积 极的影响或重要的 支撑作用,是语言 学的重要组成部分。
应用语言学
Applied Linguistics
二、应用语言学学科形成发展情况 应用语言学概念的提出 19世纪末,波兰J.N.博杜恩· 库尔德内提出了应用语言学 德· 这个概念。 独立的应用语言学学科形成的标志是1964年第一届国际应 用语言学大会在法国召开和国际应用语言学会的成立。 中国应用语言学学科形成的标志是:1984年语言文字应用 研究所成立,1992年《语言文字应用》杂志创刊,1995年 首届全国语言文字应用学术研讨会举行和中国应用语言学 会的筹建。
应用语言学
Applied Linguistics
在现代汉语规范研究方面,语言研究所词典编辑室编写的 《现代汉语词典》1978年由商务印书馆正式出版,1996年 出版了修订本。 这个时期还出现了一些新的学科和研究领域,如计算语言 学、社会语言学、文化语言学,双语双方言、称谓、北京 街巷名称、体态语、新词新语、文学作品语言、语言风格 研究等。 这个时期在建立研究机构、创办研究杂志、设置课题、培 养队伍等方面,都有一些实践和研究。1995年12月筹建了 中国应用语言学会。
应用语言学
Applied Linguistics
《计算语言学概论》PPT课件
4.2 詞ê判別-11
其它ê問題(辭典無收ê詞)
定量詞 eg 三張紙、二十五個人、…
定量詞若無處理,會影響台語變調結果
複合詞問題 eg 國中小、上下班、… Prefix/Suffix eg 正確性、相關性、… 重thah詞 eg 歡歡喜喜、輕輕鬆鬆、… 人名、地名 eg 陳水扁、舞鶴、… 組織名、商品名 eg 台大資訊系、可口可樂、… 新名詞、簡省詞 eg E世代、A菜、資工、… 術語(Term)
(語詞)
3. A=[aij]nn , aij = P(qt+1=j | qt=i), 1≦ i ,j ≦N (目前詞
類是i ê情形下,下一個詞類是 j ê機率)
4. B={ bj(k) }, bj(k) = P(vk|j), 1 ≦k ≦M, 1 ≦j ≦N
5. π是開始狀態ê機率分佈
23
4.3 詞性標注-8
實作上
Beh按怎真緊ka詞chhe出來? 斷詞beh按怎做disambiguity? 詞類beh按怎做disambiguity?
5
4.2 詞ê判別
英文ê詞 (Tokenization)
White Space / 標點 隔開 有ê詞用標點隔開 eg “I’ll” “can’t” 有ê縮寫詞有句點 eg “U.S” 有ê詞有非字母 eg “AT&T” “Micro$oft” 數字 eg “123,456.789” “23.5%” “2005/12/21”
n個詞類,O(nm)
28
4.3 詞性標注-13
Viterbi : 利用動態規劃 ê觀念
假設每一個詞lóng有n個詞類標記,wm kàu wm+1 êj-th標記,有n個可能ê路徑,假設機 率siong kôan ê是 ti tj這個路徑
应用语言学概论习题答案
《应用语言学概论》教案(一)应用语言学概论第一章绪论第一节应用语言学学科建设一、应用语言学诞生福建有一位中学语文特级教师陈日亮有一个著名的观点:“世界即语言,语言即世界。
”“社会生活“把一切化在语言之中,把语言化在一切之中。
”应用语言学存在的事实,几乎与语言的诞生同时,就有了语言的应用。
但是作为一门独立的学科存在,则历史很短。
1870年波兰语言学家.博杜恩.德. 库尔德内首先提出“应用语言学”术语。
历经近百年的探索和积累,直到二次世界大战结束,社会、科学、文化、教育,特别是光电子信息技术的迅猛发展,世界各种语言面临生存和发展的挑战,纷纷推行新的语言战略,促使多学科结合的应用语言学作为独立学科的诞生和发展。
二、应用语言学学科建设1、应用语言学国际发展状况、标志:1964年第一届国际应用语言学大会在法国南锡召开并成立了国际应用语言学协会。
1970年出会刊。
欧美一些现代化水平较高的国家,在语言学和计算机紧密结合的过程中,迅速发展了语言信息处理、计算语言学、社会语言学、语言规划和语言教学理论,产生了众多颇有建树的应用语言学家。
而且各有发展特点。
一般说来,社会语言学率先在欧美国家发展起来的。
语言规划方面,美国、法国、俄罗斯比较领先。
在欧洲,语言学摆脱“哲学的婢女”的地位,成为一门独立的学科,始于19 19 世纪。
几乎整个19世纪,为寻找印欧语的共同来源,运用历史比较法研究语言,世谓一展辉煌的历史比较语言学。
19世纪与20世纪之交,结构主义语言学兴盛并取而代之。
总体上,国外应用语言学发展较快,理论逊于实践。
1946年美国密歇根大学开设应用语言学课程;1949年美国密歇根大学创办世界第一个应用语言学刊物;1969.9在伦敦召开第二届国际应用语言学大会。
2、中国应用语言学基本态势、从时间上看,比世界整整晚了20年。
这和语言大国的地位很不相称。
改革开放30多年来,情况发生了很大变化。
1984年经国务院批准始成立语言文字应用研究所;这是我国应用语言学形成的标志。
Computational_Linguistics_01计算语言学概论
名称
授课时间授课地点助教
平时成绩期末笔试
计算语言学是一门交叉学科。
计算语言
语言障碍
终极目标当前目标
建立形式化的适于计算机处理的语言模研制分析、生成以及处理语言的各种算
规则方法举例
计算语言学的研究方法
用上述规则分析句子“the boy saw the girl with a telescope”
All grammar leak (Sapir 1921)
一般而言,很多基于规则的系统不能满
融合规则驱动和数据驱动的方法
著名的例子
联机机器翻译网站
联机
信息检索系统Google
文本数据结构化
文本分类(自动判别文本的类别)音字转换(汉字整句输入法)
拼写检查和自动勘校系统。
《应用语言学概论》课件
应用语言学对法律语言进行研究和分析,以确保法律语言 的准确性和规范性。
01
司法语言与公正
应用语言学关注司法语言与公正的关系 ,以提高司法审判的公正性和公信力。
02
03
法律文书写作
应用语言学为法律文书写作提供语言 学上的指导,以确保法律文书的准确 性和规范性。
04
应用语言学的研究方法
实证研究法
语言障碍与治疗
心理语言学还涉及语言障 碍的诊断和治疗,研究各 种语言障碍的成因和治疗 方法。
文化语言学
语言与文化关系
文化语言学关注语言与文化的关系, 研究语言的符号意义和文化内涵,探
讨语言如何反映和传承文化。
跨文化交际
文化语言学还涉及跨文化交际,研究 不同文化背景下的语言使用和交际策
略。
文化变迁与语言变化
分析实际语境中的语言使用情况,以揭示话语的语义 、语用和语境特点。
详细描述
话语分析法是应用语言学中用于分析实际语境中语言 使用情况的研究方法。它通过分析实际语境中的话语 ,包括对话、演讲、新闻报道等,来揭示话语的语义 、语用和语境特点。这种方法有助于深入了解语言的 实际使用情况,提高语言交际能力。
语料库研究法
文化语言学还关注文化变迁与语言变 化的关系,研究文化因素对语言发展
的影响。
计算语言学
自然语言处理
计算语言学在自然语言处理方面,研究如何利用计算机技术处理、 分析和理解自然语言。
信息抽取与文本挖掘
计算语言学还涉及信息抽取和文本挖掘,研究如何从大量文本中提 取有用信息并进行语义分析。
机器翻译与语音识别
比较不同文化背景下的语言现象,以揭示文 化因素对语言使用的影响。
详细描述
应用语言学概论5自然语言处理精品PPT课件
二、任务和理论依据
• 任务:
A、数理语言学从数学领域得到的主要是思考问题的 思路和方法,而不是某种专门的结果,它把数学 模型和数学程序运用于语言学的研究,采用定量 化和形式化的描述方法,使得语言学和数学一样 精密,以便于计算机的操作,为计算机模拟人脑 和进行人工智能的研究开山辟道。
B、从语言的内部结构和语言的交际活动两方面进 行,也就是说把数理语言学的研究首先分为作为 符号 系统的语言的数学性质的研究和对作为交际 活动的过程及结果的言谈的数学性质的研究两个 部分。
数理语言学分支学科介绍
1、统计语言学 运用概率论、数理统计等数学的方法来作语
言成分的定量分析和动态描写,目的是要建立语 言统计模型,来解决传统语言学研究的定性和静 态研究的不足。
统计语言学根据不同的研究对象,又可分出 许多具体领域,如统计语音学、计算语言风格学 和年代统计学。统计语音学研究音素音位,计算 语言风格学通过统计研究某人、某一时代和某一 民族的言语风格。年代统计学根据时代的变化, 对词汇特征和句型等进行分析。
1985年上海知识出版社出版了冯志伟编著的数理语言学较为系统的阐述了数理语言学的理论知识包括该学科的重要定律和术语1997年北京语言文化大学出版社出版了方立编著的英文版的数理语言学这两本书成为我国目前研究数理语言学的集大成者此外在数理语言学领域研究取得较大成绩的还有白世云张世武孙锐欣盛金标等学者1985年上海知识出版社出版了冯志伟编著的数理语言学较为系统的阐述了数理语言学的理论知识包括该学科的重要定律和术语1997年北京语言文化大学出版社出版了方立编著的英文版的数理语言学这两本书成为我国目前研究数理语言学的集大成者
• 3,根据检索到的实例生成与源语言句子相对应的 译文。
• 例子: • 金山词霸:词库、释义库、音库
应用语言学之计算语言学
第四节
语料库语言学
20 世纨 80 年代以后,陆续建立了一些以词典编纂为应用背景的大规模语料库。 COBUILD语料库(Collins Birmingham University International Language Database,首字母缩写就是 COBUILD)。1987 年,Collins 出版社出版了建 立在 COBUILD语料库基础上的英语词典,词条选目、用法说明和释义都直接 来自真实的语料。2003 年这个语料库的规模已经达到 5 亿词次,其中包含
未来,随着语料库语言学的収展,语料库还能为文学的研究、文化 的研究甚至社会学的研究提供帮助。
语料库网址:
北京大学《人民日报》标注语料库:/ 北京语言大学的语料库:/kych/H.htm 清华大学的汉语均衡语料库TH-ACorpus:/ainlp/source.htm 山西大学的语料库: /homepage/cslab/sxuc1.htm 台湾中研院的语料库: 现代汉语平衡语料库:.tw/SinicaCorpus 戒 .tw/~tibe/2-words/modern-words/ 戒 .tw/ftms-bin/kiwi.sh 近代汉语标记语料库:.tw/Early_Mandarin/ 古汉语语料库:.tw/ftms-bin/ftmsw3 戒 /projects/scriptasinica/cgi-bin/ghy/kiwi.cgi 戒 .tw/~tibe/2-words/old-words/ 台湾南岛语典藏:.tw/Formosan/ 闽南语典藏:.tw/ 汉籍电子文献:.tw/~tdbproj/handy1/ 戒 .tw/ftms-bin/ftmsw3 香港城市大学的 LIVAC 共时语料库:.hk/livac/ 戒 浙江师范大学的历叱文献语料库: /xueke/hyywzx/xkjj.htm 中国科学院计算所的双语语料库:/corpus/query_process.php 中文语言资源联盟:/xyzy.htm
应用语言学概论(绪论)lesson
1 2
文化适应
指在跨文化交际中,逐渐适应新文化的过程。
文化休克
指在跨文化交际中,由于文化差异和语言障碍等 原因,导致的不适应、困惑甚至恐惧等心理状态。
3
应对策略
在跨文化交际中,应尊重对方的文化习俗,学习 并理解对方的语言和价值观,以促进有效的沟通 和交流。
06 总结与展望
应用语言学的未来发展趋势
应用语言学的应用领域
教育领域
应用语言学在语言教学、教材 编写、教师培训等方面发挥重
要作用。
翻译领域
应用语言学为翻译理论和实践 提供了语言学基础,提高翻译 质量和效率。
跨文化交际领域
应用语言学有助于促进不同文 化背景的人们之间的有效沟通 。
媒体与传播领域
应用语言学在新闻报道、广告 文案、公共关系等领域具有实
01
02
03
目标导向
语言教学应以教学目标为 导向,根据不同的教学目 的制定相应的教学计划和 内容。
实践性
语言教学应注重实践性, 通过大量的语言实践培养 学生的语言运用能力。
互动性
语言教学应注重师生互动、 生生互动,通过交流和合 作提高学生的语言交际能 力。
语言教学方法与实践
传统教学法
01
以教师为中心,注重语法和词汇知识的传授,常见于课堂教学。
应用语言学概论(绪论)PPT大纲
目录
• 绪论 • 语言与语言学的基本概念 • 应用语言学的研究内容与方法 • 语言学习与教学 • 语言与文化的关系 • 总结与展望
01 绪论
应用语言学的定义与重要性
01
基础概念
02
应用语言学是一门研究语言在各个领域中 实际应用的语言学分支。
03
计算语言学概论课件
计算语言学的重要性
社会需求
随着信息技术的快速发展,社会 对自然语言处理的需求日益增长 ,计算语言学在信息检索、机器 翻译、语音识别等领域具有广泛
的应用前景。
学术价值
计算语言学为语言学、计算机科 学等相关学科提供了新的研究方 法和思路,有助于推动相关学科
的发展。
技术创新
计算语言学的技术突破和创新, 将推动人工智能、大数据等领域 的进步,为社会发展带来更多机
信息抽取是从非结构化文本中提 取结构化信息的过程,如从新闻 报道中提取事件、时间、地点等
关键信息。
信息抽取技术广泛应用于知识图 谱构建、问答系统等领域。
信息抽取的关键技术包括实体识 别、关系抽取、事件抽取等。
机器翻译
机器翻译是利用计算机自动将一 种语言的文本转换为另一种语言
的文本的过程。
机器翻译技术已经取得了显著的 进步,如基于神经网络的机器翻
深度学习在NLP领域的应用取得了显著成果,如词向量表示、序列标注、生成模型 等。
文本挖掘
文本挖掘是从大量文本数据中 提取有用信息的过程,包括文 本分类、聚类、情感分析等。
文本挖掘技术广泛应用于信息 检索、舆情分析、企业竞争情 报等领域。
文本挖掘的关键技术包括特征 提取、文本表示、模型评估等 。
信息抽取
感谢观看
REPORTING
情感分析
计算语言学可以帮助智能客服系统识别用户的情感倾向,从而提供 更加贴心、个性化的服务。
自动回复
利用计算语言学的方法,智能客服系统可以自动回复用户的咨询, 提高服务效率。
在机器翻译中的应用
1 2
语言对齐
计算语言学可以帮助机器翻译系统识别源语言和 目标语言之间的对应关系,提高翻译的准确度。
《应用语言学概论》课件
计算机语言学
总结词
研究计算机处理自然语言的原理和方法。
详细描述
计算机语言学是应用语言学的另一个分支, 主要关注计算机处理自然语言的原理和方法 。它研究自然语言的语法、语义、语用等方 面的计算机处理技术,以及如何利用计算机 技术提高自然语言的处理效率和应用范围。
03
CHAPTER
应用语言学的应用领域
语言政策和规划
语言政策和规划是应用语言学的重要应用领域之一,主要涉及语言政策的制定、实施和评估,以及语 言的规划和管理。
研究语言政策和规划可以帮助解决语言冲突和语言濒危等问题,促进语言的多样性和语言生态的平衡发 展。
在全球化和国际交流日益频繁的背景下,语言政策和规划对于保护和推广本国语言和文化,以及促进国 际交流和理解也具有重要意义。
语料库研究法
总结词
利用语料库对大量真实语言数据进行处理和分析,以 揭示语言使用的规律和特征。
详细描述
语料库研究法利用语料库对大量真实语言数据进行处 理和分析。研究者通过建立语料库,收集大量的实际 语言数据,利用计算机软件进行统计分析,以揭示语 言使用的规律和特征。这种方法注重语言的真实性和 客观性,能够提供更为全面和准确的语言使用情况。
语言与媒体
语言与媒体也是应用语言学的一个重要领域,主要涉及媒体语言的特征、 媒体语言的规范和标准,以及媒体语言的传播等方面。
媒体语言对于社会舆论和价值观的传播具有重要影响,因此需要关注媒体 语言的规范和标准问题。
此外,随着社交媒体等新媒体的兴起,媒体语言的传播方式和影响范围也 在不断扩大,需要应用语言学的方法和理论进行深入研究和探讨。
THANKS
谢谢
语言与社会的关联
应用语言学关注语言与社会、文化、心理等方面的 关联,探讨语言在实际语境中的功能和变化。
计算语言学厦大应用语言学
利用深度学习模型,如卷积神经网络(CNN)和循环神经网络 (RNN),对文本进行情感分析和意见挖掘。
方面级情感分析
针对特定方面或属性进行情感分析,如产品评价中的性能、外观等方 面。
机器翻译技术进展与挑战
神经机器翻译
基于深度学习的神经机器翻译模型,如Transformer和Seq2Seq, 实现了更高的翻译质量和效率。
• 深度学习技术融合:随着深度学习技术的不断发展,未来计算语言学将更加注 重与深度学习技术的融合,利用神经网络模型强大的特征提取和学习能力,提 高自然语言处理的效果和效率。
• 知识图谱与语义理解:知识图谱作为一种重要的知识表示和推理工具,将在未 来计算语言学中发挥越来越重要的作用。结合知识图谱和语义理解技术,可以 实现更加准确、全面的自然语言理解和分析。
认知科学对语言生成的影响
认知科学研究人类如何获取、存储、处理和运用知识的科学,对计算语言学在语言生成方面提供了重要的启示。 例如,认知语言学将语言视为一种认知活动,关注语言与认知、文化等因素的相互作用,为自然语言生成提供了 更广阔的研究视角。
人工智能技术在教育、出版等领域应用
人工智能技术在教育领域的应用
计算语言学厦大应用 语言学
目录
• 引言 • 计算语言学基础理论 • 应用语言学实践案例分析 • 跨领域合作与交叉研究趋势 • 挑战与未来发展方向 • 总结回顾与展望未来
01
引言
计算语言学与应用语言学关系
计算语言学是应用语言学的一个分支,它利用计算机技术 和方法来研究自然语言处理(NLP)问题。
多模态数据处理与跨媒体智能
多模态数据处理
多模态数据处理是指处理包含文本、图像、音频、视频等多种模态的数据。在计算语言学中,多模态 数据处理可以帮助我们更全面地理解语言信息,例如通过图像和文本的结合来识别情感、场景等。
北京语言大学语言学及应用语言学参考书目
北京语言大学语言学及应用语言学参考书目1 概论高明凯、石安石主编《语言学概论》,北京,中华书局,1979刘伶、黄智显、陈秀珠主编《语言学概论》,北京,北京师范大学出版社,1984吴为章编著《新编普通语言学教程》,北京,北京广播学院出版社,1999 [较深]伍铁平主编《普通语言学概要》,北京,高等教育出版社,1993兹维金采夫《普通语言学纲要》(1962),伍铁平、马福聚、汤庭国等译,北京,商务印书馆,19812 语言学理论索绪尔《普通语言学教程》(1916),高明凯等译,岑麒祥、叶蜚声校,北京,商务印书馆,1982 [初读有一定难度,但需要仔细品味]赵元任《语言问题》,北京,商务印书馆,1980Lyons,J.Linguistics,1980,载南开大学中文系《语言研究译丛》编辑部编:《语言研究译丛》第二期,天津,天津人民出版社,1988于根元主编《应用语言学概论》,北京,商务印书馆,2003宋国明《句法理论概要》,北京,中国社会科学出版社,1997Radford,A.1997.Syntax:A Minimalist Introduction.Cambridge:Cambridge University Press张敏《认知语言学与汉语名词短语》,北京,中国社会科学出版社,1998徐通锵《历史语言学》,北京,商务印书馆,1991 [较深]陈原《社会语言学》,北京,学林出版社,1983斯大林《马克思主义和语言学问题》,中共中央马恩列斯著作编译局译,北京,人民出版社,1971卫志强《当代跨学科的语言学》,北京,北京语言学院出版社(现在叫北京语言大学出版社了),1992语言在交际中规范施春宏中国经济出版社西方语言学流派刘润清外语教学与研究出版社语言理解与认知崔希亮北京语言文化大学出版社3 语言学史岑麒祥《语言学史概要》,北京,北京大学出版社,1988R.H.罗宾斯《简明语言学史》,许德宝、冯建明、胡明亮译,北京,中国社会科学出版社,19874 本体研究(一般参考现代汉语课老师开的参考文献)罗常培、王均《普通语言学纲要(修订本)》,北京,商务印书馆,2002陆俭明《现代汉语语法研究教程》,北京,北京大学出版社,2003朱德熙《语法答问》,北京,商务印书馆,1985蒋绍愚《近代汉语研究概况》,北京,北京大学出版社,1994 [较深]5 其他岑麒祥《普通语言学人物志》,北京大学出版社,1989罗常培《语言与文化》,语文出版社,1989王希杰主编《语言学百题(修订本)》,上海教育出版社,1991王振昆、谢文庆、刘振铎编《语言学资料选编》,中央广播电视大学出版社,1983《现代汉语》参考文献目录l 第一章绪论胡裕树《现代汉语》(增订二版)绪论部分,上海教育出版社。
应用语言学方向参考书目
应用语言学方向参考书目1.Allright, D. & K. M. Bailey. 1991. Focus on the Language Classroom: An Introduction to ClassroomResearch for Language Teachers. Cambridge University Press. *2.Arnold, J. (ed.) 1999/2000. Affect in Language Learning. Cambridge University Press/外语教学与研究出版社/人民教育出版社。
*3.Bachman, Lyle. F. 1990. Fundamental Considerations in Language Testing. New Y ork: OxfordUniversity Press.4.Beckett, G. H. & P. C. Miller (eds.). 2006. Project-Based Second and Foreign Language Education:Past, Present and Future. Greenwich, CT: Information Age Publishing, Inc. *5.Brown, H. D. 1994/2001. Principles of Language Learning and Teaching(3rd edn). Pearson HallRegents/外语教学与研究出版社。
6.Brown, J. D. 1995/2001. The Elements of Language Curriculum: A Systematic Approach to ProgramDevelopment. Heinle & Heinle Publishers/外语教学与研究出版社。
5计算语言学——厦大应用语言学
(四)语料库语言学:语料库(corpus)亦称 语库或素材,是收集并科学地组织起来的 一套语言材料,这种材料是某种语言中自 然出现的,可以是书面的,也可以是口头 的。语料库语言学(corpus linguistics)是以 语料库中的语篇(text)语料为基础对语言进 行研究的一门学科。
四、汉字的信息处理
正向最大匹配法的缺点: a、 词表设计困难:目前对什么是词还没有一 个定论分词系统仍然没有一个统一的具有权威 性的分词词表作为分词依据。 b、 如果N设计的过大,就会影响效率。 c、 如果N设计的过小,就会影响正确性。 d、 有些歧义不能解决。 如:有意见分歧:正向最大匹配法的分词结果 是:有意/ 见/ 分歧/ e:未登录词无法解决。
计算语言学
一、计算语言学的定义:是利用计算计研 究和处理自然语言的学科。
狭义:指的是通过建立形式化的计算模型,用计算 机分析、处理、理解并生成自然语言的学科。例: “有意见分歧” 算一算怎么切分合理 是“有意 见 分歧” 还是 : “有 意见 分 歧” ? 广义:包括狭义的内容;还包括利用计算机对语言 文字进行的各种定量化和精密化的研究。 例1:中国《红楼梦》的作者:前八十回和后四十 回是不是一个人。 例2:方言亲属关系的计量:
分词不当的例子:
Байду номын сангаас
在Google上输入“和服”搜索所有中文简体网页,总共结 果507,000条,前20条结果中有14条与和服一点关系都没 有。在第一页就有以下错误: “通信信息报:瑞星以技术和服务开拓网络安全市场” “ 使 用 纯 HTML 的 通 用 数 据 管 理 和 服 务 - 开 发 者 ZDNet ...” “陈慧琳《心口不一》化妆和服装自己包办” “外交部:中国境外领事保护和服务指南(2003年版) ...” “产品和服务” 备注:现在已经好多了
应用语言学概论
主要参照论文
应用语言学与心理 语言学在我国旳发 展
二十世纪旳中国应 用语言学研究
苏联旳应用语言学 研究
20世纪应用语言学评述
发展我国应用语言
桂诗春
于根元 魏仁译 桂诗春 桂诗春
语言教学与研究 1994.3
语言教学与研究 1998.4
中国语文
1959,8
外语教学与研究 2023, 1
语言文字应用 1998,1
考试措施
练习与思索
1. 阅读教材“序言”部分。 2. 查阅我校图书馆应用语言学概论方面旳
参照文件。 3. 查阅下列学术刊物近三年所刊登旳学术
论文,并进行初步学科分类:《语言文 字应用》《中国语文》《语文建设》
课程简介:基本要求
应用语言学是一门相当广泛旳应用性学科,基 本上有三大块属于应用语言学旳基本事域,即 语言教学、社会语言学、中文信息处理,发展 较快且较为定型旳还有数理语言学、心理语言 学、交际语言学、神经语言学、统计语言学等。
要求学生在掌握有关语言本体旳知识后,相应 用语言学旳应用前景、学科定型、学科研究内 容、研究措施等有较为清楚旳认识。而且能利 用有关措施对某一领域旳详细语言现象进行初 步旳分析。
辞书学
黑龙江大学:辞书学 武汉大学:中文信息处理 华中师范大学:语言教学、规范语言学 南京师范大学:计算语言学 南京大学:社会语言学 厦门大学:计量词汇学、对外汉语、计算语言学(机
器翻译、语言智能处理)
主要参照书目
《应用语言学纲要》,齐沪扬、陈昌来, 复旦大学出版社,2023年5月
《应用语言学综论》,冯志伟著,广东 教育出版社,1999年2月。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本书简介
本教材从“基础”“算法”和“应用”三个方面,较为系统地介绍计算语言学的基础理论、相关的自然语言处理技术和应用。
基础部分(包括一、二、三章)主要讲述计算语言学的数学和语言学基本概念,计算语言学和自然语言处理技术的关系,自然语言处理的基本流程等内容。
此外,作为计算语言学的重要分支之一,语料库语言学得到了较大发展,有关语料库语言学的基础概念、基本理论、近年来的一些发展概况在第三章中加以介绍。
介绍这部分内容的目的,是让读者在不涉及技术细节的情况下,对计算语言学有一个初步的,同时也是较为全面的理解和掌握。
算法部分(包括第四、五章)主要介绍计算语言学的常用技术和算法。
从处理对象来讲,主要包括词法层面的分析技术、句法层面的分析技术和语义层面的处理技术;从处理方法来讲,既有传统的规则方法,也有基于语料库的统计方法的介绍。
这部分内容的主旨是希望通过本章学习后,使学生能对计算语言学的领域中的一些主流技术(比如隐马尔可夫模型在词性标注中的应用,GLR算法
,部分分析技术等)有一个概要的认识,并能运用这些技术进行计算语言学相关的工作实践。
应用部分(包括第六、七章)主要讲授自然语言处理应用系统。
需要说明的是,基于语言信息处理技术的应用系统很多,本教材只是重点介绍一些常见的系统,介绍这些系统的工作机理、发展、取得的成绩,也客观介绍这些系统存在的问题和困难。
主要包括机器翻译系统,信息检索系统、信息提取系统,文本分类系统等。
目录
第一章 绪论:什么是计算语言学
第一节 计算语言学的研究对象
第二节 计算语言学的研究方法
第三节 计算语言学的实际应用
第四节 小结
第二章 语言知识的形式化表达
第一节 语言与语言知识
第二节 形式化表达手段
第三节 语法知识的形式化表述理论体系
第四节 语义知识的形式化表述理论体系
第五节 语篇知识的形式化表述理论体系
第六节 小结
第三章 语料库:语言知识的另一种表示形式
第一节 语料库研究概况
第二节 语料的收集与加工
第三节 语料库的应用
第四节 小结
第四章 词法分析
第一节 概述
第二节 “词”的识别
第三节 词性标注
第四节 词义标注
第五节 小结
第五章 句法分析
第一节 句法分析导引
第二节 广义LR分析算法
第三节 基于线图的分析技术
第四节 其他句法分析技术
第五节 小结
第六章 机器翻译
第一节 机器翻译概述
第二节 基于规则的机器翻译
第三节 基于语料库的机器翻译以及混合式机器翻译
第四节 机器翻译的困难、对策和评价
第五节 小结
第七章 面向文本的智能信息处理
第一节 信息检索
第二节 信息提取
第三节 文本自动分类
第四节 小结
术语表
后记
下载后 点击此处查看更多内容。