antconc使用分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

▪ 排序和词丛工具一样,可以选择N元的最大 或最小尺寸,显示N元的最小词频。
2021/3/7
CHENLI
13
▪ 生成N元模式的操作: ▪ 选择Clusters窗口模式下search term右边的
N-grams选项;
▪ 选择合适的排列选项;
▪ 按开始键,任何时候都可以中止;
2▪021点/3/7 击词汇束会产生一CH组ENL上I 下文关键词行。 14
2021/3/7
CHENLI
8
索引定位(concordance plot)
▪ 进行索引定位的步骤与索引工具的使用方法 一样,索引定位工具提供了索引行另一个不 同的视角。
▪ 每一个文件的所有索引条数都在一个条形码 上定位出来,表示文中有检索词的索引行的 位置所在。
▪ 可以查看哪些文件包含目标检索词,也可以 确定检索词在哪儿遇到词丛。
▪ 索引条数、文件长度在条形码右侧显示,
2021/3/7
CHENLI
9
文件查看
▪ 任何时候,目标文件都可以使用该工具来查 看原文。
▪ 选择一个要查看的文件; ▪ “File View”按钮,start,得到检索词在原文
中出现的情况; ▪ 使用Hit Location,可以跳到上一个或下一个
检索词上; ▪ 改变检索词,点击开始键,查看其它检索项
Antconc使用
2010.11.10
2021/3/7
CHENLI
1
免费软件
下载网址: http://www.antlab.sci.waseda.ac.jp/antconc_ind ex.html
下载版本: antconc3.2.1w
使用指南: http://www.antlab.sci.waseda.ac.jp/software/RE ADME_antconc3.2.1.txt
2021/3/7
CHENLI
10
词丛(Clusters)
▪ 用来生成目标文件检索词周围排列成序的词丛 列表的。
▪ 词丛既可以按照频率也可以按照词头或词尾排 序,也可以按照词丛第一个单词的出现概率排 序。
▪ 用户可以选择每个词丛的最大或最小长度,以 及列出词丛的最小频率。
2▪021可/3/7 以选择检索词是否CH总ENL出I 现词丛左边或右边。11
▪ 使用词丛的操作:
▪ 选定主窗口上的clusters按钮,选择合适的排 序选项;
▪ 按start键,任何时候都可以stop;
▪ 点击词丛会产生一组上下文关键词行或者索 引行。
2021/3/7
CHENLI
12
N元模式(部分词丛)
▪ 生成目标文件有序的N元组。
▪ N元模式是单词的N元,大的文件将会产生大 量的N元。
序排列。 ▪ 选择合适的排列选项; ▪ 按开始键,任何时候都可以中止; ▪ 点击单词会产生一组上下文关键词行。
2021/3/7
CHENLI
17
关键词单(Keyword List)
▪ 可以比较目标文件中的单词和“参照语料库”中 的单词生成Keyword List,Keyword List列出的 往往是目标文件中频率很高或频率很低的词。
2021按/3/7 sort键重新分类排C序HEN;LI
5
▪ 将指针移到其中一行索引行突出的检索词上, 指针变成手形工具,点击检索词,可以看到 检索词在原文出现的情况。
▪ 注意:索引行的总数在“concordance hits” 下显示,处理结束时,会“FINISHED”;如果 没有产生索引行,则“NO HITS”,并且索引 行的窗口不会更新。
搭配(collocates)工具
▪ 用来生成目标文件的一组有序的搭配列表。
▪ 搭配可以按词频,也可以按检索词左边或右 边的搭配频率,或者词头或词尾排序。也可 以按照检索词和搭配间的统计量来排列。
▪ 统计量的值测的是检索词和搭配之间的相关 程度。
▪ 可以选择检索词左右两边的单词跨度,显示 搭配的最小频率。
▪ 按Advanced键,可以进行更为复杂的搜索。
2021/3/7
CHENLI
7
▪ 两个高级搜索项: ▪ 定义一组检索词,可以一行一个的输入,也
可以直接载入文件中的检索词单,这个特征 允许用户使用一大组检索词,但不用每次重 复输入;
▪ 定义上下文词(context words)和一个上下 文的范围,在这个范围中必须出现检索词;
2021/3/7
CHENLI
6
▪ 检索词可以通过“search term”上面的word选项 设定为“词(默认)”或“词的片段”,也可以 通过case来选择不区分大小写,也可选择 “Regex”使用完整的正则表达式。
▪ /quickstart.html
2021/3/7
CHENLI
15
要列一个搭配列表,需要进行的操作:
选择合适的排列选项,及相关设置; 按开始键,任何时候都可以中止; 点击搭配会产生一组上下文关键词行。
2021/Hale Waihona Puke /7CHENLI16
词表(word list)
▪ 生成目标文件的有序的词表。 ▪ 词表既可以按词频也可以按词头或词尾的顺
▪ 为了列出Keyword list,需进行操作:
链接时间: 2008年4月13日
2021/3/7
CHENLI
2
▪ 英语词频 ▪ 日本人开发,支持中文。 ▪ 北大计算所98年1月份人民日报分词语料为例
▪ 计算词频,生成词频表; ▪ 计算n元组的出现频率; ▪ 保存结果
▪ 处理中文之间要做个语言设置,否则显示乱码
2021/3/7
CHENLI
3
Antconc包括以下工具: ▪ 索引 Concordance ▪ 索引定位 Concordance Plot ▪ 文件查看 File View ▪ 词丛 Clusters ▪ N元模式(部分词丛) N-grams ▪ 搭配 Collocates ▪ 词单 Wordlist ▪ 关键词单 Keyword List
2021/3/7
CHENLI
4
索引工具
使用步骤:
选择文件(一个或多个);
输入检索词;
使用“Search Window size”(检索窗口大小) 选择检索词两边显示的字符数;
按“start”开始产生索引行的检索结果,按 stop随时停止;
使用“Kwic Sort”(上下文关键词分类)选择 一个目标词赖重排索引行,0是检索词,1L、 2L是检索词左边第一、第二个单词;
相关文档
最新文档