AntConc..的使用说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
AntConc3.2.0的使用说明I
1. 提取语境共现
1.1设置检索项
(1)单项检索
a)点击file下拉菜单中的“ open files”,选择要打开的语料(如果想打开整个文件夹, 可以选择open directory))
b)在“ Search Tern” 一栏键入要检索的词项,如go;
c)在“ Search Win dow Sizd' —栏设置每一共现行出现的词数;
d)点击f ,开始检索
检索结果如图1.1所示:
(2)多项检索设置多项检索除了检索单个词项以外,AntConc还具有检索多个词项的功能,检索方法为在检索项间键入“ |”符号。
例:要检索动词go的各种时态形式,可在“ Search Term中输入go|went|gone|goes
设置语境词检索
为了限制语境共现的检索,可以设定一个语境词在检索项周边一定的语境范围内出现。
例:如要研究a…of这一类词组,可通过AntConc提取所有的词项,检索方法
如下:
a)在“ Search Tern” 一栏键入a;
b)点击“ Search Tern” 旁的,进入“ Advaneed Search 界面,
如图1.2 所示。
点击“ Use con text words and horizo nS,然后在“
Words”一栏键入of,点击“日I 。
如要重新设置语境词,可先点击清除原来语境词,后重复以上操作。
另外,还需设定语境词距离检索项的
I此说明书由华南师范大学外文学院2007研究生张杏娟编写,导师何安平订正和补充
其中限定范围的检索方法由香港城市大学 D.Lee博士提供,仅此致谢。
Con text
WW
a F—i *;" —9 亠・1
图1.1单项检索结果
«H UH
图 1.2 Adva need Search 界
面
位置,如本研究中,of在a的右二位置,所以“ Content Horizon”确定为
Coirtex H GI lzi>n
From To |2R^
c) 回到语境共现的界面后,点击aart H,开始检索。
结果可提取a lot of, a bit of等词块。
设置多字语检索
在研究中,如需检索多个词项,除了使用“丨”以外,也可使用以下方法,尤其适合检索项数目较多的情况。
例:研究感官动词watch, sound, feel, hear, smell
a) 在TXT文本中键入所有要检索的词项,可多达250个词。
然后为该文本起名保存。
需注意:键入的词项需以列的形式排列。
如:
feel
feels
felt
花"百,在保存以上新建的文本的盘符路径点击文本名,然后点击刖刈;
c)回到语境共现的界面后,点击Start,开始检索
(3)类别检索
使用通配符检索
附码检索
因研究需要,有些语料经过整理加工并附加上各种符号标记,称为“附码语料库” 如附有词性标注的LOBTAG 口附有错误类型标记的CLEC 等。
检索时只需键入某个标记符 号便可提取带附有该标码的所有词。
例:提取LOBTA 语料库中所有的名词,只需键入*_NN( NN 为名词标码,关于其他 词性的详细标记,请参阅何安平,2004,《语料库语言学与英语教学》一书的附录 113 页。
(4)在指定范围内检索
a) 在 concordanee 的检索界面上选择"Regex" (regular expression) ,键入 \[.*\] 为 检索项便可提取语料库中所有在起止符号“[”和“]”之间的所有文字内容,其他符号 照似类推。
b) 在 con corda nee 的检索界面上选择"Regex" (regular expressi on),键入 \[.*write.*\]
为检索项便可提取语料库中所有在起止符号 “[”和“]”之内的“write ”
的语境共现行,其他词项照似类推。
键入的检索项计较大小写,但是可以用通配符
*。
1.2分析检索结果 (1)观察频数、分布
频数即该检索项出现的次数,可在“ Con corda nee Hits” 一栏中获得
CoiicadiiKe Pl«
点击 ,查看检索项在语料文本中的分布状况。
(2)凸显周边语境词
为了具体某个教学等目的,可通过凸显检索项周边的某些词 汇。
方法是选择“ Kwic Sort ”,R1和L1分别代表检索项右方和 左方的第一个词,一次可设置三列凸现词,均按字母顺序排列。
检索结果如图1.3所示。
如想使凸显内容的颜色一致,可通过设
置Siobaiseitmgs 下拉菜单中的“ Color Sett in gs ”改变颜色
另外,若要凸显的部分不是一个词,而是单词中的字母,可选择 T col Referees 下拉
菜单中的“ Co ncorda nc6'选项中的“ Sort by characters in stead of words ,如图 1.4 所示。
Oth«r Options
Treat case In sort
I? Sori fcy
bf wprd?
Hide search term ri KWIC display
图1.4 Tool Prefere nces 下拉菜单界面
©Lei 『日 4V 1 / fflw
卜耐 I d mk|
护 I -in*
war*I lAhn I
>7 r-vwwi mc-ff Plw« E» .肝* 警 defF.!? 申!0i 嚅 Lfvt
H?1 ________ K>MC _______________________________________________________________________________________________________________________________
予■ ■
T HE K 'I M M -I I T ! I — C«« 用>C-0w a-i! I F WIC -V
|jj&D*
[ Ajy —a«^ | 彳 ay
■■n aiM > J] m :
# |_B«a| I ]〔Fl^ 担 Laud 工[zS~3 Jji~
—IHIIIIIII
图1.3凸显周边语境词检索结果
(3)提取搭配词表
C«llvcirt-e^
通过点击主界面中的 ,可获得检索项的搭配词表,同时可以设置搭配词
的位置、出现的最少次数与词表的排列方式。
例:观察look 右一的搭配词
Collocate
a ) 点击主界面中的 ;
b ) 在“ Search Tern ” 一栏键入 look ;
训■脚州碎卸厂誦祕
C )设置搭配词的位置,^口
••• I -T • …
d ) 点击"詛,开始检索,检索结果如图1.5所示。
e ) 点击“Sort by Freq”可根据不同的需要设定搭配词表的排列方式,如按频数排,按 拼写字母
排等等。
r^O7cl> 丄 J* ” phu
E.
Ld
ii
E5
脚1 CM #
Ta£« I 4 » *«riU¥ . I IM. ■细丄学 «1>J|V ■ 43.4. L ID
0 LHronirj. R?irl«:«
■ n*ll 上pd, st PUC h^r co ih^ Ua>»k» -M-Vft P
. Wfilhka
H-rlaB« H h^fe*W fe-8-
丄oa I v*irb3-n.-^
li mhtl-3 i ;-lexjxf Ui d
-co
KRA N« »
iM&dll «■■! AB" liWff
哲■&
*■ 5:t ••□a pJbhP ifiiCid. y*U£.1E,lbUr it ilwMI j £ U ■ rii-WtE *■ T* L« I
fr5i± 9v» »CEv«tatf .科■电 诀由■打
■
^ui. 4TXE .H U i U J * r ABMfai. ? Mangum ■: ar^ <UUI >KU ^ A E I Huy
L rr E ■冲
3 I
I W ^-V VN v L^fai h □和L f B .L ¥lm
Lw ^iiXaBL«ft*KE. »U . JV. ■■»V*ili j. ■!■ IE I. LUJL I.U .■ *.L j «j d. >4 AK. ICklH
ACME A »d. Ri*Jl 1-piX «<!.… HiM J Ct VX«J>
骨
□
& ■
H ■
____ MUM 'In
tr -r ■fa biMvi ESa. BB !:■ A. JB M N d ”
■ W .1* Ctt 4,Hi CJfA H#-|j||,
■ ! f 1
v >H.d f rML^ . 丄
v
■ 14
4 mWV «14歼 冷《*■ 1 ««■■ P*t#T4i VM4
J I .BT □□ yc»j tPiirata' ■JbT'Ji*: <L*u.^i 修皿1 f >Juc p V <■ 1,1
ima'^'-i r«iF I 『g
■粤 qvi* w E 』 ■h --rii-™
KLKau.^ upihAk x»4 lUid. ix IT .丄》*\1 1町ti 鼻卒鼻KW? A«. 匸■ILp 1'iau
shk'AA LA&4AI1
**川魁昭 1H- 4I*4M>H W4 fa ■■啊 « <4
. p^a-v F-v"p I ■■
aiMfchi q* raa.K it
>«*
Yf
口 h :i ・K
44 1 ■ jth "r±l 1
H #> a. 1
>&«iiH I OD I T
I 1-3-Ci L I 1-3-Dk n >
刊 h*
4 l*»k
a r cu., t l&wy l>v frvilL diti 比 口口宀 AH A i< A VIA i«bw4. IL
1< psAEir^ 1 £ B-J »x:■■■•曰山口空厂 1 iiifci d4fea-^Bw W A dA
B-*>|r ffriiiH ■
1 fo-td *r E 1A « a •叶*g viclr 2*
•Loot
lOiEi
rih • ■ :! « - J i - Ji*. di><y iZui iA.ind urind i»*«ca « *
■ rr < r s ■ P T ■匕寸 de ywj t tun^- it m v nvcavvaxirT
:ai=ka p*U'Ji . d M|. .a Q f E.IL*
|pih.K
J Vf
血1旳0
rfvr
• >li ・Ra I:« Mff ・EK EiJ y
.J ■.._ Hv AaiX. c JI -IHMI 4 aax x . ZWEB . :
QFV -丄县 ■** i
rWr.r>
i**_
I u - •』・ ^«UfedJ* E I. U&1 鼻■LAwML
K1V t ■ N.|i J t* i - frh-^Ta ifidlttV 0J K y»U ChJ.dK D-f 3 *' WK S ■LA ■ ■ ■ i .■<■
■■ jifa b ” ■ ■
・ ■■ 4■,
■ ■-ai ■■■丄 *r ■ ■ '!■ fawX w
f ol
via-^vja.z'vv
r a ■工
m»: 3 nr? t 0 七■h* »B4b.ac C ^J *
ftfeYT
tan %■• rr ■n.rl ■可
IW-4-BVK-. ■«.
'tatai
■ r •和丹出』 < .t^r
4 . b «- wr-jOTcti-
J.
■ riOTr-L-l - 云■,目■■血I. «■?> 口?<3-
^.rjiDTUAl -
■皿口 nf 盂-
■ h : UfH-iHl - >r ^OTdtsl -
■ ■ j Q ¥UB ! dr^QTTlb J.- SrtiOTHpl- "pCiTv 购 4■” »r JOTt-bl- 卄鼻5*、-
arJQ^-b-l
-
pf,nwM^:|. *
■ r$u 丁匸也丄- ■ r 耳- ■ r jcTUi 丄- ■
丄
■ B-;^E!7tea»丄-
dr>r>?r b>|
-
a ■ W YU HI L »rJiO7<-bl- a-rJDTi^l-
.U M :U
.CKC .&WE
i 爭 irG
.已 irE
cacc
•SKfe -
0nrt
‘■PH
bxt-
i .UEC
PWfiF FM na-
!*£E«h*
=
-41 <i ; .
]r.<y UK4 i f-a-c-di.
丄 f ^->4
e cm r-i*ir4
ar -
■- F-
»4i i<H •■百-亠 丄牙 軽旨丘
屮>
*^氐・("|弓 Efefal J 4
•■・" J t' •( a . th HiL'J I JV I V *L v JJM--t vrn -
K
p •
. a .- i r 」J> •IEW I ■■Li. et £■*■! hs I n Er i «^r T •*
果如图1.6所示,所有的ask 被列在词块的左边 (5)隐藏、分类和删除
“隐藏”是指把检索结果中的检索项挖空,可用于教学或测试。
具体操作方法如下:
a ) 在“ Search Tern ” 一栏键入要检索的词项,如 look ;
」t Tool Pteferences ”
十…"“
”
b ) 点击
,选择 Concordanee ,再选择 Hide search term in KWIC display ,
c )点开始检索。
(错了,应该是点
sort )
检索结果如下:
you always do your own homework? Do you ******* for help whe n you think it n ecessary? Do you help
T LV «IN W ui KU 匚』氏•一
Teri —■ I'liT
RLwk 梵1
j
i
T3
n T?
■r
it
li i.
1
n
3
■I
宙
叶
c H 3 £ i
1
■?
S'
3T
'I L*
0 & t
<4-Mi
9
1
3
It 1
J TL4
XX 3, If Jl
J
131
a,
丄屮 4 «Bi.
3, ■ ■■ J - it
J i I L L j.? Si
3. yj ■匚 li p
J iLM.Vrr
x> Lx
1 CuB4:«EUi3 丄h £V A
J b i •.栏 A EX. Lx
3. ■ ■■ xm
El
Lk
2
d
1
a :
■v
怙醫廿i - hr 时甌鼻.r
sWwtew
T ^#Ts
r>wn. |r-R 骂 To-
「启 倉
丄口匸时
二
AjLMfU.M
TfirEdttw^.
1
| Start | liflp
J UKI
Sori I I JV
Mu U OteMWB fl IHWIbt.
佥Ei 错f f
*
n a
^■r T w
z llllllllll
图1.5提取搭配词表检索结果
(4)提取搭配短语
Cllnst^r^ I
另外,也可以使用 ...... 这一工 具来提取搭配词块,且可设置检索项在 词块中的位置。
例:检索以ask 开头的搭配词块
a ) 点击主界面中的
b ) 在“ Search Tern ” 一栏键入 ask ;
c ) 设置检索项的位置,如选择“On the
left ”;
d ) 设置搭配词块的长度,如
Mi n.Size:3, Max.Size:3 ; e )点击 心“,开始检索,检索结
图1.6提取搭配短语检索结果
最后点击
E
見■■丄丽iL 壬癇匕1
■Apply
2. 提取词频表
2.1单字和N字语词频表
单字词频表是指目标语料库的单词表,且词频表的检索结果是以每个词的形式及其频数排列。
方法如下:
a)选择要生成单字词频的目标语料库;
Word Li&t
b)进入界面,设置词频表排列排序方式,如“ Sort by Freq”;也可以设置为按词头的或者词尾的拼写字母顺序排列。
c)点击s. ||,开始检索,检索结果如图2.1所示。
图2.1单字词频表检索结果
N字语词频表是指目标语料库的多字语频数表。
例如,检索句子“This is a pen”的2字语词频表结果为:“this is”、“is a”、“a pen”。
N字语词频表的提取方法如下:
a)选择要生成单字词频的目标语料库;
.x、卄x Clusteis | 匚上土P N-GreiTO
b)进入界面,后点击;
14伎m
hrri SEES |3~Mai 冲
C)设置N字语词频表的长度,如
d)选择词表的排序方式,如“ Sort by Freq”;
e)点击丄」I,开始检索,检索结果如图2.2所示
图2.2 N字语词频表检索结果
2.2词项重组---词簇化(lemmatizing )(词形还原表加载方法见梁茂成语料库应用教程
P48)
词簇化是将同一词性的某个词的所有曲折变化形式作削尾处理,并归为一个词簇来计算频数。
其好处是可以简约词频表并且引起对构词法的关注。
对词频表进行词簇化的方法如下:Word List
在界面生成词频表之后,拉下Tool Preferenee菜单,选择Lemma list options,点
击open和load,上传lemma1文档(可在本网站下载)点击Apply (如图2. 3所示)。
词簇化的部分结果见图2.4.
图2. 3设置词簇化界面
口昭 iS lot-silocitwfa^enee* Maw
图2.4词频表被词簇化后的结果(部分)。
图中1142例a 和133例an 被归为同一个词簇a 共1275例
3. 提取关键词表
关键词表是指两个语料库的词频表相比,其中一个明显地高频于另一个的那部分词 项表。
前一个称目标语料库;后一个称参照语语料库,通常规模要大一些,以此来凸现 目标语料库的一些特别高频词以浮现该语料库的主题或内容特色。
3.1凸显目标语料库中显著性高频于对照语料库的词项
具体操作方法如下:
a )点击file 下拉菜单中的“ open files ”,选择要对比的目标语料的语料(如果对比整个
文件夹,可以选择 open directory );
b) c) d) e) f) Keyw-ord List
点击主界面中的 点击
T ool Preferences
,选择 Keyword
List ”,
如图3.1所示;
选择“ Show negative keywords ”,可在检 索结果中显示对照语料明显高于目标语 料的词;
「 r Choose Fles 、「 「「 「戸“、一 丫 丫 … 点击 --------------- ,选择对照语料,取 后点击
图 3.1 Tool Preferences 对话
框 点击:「,开始检索,检索结果如图3.2所示。
Cantor An nt r | C^riGuratfMjrj P W «T rtfN?
OicMm-t C MUCMA * Wnril i M fCrjHnrora>i ta
a
|T
hiumri«r rtf WcM T yp 护 4闊f ■ Tctfll IN uiHw ©1
Trt H ». &34弓口
fiwik F ICQ
L J ^HW H A L«m4in w^E+ci F 口申翊
i. ■E J N .
i
字
fii
L Utt ■ 138
J.Z57
■nd. *
-r £
in
=
4£a If-QLli
S' Eac
i« S 炸有亡
h
10 44 &
■ehsA - 417
IB
■ I* 41 9 f-air
1_ 4JLE
19 411 f *
J -1
•xa
1.IC. ■匕
y-QLhfli
* 1
* 1 w
--lllllllllll
A*XC -I L
O W ATI
临1 "稠 i J .
fl UEJ0O
IiXEAl NuimfeW!-r 1 FH*&*
PV O4#»*4Ml
li ■呻■分O*riiHfii«
『7 !>■・ q| W* !■■ |ra«<!=^»
HW >L
■Sbv
匚h OrM# |7i -Jf
^rtt>vFi-«i I~「Fll
G fintCan: 1 Athr [Wintorc)
2006
Fite GlzhdEeh些T M r efeenjei
S LO J
C$rp«a
Rtes CdiKcidntf CciHCfiamIPIot File Vk«匚hKtei琴C O B K-JI M脑idLhl 1[粘*«d Ud
1 励咖[卿抽祖上5(S1 KwHdlMiKAItff&l 1153
freq扫IKES A.
朗百g.nE JTBWC
B37< E.2L5hicxtul
9W<L±L5
婕4 E.m L伽
射0454
1914G.UJ乩直说砧吐
城4s.m tn
尉34J.IB
舸411 E.2O5Zbeiz
關』IS 5.2O<h:ipE
is 5.DM Z^BHCQ
112M.3M c
11OS50XS33£
$£M.m
C.刃GT Crl3a
5WB叭L3C
;托血欧1
♦22O 4M
*18ES.SH Ohici
3B3.59S w
1C目El 7W rhrt
-1EL 299皿
b Q
Oh神
「TrMiHiHlfl囂加看ca驰
RdMW^rfqm
«z 国llllllllll
图3.2提取关键词表检索结果。