WordSmith软件界面下的《石油勘探英语》词汇检索
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
究 方 向翻 译 研 究 。
9 2
习语料库语言学之后 , 发现运用语料库的词频统计 知识 , 并借助 Wodri 软件词表( r i ) r nh S t Wods 中的词频统计和关 lt 键词搜索( eWod) K y rs功能可解决这套石油英语丛书词汇
表 的 问题 , 给英 语学 习者 带来 便利 。 从而
2 词 频 表 的选 择依 据
生 成 频 率 词表 时 , 词 的 主要 统 计 特 征 依 据 的 是 频 选
率、 覆盖率和分布率 。所谓频率是指某个 词在语料 中出
1 词 频 统计 与 Wod mi rS t h软件
词频统计 是语 料 库研 究 的一 个基 本 的统计 手 段 。 早期 的语料库研究基本上仅限于词频 的统计 。在 机读语
江 汉 石 油 职 工 大 学 学 报
21 0 1年 0 5月
J un l f i g a erl m Unvri f tf adWokr o ra o a h nP t e ies yo af n res Jn o u t S
第2 4卷
第 3 期
W o d mi rS t h软 件 界 面 下 的 油 勘 探 英 语 汇 检 索 石 词
换工具)V e r文本 浏览工具 ) 、i ( we 等六个程序 , 中前面 其 三个程 序是主要的文本检索工具 , 面三个程序 属于辅 后 助性工具 。这六个 程序 的各项设置 由一个 叫 Wod m t rS i h
T o nrl r文 字 匠工 具 控 制 器 ) ol C t l ( so oe 的程 序 来 控 制 。用
利。
[ 关键词] Wod mt rS i h软件 ; 词表检索 ; 关键词检 索 ; 词频统计 ; 油勘探 英语词汇 石 [ 中图分类号] H 5 [ 0 9 文献标识码] A [ 文章编号] 1O— 31 (O 1O一O 9一 O O9 0 x 2 1) 3 0 1 3
《 油 科技 英语 丛 书 》 石 原文 均选 自英语 国家 原 版 刊物 , 不 仅语 言 地 道 准 确 , 疑 难 语 法 现 象 及 语 言 点 均 配 以 注 对
I 稿 日期 l2 1 一 O — 2 收 01 2 3
[ 者 简介 ] 尚琼 ( 9 5 ) 女 .0 3年 毕 业 于 浙 江 大 学 英语 专 业 , 为 长 江 大 学 外 国语 学 院 外 国 语 言 学 与 应 用 语 言 学 专 . - 究 生 ・ 作 】7- , 20 现  ̄N 1 - k 主要 研
尚 琼
( 长江大学外 国语 学 院 , 湖北 荆 州 4 4 2 ) 3 0 3
[ 摘 要] 词 汇是石油专业英语学 习中的关键和难点, 油科技 英语丛书是适合石油翻译行 业的相关书籍 , 石 这套 书美
中不足之处就是 缺乏英语 学习词汇表 。针对这 一不足 , 用语料库 的词 频统计知识 , 运 并借助 Wod m t rS i h软件词表 中 ( rlt的词频统计和关键词搜 索( eWod) Wod s i) K y rs功能 , 解决这套石油英语丛书词 汇表 的 问题 , 以给英语 学习者带 来便
词 频 统计 需 要 的实 际 上 是 一 个 简 单 的 程 序 , 因此 如 今语 料 库 分 析 软 件 像 Wod m t 够 快 速 准 确 的 进 行 rS i h能 词频 统 计 。Wod m t ol 一 个 在 Wi o 下 运 行 rS i Tos是 h n w d 的用 来 观 测 文 字 在 文本 中 的 表 现 的 功 能 强 大 的综 合 软
Wodi 做词频统计后 , rlt s 一般可 以产生两个词频表 , 一个
以词的字母顺序排列 , 另一个 以词 频 由高到低排列 。但
词频表的词频统计并未完 全能反映一篇文章或一类文章 的关键词 , 主要是因受到词频表选择依据的制约。 这
习者的难度 , 同时会降低学习者的兴趣和信心 。笔者在学
料 库 ( ahn- r dbe op s问 世 之前 , 究 者 们 是 通 m ei e e al cru) a 研
现的频数 。覆盖率指的是从频率词表上按频率次序选取
的一定数量的单词 , 确定它们 在全部语料中所 占的百分
率。另一个重要 的概念是分布率 。有些词在不同专业学
科领域和不同语体 的文本 中出现 的频率都很高 ; 另一些 词则不然 , 只出现在某些语 篇或一定的专业学科领域 中: 例如( 下表 1四个频率相同的词在不 同语篇和专业领域 ) 中的出现频率就大不相 同。
件包 。它 共 包 含 C nod ( 境 共 现 检 索 工 具 ) o cr 语 、 Wod i ( r s 词频列 表检索 工具 )KeWod( 键词 检索 L t 、 y rs关
工 具 )S ltr文 本 分 割 工 具 ) Tx o vr r( 本 替 、pie( t 、etC net 文 e
表 1 频 数 相 同 的 四个 实例
过人工方法来计算词频的。用人工方法计算词频 自然费 时费力 , 且不够精确 , 但在 当时条件下这些研究者们不惜
花费 大 量 时 间 和 精 力从 事 机 械 繁 琐 的 词 频 统 计 , 见 词 足
频之 中。
释, 而且阅读理解练习设计科学、 合理 , 有利 于阅读理解能 力的快速提高 。丛书中的原文均配有准确流畅的译文 , 读 者可借此进一步提高阅读理解 的准确性 。《 石油科技英语 丛书》 可供石油 、 石化科技工作者学习 , 也可供大专 院校师 生等做 E P教材或参考书使用 。该丛书每一课或单元没 S 有词汇表 , 这给忙碌的石油工作人员和学 习专业英语 的人 带来很大不便。没有英汉对照的词汇表 , 这无疑增加 了学
9 2
习语料库语言学之后 , 发现运用语料库的词频统计 知识 , 并借助 Wodri 软件词表( r i ) r nh S t Wods 中的词频统计和关 lt 键词搜索( eWod) K y rs功能可解决这套石油英语丛书词汇
表 的 问题 , 给英 语学 习者 带来 便利 。 从而
2 词 频 表 的选 择依 据
生 成 频 率 词表 时 , 词 的 主要 统 计 特 征 依 据 的 是 频 选
率、 覆盖率和分布率 。所谓频率是指某个 词在语料 中出
1 词 频 统计 与 Wod mi rS t h软件
词频统计 是语 料 库研 究 的一 个基 本 的统计 手 段 。 早期 的语料库研究基本上仅限于词频 的统计 。在 机读语
江 汉 石 油 职 工 大 学 学 报
21 0 1年 0 5月
J un l f i g a erl m Unvri f tf adWokr o ra o a h nP t e ies yo af n res Jn o u t S
第2 4卷
第 3 期
W o d mi rS t h软 件 界 面 下 的 油 勘 探 英 语 汇 检 索 石 词
换工具)V e r文本 浏览工具 ) 、i ( we 等六个程序 , 中前面 其 三个程 序是主要的文本检索工具 , 面三个程序 属于辅 后 助性工具 。这六个 程序 的各项设置 由一个 叫 Wod m t rS i h
T o nrl r文 字 匠工 具 控 制 器 ) ol C t l ( so oe 的程 序 来 控 制 。用
利。
[ 关键词] Wod mt rS i h软件 ; 词表检索 ; 关键词检 索 ; 词频统计 ; 油勘探 英语词汇 石 [ 中图分类号] H 5 [ 0 9 文献标识码] A [ 文章编号] 1O— 31 (O 1O一O 9一 O O9 0 x 2 1) 3 0 1 3
《 油 科技 英语 丛 书 》 石 原文 均选 自英语 国家 原 版 刊物 , 不 仅语 言 地 道 准 确 , 疑 难 语 法 现 象 及 语 言 点 均 配 以 注 对
I 稿 日期 l2 1 一 O — 2 收 01 2 3
[ 者 简介 ] 尚琼 ( 9 5 ) 女 .0 3年 毕 业 于 浙 江 大 学 英语 专 业 , 为 长 江 大 学 外 国语 学 院 外 国 语 言 学 与 应 用 语 言 学 专 . - 究 生 ・ 作 】7- , 20 现  ̄N 1 - k 主要 研
尚 琼
( 长江大学外 国语 学 院 , 湖北 荆 州 4 4 2 ) 3 0 3
[ 摘 要] 词 汇是石油专业英语学 习中的关键和难点, 油科技 英语丛书是适合石油翻译行 业的相关书籍 , 石 这套 书美
中不足之处就是 缺乏英语 学习词汇表 。针对这 一不足 , 用语料库 的词 频统计知识 , 运 并借助 Wod m t rS i h软件词表 中 ( rlt的词频统计和关键词搜 索( eWod) Wod s i) K y rs功能 , 解决这套石油英语丛书词 汇表 的 问题 , 以给英语 学习者带 来便
词 频 统计 需 要 的实 际 上 是 一 个 简 单 的 程 序 , 因此 如 今语 料 库 分 析 软 件 像 Wod m t 够 快 速 准 确 的 进 行 rS i h能 词频 统 计 。Wod m t ol 一 个 在 Wi o 下 运 行 rS i Tos是 h n w d 的用 来 观 测 文 字 在 文本 中 的 表 现 的 功 能 强 大 的综 合 软
Wodi 做词频统计后 , rlt s 一般可 以产生两个词频表 , 一个
以词的字母顺序排列 , 另一个 以词 频 由高到低排列 。但
词频表的词频统计并未完 全能反映一篇文章或一类文章 的关键词 , 主要是因受到词频表选择依据的制约。 这
习者的难度 , 同时会降低学习者的兴趣和信心 。笔者在学
料 库 ( ahn- r dbe op s问 世 之前 , 究 者 们 是 通 m ei e e al cru) a 研
现的频数 。覆盖率指的是从频率词表上按频率次序选取
的一定数量的单词 , 确定它们 在全部语料中所 占的百分
率。另一个重要 的概念是分布率 。有些词在不同专业学
科领域和不同语体 的文本 中出现 的频率都很高 ; 另一些 词则不然 , 只出现在某些语 篇或一定的专业学科领域 中: 例如( 下表 1四个频率相同的词在不 同语篇和专业领域 ) 中的出现频率就大不相 同。
件包 。它 共 包 含 C nod ( 境 共 现 检 索 工 具 ) o cr 语 、 Wod i ( r s 词频列 表检索 工具 )KeWod( 键词 检索 L t 、 y rs关
工 具 )S ltr文 本 分 割 工 具 ) Tx o vr r( 本 替 、pie( t 、etC net 文 e
表 1 频 数 相 同 的 四个 实例
过人工方法来计算词频的。用人工方法计算词频 自然费 时费力 , 且不够精确 , 但在 当时条件下这些研究者们不惜
花费 大 量 时 间 和 精 力从 事 机 械 繁 琐 的 词 频 统 计 , 见 词 足
频之 中。
释, 而且阅读理解练习设计科学、 合理 , 有利 于阅读理解能 力的快速提高 。丛书中的原文均配有准确流畅的译文 , 读 者可借此进一步提高阅读理解 的准确性 。《 石油科技英语 丛书》 可供石油 、 石化科技工作者学习 , 也可供大专 院校师 生等做 E P教材或参考书使用 。该丛书每一课或单元没 S 有词汇表 , 这给忙碌的石油工作人员和学 习专业英语 的人 带来很大不便。没有英汉对照的词汇表 , 这无疑增加 了学