国家语委语料库PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
国家语委语料库
高级检索
查询表达式 书写 规则
郑艳群 2009-3-20
.
1
1.查询表达式 中 出现 的 特殊符号
/ :词类标志,用来 标识 词类;
( ) ! :不共现查询 的 标志符;
< <= = <> :距离限制符号,
分别 表示:小于 小于等于 等于 任意距离;
<
<=
= <>
+ :连接符;
.
源自文库
2
2. 查询表达式 的组成
.
5
2. 查询表达式 的组成
(4)简单表达式 : 由 共现项 和 不共现项 组成 a.共现项; b.(!共现项+距离限制项)共现项; c.共现项(距离限制项+!共现项); d.(!共现项+距离限制项)共现项(距离限制项+!共现项);
简单表达式 可以 表示 单一 共现项 或者 有 前后 不共现 关系 限制 的 单一 共现项;
系 和 距离关系; 复杂表达式 可 由 简单表达式 和 距离表达式 组成,形式 如下: a.简单表达式; b.简单表达式+距离限制项+简单表达式; c.简单表达式+距离限制项+简单表达式+距离限制项+简单表达式......;
.
9
举例: (!不+<>)知道/v
表示 查询 所有 动词 “知道” 的 出现 但是 “知道” 前 任意距离 内 不 出 现 “不”,且 “不” 可以 是 任何 词类; 科研+<>+机构/n 表示 查询 任意 词类 的 “科研” 和 名词 “机构” 共现 的 例句,两 词 之 间 距离 为 任意距离;
用户 需要 检索 出 所有 含有 动词 “吃” ,而且 前 后 各 3 个 词 之 内 不 出现 副 词 “不” 的 例句;
简单表达式 可以 表示 单一 共现项 或者 有 前. 后 不共现 关系 限制 的 单一 共现项8;
2. 查询表达式 的组成
(5)复杂表达式:复杂表达式 可以 表示 多 个 简单表达式 共现 的 先后关
/m+<10+楼
表示 查询 任意 词类 的 “楼” 之前 10 个 词 之 内 有 数词 出现 的 例句;
吃(<>+!了)+<=5+亏
表示 查询 任意 词类 的 “吃” 与 任意 词类 的 “亏” 共现 的 例句,且 两 词 之间 距离 小于等于 5 个 词,同时 “吃” 后 任意距离 内 不 出现 任意 词类 的 “了”;
(1)距离限制项 (2)共现项 (3)不共现项 (4)简单表达式:由 共现项 和 不共现项 组成。 (5)复杂表达式:由 简单表达式 和 距离表达式 组成。
.
3
2. 查询表达式 的组成
(1)距离限制项
一般 由 距离限制符号 后 跟 数字 组成,其中 任意距离 符号 “<>” 不 需要 后 跟 数字;距离限制项 中 的 数字 是 以 词 为 单位 的,如 词A 与 词B 的 距离 为 “<5”, 且 词A 在 词B 之前, 那么 词A 与 词B 距离 最 远 的 情况 为: 词B 是 词A 后 第5个 词。举例:<5 或 <=6 或 =7 或 <> ; 以 词 为 单位,举例:吃/v+<3+亏/n (结果:吃了亏,吃鞑子 的亏,等等)
.
6
2. 查询表达式 的组成
(4)简单表达式 : 由 共现项 和 不共现项 组成 a.共现项;吃/v b.(!共现项+距离限制项)共现项;(!不/d+<3)吃/v c.共现项(距离限制项+!共现项);吃/v(<3+!不/d) d.(!共现项+距离限制项)共现项(距离限制项+!共现项);
(!不/d+<3)吃/v(<3+!不/d)
.
4
2. 查询表达式 的组成
注意: ➢表达式 中 没有 空格; ➢表达式 结束 处 没有 回车; ➢表达式 中 所有 的 非 汉字 符号 都 是 英文 半角 符号; ➢请 不要 在 表达式 中 随意 插入空格 或者 换行符 或 使 用 全角 英文 符号 ;
注意: 共现词 之间 必须 有 距离限制项,至少 是 “<>”(表示 不 限制 距离),如果 不 写 距离限制项(如:“吃+亏”) 将 导致 表达式 书写 错误,无法查询。
吃+<10+(!大+<>)亏
表示 查询 任意 词类 的 “吃” 与 任意 词类 的 “亏” 共现 的 例句,且 两 词 之间 距离 小于 10 个 词,同时 “亏” 前 任意距离 内 不 出现 任意 词类 的 “大”;
就+<>+吃+<10+(!大+<>)亏
表示 查询 任意 词类 的 “就” 与 任意 词类 的 “吃” 及 任意 词类 的 “亏” 共现 的 例句,且 “就” “吃” 两 词 之. 间 距离 为 任意距离,“吃” “10亏”
(2)共现项
共现项 可以 为 三 种 形式,即: a.单独 的 词;举例:吃 b.词 和 词类,中间 用 “/” 隔开;举例:吃/v c.单独 的 词类,用 “/” 开头;举例:/v
(3)不共现项
不共现项 由 不共现查询 标志符 “() !” 和 连接符 “+” 共同 构成,有 两 种 形式: a.(!共现项+距离限制项) ;举例: (!不+<3)或(!不/d+<3) 或 (!/d+<3) b.(距离限制项+!共现项) ;举例:(<3+!不/d)
简单表达式 可以 表示 单一 共现项 或者 有 前后 不共现 关系
限制 的 单一 共现项;
.
7
2. 查询表达式 的组成
(4)简单表达式 : 由 共现项 和 不共现项 组成
a.共现项;吃/v
动词 词类 的 “吃” 要 在 检索 出 的 例句 中 出现。
b.(!共现项+距离限制项)共现项;(!不/d+<3)吃/v
动词 词类 的 “吃” 要 在 检索 出 的 例句 中 出现 , 同时 “吃” 前 3 个 词 之 内 有 副词 词类 的 “不” 的 例句 不 包括 在 检索 出 的 例句 中。
c.共现项(距离限制项+!共现项);吃/v(<3+!不/d)
d.(!共现项+距离限制项)共现项(距离限制项+!共现项); (!不/d+<3)吃/v(<3+!不/d)
高级检索
查询表达式 书写 规则
郑艳群 2009-3-20
.
1
1.查询表达式 中 出现 的 特殊符号
/ :词类标志,用来 标识 词类;
( ) ! :不共现查询 的 标志符;
< <= = <> :距离限制符号,
分别 表示:小于 小于等于 等于 任意距离;
<
<=
= <>
+ :连接符;
.
源自文库
2
2. 查询表达式 的组成
.
5
2. 查询表达式 的组成
(4)简单表达式 : 由 共现项 和 不共现项 组成 a.共现项; b.(!共现项+距离限制项)共现项; c.共现项(距离限制项+!共现项); d.(!共现项+距离限制项)共现项(距离限制项+!共现项);
简单表达式 可以 表示 单一 共现项 或者 有 前后 不共现 关系 限制 的 单一 共现项;
系 和 距离关系; 复杂表达式 可 由 简单表达式 和 距离表达式 组成,形式 如下: a.简单表达式; b.简单表达式+距离限制项+简单表达式; c.简单表达式+距离限制项+简单表达式+距离限制项+简单表达式......;
.
9
举例: (!不+<>)知道/v
表示 查询 所有 动词 “知道” 的 出现 但是 “知道” 前 任意距离 内 不 出 现 “不”,且 “不” 可以 是 任何 词类; 科研+<>+机构/n 表示 查询 任意 词类 的 “科研” 和 名词 “机构” 共现 的 例句,两 词 之 间 距离 为 任意距离;
用户 需要 检索 出 所有 含有 动词 “吃” ,而且 前 后 各 3 个 词 之 内 不 出现 副 词 “不” 的 例句;
简单表达式 可以 表示 单一 共现项 或者 有 前. 后 不共现 关系 限制 的 单一 共现项8;
2. 查询表达式 的组成
(5)复杂表达式:复杂表达式 可以 表示 多 个 简单表达式 共现 的 先后关
/m+<10+楼
表示 查询 任意 词类 的 “楼” 之前 10 个 词 之 内 有 数词 出现 的 例句;
吃(<>+!了)+<=5+亏
表示 查询 任意 词类 的 “吃” 与 任意 词类 的 “亏” 共现 的 例句,且 两 词 之间 距离 小于等于 5 个 词,同时 “吃” 后 任意距离 内 不 出现 任意 词类 的 “了”;
(1)距离限制项 (2)共现项 (3)不共现项 (4)简单表达式:由 共现项 和 不共现项 组成。 (5)复杂表达式:由 简单表达式 和 距离表达式 组成。
.
3
2. 查询表达式 的组成
(1)距离限制项
一般 由 距离限制符号 后 跟 数字 组成,其中 任意距离 符号 “<>” 不 需要 后 跟 数字;距离限制项 中 的 数字 是 以 词 为 单位 的,如 词A 与 词B 的 距离 为 “<5”, 且 词A 在 词B 之前, 那么 词A 与 词B 距离 最 远 的 情况 为: 词B 是 词A 后 第5个 词。举例:<5 或 <=6 或 =7 或 <> ; 以 词 为 单位,举例:吃/v+<3+亏/n (结果:吃了亏,吃鞑子 的亏,等等)
.
6
2. 查询表达式 的组成
(4)简单表达式 : 由 共现项 和 不共现项 组成 a.共现项;吃/v b.(!共现项+距离限制项)共现项;(!不/d+<3)吃/v c.共现项(距离限制项+!共现项);吃/v(<3+!不/d) d.(!共现项+距离限制项)共现项(距离限制项+!共现项);
(!不/d+<3)吃/v(<3+!不/d)
.
4
2. 查询表达式 的组成
注意: ➢表达式 中 没有 空格; ➢表达式 结束 处 没有 回车; ➢表达式 中 所有 的 非 汉字 符号 都 是 英文 半角 符号; ➢请 不要 在 表达式 中 随意 插入空格 或者 换行符 或 使 用 全角 英文 符号 ;
注意: 共现词 之间 必须 有 距离限制项,至少 是 “<>”(表示 不 限制 距离),如果 不 写 距离限制项(如:“吃+亏”) 将 导致 表达式 书写 错误,无法查询。
吃+<10+(!大+<>)亏
表示 查询 任意 词类 的 “吃” 与 任意 词类 的 “亏” 共现 的 例句,且 两 词 之间 距离 小于 10 个 词,同时 “亏” 前 任意距离 内 不 出现 任意 词类 的 “大”;
就+<>+吃+<10+(!大+<>)亏
表示 查询 任意 词类 的 “就” 与 任意 词类 的 “吃” 及 任意 词类 的 “亏” 共现 的 例句,且 “就” “吃” 两 词 之. 间 距离 为 任意距离,“吃” “10亏”
(2)共现项
共现项 可以 为 三 种 形式,即: a.单独 的 词;举例:吃 b.词 和 词类,中间 用 “/” 隔开;举例:吃/v c.单独 的 词类,用 “/” 开头;举例:/v
(3)不共现项
不共现项 由 不共现查询 标志符 “() !” 和 连接符 “+” 共同 构成,有 两 种 形式: a.(!共现项+距离限制项) ;举例: (!不+<3)或(!不/d+<3) 或 (!/d+<3) b.(距离限制项+!共现项) ;举例:(<3+!不/d)
简单表达式 可以 表示 单一 共现项 或者 有 前后 不共现 关系
限制 的 单一 共现项;
.
7
2. 查询表达式 的组成
(4)简单表达式 : 由 共现项 和 不共现项 组成
a.共现项;吃/v
动词 词类 的 “吃” 要 在 检索 出 的 例句 中 出现。
b.(!共现项+距离限制项)共现项;(!不/d+<3)吃/v
动词 词类 的 “吃” 要 在 检索 出 的 例句 中 出现 , 同时 “吃” 前 3 个 词 之 内 有 副词 词类 的 “不” 的 例句 不 包括 在 检索 出 的 例句 中。
c.共现项(距离限制项+!共现项);吃/v(<3+!不/d)
d.(!共现项+距离限制项)共现项(距离限制项+!共现项); (!不/d+<3)吃/v(<3+!不/d)