多层次概定义与复杂关系表达-繁体字知网的新增架构

合集下载

大学信息检索题库

大学信息检索题库

大学信息检索题库第一单元测试一单项选择题1.以下能力中不是信息能力的是()[参考答案] 自控、独立和适应2.广义的信息检索包含两个过程()[参考答案] 存储与检索3.为读者解答有关具体事件、人物的检索属于( )。

[参考答案] 事实检索4.有关的信息、知识、情报,以下看法正确的是()。

[参考答案] 信息>知识>情报5.事实检索包含检索课题的( )等内容[参考答案] 背景知识、事件过程、人物机构6.()决定着人们捕捉、判断和利用信息的自觉程度。

[参考答案] 信息意识7.()是指人们有效获取信息、加工处理信息以及创造新信息的能力。

答案:信息能力8.文献只有经过(),才能进入检索系统供用户使用。

[参考答案] 标引9.利用文献后面所附的参考文献进行检索的方法称为( )[参考答案] 追溯法10.区别于一般期刊论文或者教科书,参考工具书的突出特点是( ) [参考答案] 知识高度浓缩11.在特定的时间内为了特定的目的而传递的有使用价值的信息可称之为()情报12.查找()属于文献检索问题,查找()属于事实检索问题,查找()属于数据检索问题[参考答案] 某课题相关的参考文献,某事件的来龙去脉,某统计数据13.你需要查找关于“数学和科学成绩中存在的性别差异”的期刊论文来写文章,下面哪一选项是开始检索的最有效方法?()[参考答案] 使用一个研究性数据库14.()在创新创业型人才能力体系中,是一项核心基础能力,它能促进人的终身学习能力、问题解决能力和知识创新能力的形成。

[参考答案] 信息素养15.人类从改造世界的实践中所获得的认识和经验总结可称为()[参考答案] 知识16.狭义的信息检索是指()。

[参考答案] 信息查找17.根据国家相关标准,文献的定义是指“记录有( )的一切载体”。

[参考答案] 知识18.关于终身学习,下列说法不正确的是()。

[参考答案] 终身学习仅仅指毕业之后的学习。

19.文献是记录有知识的()[参考答案] 载体20.为了避免在现实生活中上当受骗,()至关重要。

华南师范大学自考本科毕业论文格式及要求费下载[修改版]

华南师范大学自考本科毕业论文格式及要求费下载[修改版]

第一篇:华南师范大学自考本科毕业论文格式及要求费下载华南师范大学自考本科毕业论文格式及要求1、封面及论文题目使用学校统一格式。

论文题目宜小不宜大,题目要对论文的内容有高度的概括性,简明、易读。

2、目录列出论文正文的一、二级标题名称及对应页码,附录、参考文献、后记等的对应页码。

3、摘要、关键词摘要应简要说明毕业论文(设计)所研究的内容、目的、实验方法、主要成果和特色,摘要的词汇和语法必须准确,一般为150-300字。

关键词:关键词是从论文标题、内容摘要或正文中提取的、能表现论文主题的、具有实质意义的词语,一般为3-6个。

4、正文正文是论文的主体部分,通常由引论(引言)、本论、结论三部分组成。

这三部分在行文上可以不明确标示。

正文的各个章节或部分应以若干层级标题来标识。

引论(引言):简要说明本项研究课题的提出及研究意义,本项研究的前人研究基础,及其深入研究方向、技术手段。

正文要符合一般学术论文的写作规范,毕业论文字数不得少于3000字。

论文应文字流畅,语言准确,层次清晰,论点清楚,论据准确,论证完整、严密,有独立的观点和见解。

论文内容要理论联系实际,涉及到他人的观点、统计数据或计算公式的要有出处(引注),涉及到计算内容的数据要求准确。

数字标题从大到小的顺序写法应为:一、(一)1、(1)①......。

(可根据具体学科要求而定)5、参考文献参考文献是作者在写作过程中使用过的文章、著作名录。

参考文献要写明作者、书名(或文章题目及报刊名)、版次(初版不注版次)、出版地:出版者,出版年:页码。

序号使用[1],[2],[3]......。

中译本前要加国别。

示例:[序码]作者。

书名,版次,出版地:出版者,出版年:起迄页。

[1]张晓风。

中国经济状况,北京:经济出版社,1983:273-275。

6、论文的结构与行文(1)结构:提出问题--分析问题--解决问题(结论)三段式的逻辑结构为论文的基本构成原则。

(2)论点:是作者对题纲研究后产生的见解、主张和思想。

219401631_国际中文教育“三大体系”构建:内涵意蕴、现实境遇与实践逻辑

219401631_国际中文教育“三大体系”构建:内涵意蕴、现实境遇与实践逻辑

2023年第2期No.22023华文教学与研究TCSOL Studies总第90期Sum No.90[收稿日期]2023-03-20[作者简介]李宝贵,男,辽宁师范大学国际教育学院/文学院教授、博导,研究方向为国际中文教育、中文国际传播、语言规划与政策等。

电子邮箱:********************。

魏禹擎,女,辽宁师范大学国际教育学院硕士研究生,研究方向为国际中文教育。

电子邮箱:*********************。

李慧,女,辽宁师范大学文学院博士研究生,研究方向为国际中文教育。

电子邮箱:*******************。

[基金项目]国家社科基金一般项目“新时代配合支持更多国家将中文纳入国民教育体系的理论建构与实现路径研究”(22BYY154);教育部语合中心国际中文教育研究课题重大课题“新时代国际中文传播体系研究”(21YH03A );国家语委重点项目“中华语言文化国际传播的挑战与对策研究”(ZDI145-37);国务院侨办华文教育研究重点课题“新时代华文教育助力中华文化海外传播路径研究”(22GQB007)国际中文教育“三大体系”构建:内涵意蕴、现实境遇与实践逻辑李宝贵1.2,魏禹擎1,李慧2(1.辽宁师范大学国际教育学院,辽宁,大连116029;2.辽宁师范大学文学院,辽宁,大连116081)[关键词]国际中文教育;学科体系;学术体系;话语体系;内涵意蕴;现实境遇;实践逻辑[摘要]为扎实推动国际中文教育高质量发展,有必要加快构建具有中国特色的国际中文教育学科体系、学术体系和话语体系。

通过分析国际中文教育学科体系、学术体系、话语体系的内涵意蕴以及现实境遇,为新时代新征程加快推进国际中文教育“三大体系”建设提供优化路径:国际中文教育要通过树立融通贯通的大学科观念、设置合理完备的专业领域来夯实学科体系建设的厚度;通过不断扩大学术体系论域、加大学术主体国际参与来抓牢学术体系建设的广度;通过建设具有学科特色的话语平台、加强话语内容的创新、不断推进话语媒介的推陈出新来丰富话语体系建设的新颖度,促进更加开放、包容、规范的现代国际中文教育体系构建。

术数名实释正

术数名实释正

原始巫体系分化为巫、史、卜、祝等门类ꎬ专职
现ꎮ 巫术时代以鬼神信仰为特征ꎬ数术
的巫术范围缩小ꎬ在这种社会大背景下ꎬ巫术
时代以对数的信仰为特征ꎬ这是数术与巫术
和数术分道扬镳ꎮ 严格地讲ꎬ是术数从巫术
的根本差别之所在ꎮ
中分化出来ꎬ不仅建立了阴阳、五行、八卦等
规模宏大的占卜理论ꎬ 而且具有了星占、 式
关键词:术数ꎻ巫术ꎻ数术ꎻ方术ꎻ象数易学
中图分类号:B992 文献标志码:A 文章编号:1007-4937(2022)02-0090-07
术数作为一种文化现象ꎬ广泛而深刻地影响
么都是术数的时候ꎬ也即术数什么都不是了ꎮ
着中国古代社会的方方面面ꎮ 何为术数? 概而言
明确术数的外延和内涵ꎬ对于我们了解中国
91
辞卜居» 有云:“ 夫尺有所短ꎬ寸有所长ꎬ物有所
不足ꎬ智有所不明ꎬ数有所不逮ꎬ神有所不通ꎮ 用
君之心ꎬ行君之意ꎬ龟策诚不能知事ꎮ”
[17]
« 墨子节用上» 有云:“ 圣人为政ꎬ特无此ꎬ此不
圣人为政、其所以众人之道亦数术而起与? 故子
对此ꎬ
墨子曰:‘ 去无用之务ꎬ行圣王之道ꎬ天下之大利
一是( 诚如何丽野先生所言:“ 我们很难找到一个
占中的术语ꎮ 北京大学校注« 论衡» ꎬ把“ 飞
定义 能 完 全 概 括 所 有 术 数 活 动ꎬ 总 是 有 例
外” )
[2]
ꎮ 如王玉德先生称:
尸流凶” 解为“ 会飞的尸体ꎬ行走的凶怪” ꎬ而
不知“ 飞尸” 是丛辰之名ꎮ 上海辞书出版社
普遍认为术数大致可以分为三大部分:
( 湖南师范大学 历史文化学院ꎬ长沙 410081)
摘 要:术数体系繁复驳杂ꎬ关于其名实界定问题ꎬ学界众说纷纭ꎬ莫衷一是ꎮ 尤其是在术数与巫术、数

中国知网案例分析

中国知网案例分析
?高起点的发展理念和产品定位?市场化的商业运作?强强联合增加企业竞争力?标准化网络化数据加工体系?国际化的版权保护策略中国知网的经营模式?cnki利用数字技术与信息处理技术构建了一个包含学术期刊文献生产传播增值利用评价以及资源战略保存和未来增值开发利用的全过程的系统平台体现了信息资源整合传播增值利用和知识服务的理念功能结构合理多项技术高度集成系统运行性能稳定操作使用方便
核心资源
《中国知识资源总库》收录的数据库包括:中国期刊全 文数据库、中国优秀博硕士学位论文数据库、中国重要 会议论文数据库、中国重要报纸数据库、中国年鉴数据 库、中国图书数据库、引证报告数据库、期刊信息数据 库等数据库。《总库》中数据库的种类不断增加,数据 库中的内容每日更新,每日新增数据上万条。根据规划, 三年内,《总库》将囊括我国80%的知识资源
中国知网的基本情况与功能结构
基本情况
中国知网由清华同方知网(北京)技术有限公司(简称 TTKN)以其自主开发的网格资源共享技术与非线性知识 传播技术创建了著名的网络出版网站。TTKN属于清华同 方知网技术产业集团(简称TTKN Group),该集团除了 TTKN外,还包括中国学术期刊(光盘版)电子杂志社 (简称CAJPH)与清华同方光盘股份有限公司(简称 TTOD),目前拥有员工1400多人。主要从事知识文化信 息资源的互联网出版与相关技术服务,是中国互联网出 版与信息服务业的领头羊
中国知网的技术模式
CNKI平台 CNKI平台
用户
资源门户 C N K I 网 格 资 源 共 享 平 台
分布异构跨库统一 统一导航系统 检索系统
文献调度系统
知网节系统 构跨库检索系统:消除分布式异构数据库使用方式差异, 实现跨库统一检索; 统一导航系统:整合资源,建立中外文期刊统一导航; 知网节系统:消除信息孤岛,实现资源深度整合,构筑具有馆 藏特色的知识网络; 引文度系统:整合馆藏电子资源及纸本资源,实现资源快速 定位,获取文献合适拷贝; 门户建设系统:集成专业化知识服务,定制个性化资源门户。

多层次、多维度复合索引 在知识发现中的应用

多层次、多维度复合索引 在知识发现中的应用

RDF
Native XML DBMS(NXD)
提供全面的基于XML的数据表示与管理技术。XML可 以描述任意复杂对象。 文献全文内容可以表示到篇、章、节、段落、公式、 图片、表格。从全文表示提升到内容片段表示。 在单一XML数据库中可以支持多种数字对象的复杂 表示。
大数据的研究
作者
关键词
• • • • •
行业 部门 级别,中央,地方 条目类型 统计指标
CNKI索引体系的深度应用之一:知识网络
• 基本索引的应用 • 基本功能:检索、导航…… • 通过组合,形成高级的索引:树索引,图索引 • 典型应用:知节是知识网络中知识信息交汇节点的简称。任何事物均可成为 知网节的主体,也就是说,知网节的主体可以是一本书,一篇文章,也 可以是一个作者,一个单位,一个概念。 • 按照知识本来的内在联系和人们获取知识的本质需求,将庞杂无序 的知识资源整合为有效、有序的标准化内容产品进行传播 • 在每一个知网节上,可以汇集多类信息:如关于主体的基本信息;与 主体直接关联的信息;与主体间接关联的信息。以这些信息为源点, 在一定规则的支配下,通过概念相关、事实相关等技术方法揭示知 识之间的各种关系,通过智能链接技术与主体外的其他信息知识产 生直接或间接的多种关联,实现知识扩展,以利于知识的学习、交流、 共享、发现、获取、创新。
基本信息 作者关注领域 获得支持的基金 作者文献 曾参考的文献 作者的导师 合作作者 指导的学生
发表在: 期刊 报纸 会议 博硕士 上的文献
关键词
基本信息 基金文献 高成果领域 高产出作者 高产出机构
机构
基本信息 机构作者 主办刊物 重点学科 机构文献 上下级机构
基金
学科
……
主要知网节节点

第七章 知识图谱

第七章 知识图谱
词汇知识主包括实体与词汇
之间的关系(实体的命名、称谓、英文 名等)以及词汇之间的关系(同义关系、 反义关系、缩略词关系、上下位词关系 等)。例如,(“Plato”,中文名,柏 拉图)、(赵匡胤,庙号,宋太祖)、 (妻子,同义,老婆)。
(4)常识知识
常识是人类通过身体与世界交互而积累
的经验与知识,是人们在交流时无须言明就 能理解的知识。例如,我们都知道鸟有翅膀、 鸟能飞等;又如,如果X 是一个人,则X要么 是男人要么是女人。常识知识的获取是构建 知识图谱时的一大难点。
知识表示学习主要是面向知识图谱中的
实体和关系进行表示学习,使用建模方法将 实体和向量表示在低维稠密向量空间中,然 后进行计算和推理。
知识是人类在认识和改造客观世界的过程 中总结出的客观事实、概念、定理和公理的 集合。知识具有不同的分类方式,例如,按 照知识的作用范围可分为常识性知识与领域 性知识。知识表示是将现实世界中存在的知 识转换成计算机可识别和处理的内容,是一 种描述知识的数据结构,用于对知识的描述 或约定。
实体抽取的方法主要有基于规则与词典的方法、 基于机器学习的方法以及面向开放域的抽取方法。
关系抽取
关系抽取的目标是抽取语料中命名实体的语义关 系。实体抽取技术会在原始的语料上标记一些命名 实体。为了形成知识结构,还需要从中抽取命名实 体间的关联信息,从而利用这些信息将离散的命名 实体连接起来,这就是关系抽取技术。
象看本质,准确地捕捉到用户的真实意图,并依此来进行搜索,从而更准确地向用户返回 最符合其需求的搜索结果。 (8)知识库问答系统在回答用户问题时,需要正确理解用户所提出的自然语言问题,抽取其 中的关键语义信息,然后在已有单个或多个知识库中通过检索、推理等手段获取答案并返 回给用户。

WordNet简介

WordNet简介
WordNet 介绍
WordNet的词汇组织结构
WordNet
是一部在线词典数据库系统,采用了与传统词
典不同的方式,即按照词义而不是词形来组织 词汇信息。
1985年由普林斯顿大学认知科学实验室建立
WordNet 将成为一种国际标准,许多国家在
筹划和建立与英文WorNet兼容的本国语言
3.52
2.76 2.41
B.7
WordNet的词汇组织结构
词汇的矩阵模型
Word Meanings M1 M2 M3 . . . F1 F2 E2,2 E3,3 . . . Word Forms F3 …… Fn E1,1 E1,2
Mm
Em,n
B.8
WordNet的词汇组织结构
WorNet 中词语间的关系
B.3
WordNet的词汇组织结构
同义词集(Synsets)
Example:
地球绕着太阳转, 自然会有寒来暑往的四季交替
自然奥秘
{自然、必然、一定、必定} {自然、天然}
B.4
WordNet的词汇组织结构
词汇(Words) 、同义词集、语义(Senses)的数量
POS Unique Strings Synsets Total Word-Sense Pairs Noun 109195 75804 134716
B.18
WorNet 中词语间的关系
动词蕴涵关系(entailment) 、动词的上位关系
(hypernymmy) 、方式关系(troponymy)、因果关系 (cause relation)
• 动词之间的组织关系成为动词的蕴涵 例如: 打鼾逻辑上蕴涵睡觉,因为句子“他正在打鼾”蕴涵了句子 “他正在睡觉”;如果第一个句子成立,则第二个句子必定成 立。 • 蕴涵是一种单向关系 • 方式关系是一种特殊的蕴涵。 例如: 一个较一般化的动词V2,它的每一个方式词V1也蕴涵V2 V1是V2的一种方式。

文献检索题库

文献检索题库
16、检索策略(erterieval strategy),是指为实现检索目标而制定的全盘计划或方案,是对整个检索过程的谋划与指导。

17、关于检索,如按检索对象不同,可分为以下三种
数据事实文献检索
18、在布尔检索法中,“A AND B”表示能查找出
同时含有这两个词的文献
19、下列哪种文献属于白色文献
图书
20、文献的构成要素
信息内容载体材料信息符号
1、下来关于检索目的的说法正确的是
学习前人的优秀方法,提高工作效率避免重复研究、建设
了解前人的工作,以便继承发展
2、下列哪种文献属于二次文献
3、以刊载新闻和评论为主的文献是
报纸
4、文献中,ISSN是指
国际连续出版物号
5、DOI是指
数字对象唯一标识符
6、在下列哪种建设工具中可以得到历年的统计数据
2.索含有“data bank”的P擎搜索powerpoint文档,下面搜索语法正确的是检索词fileype:doc列数据库中可以检索电子图书的是超星书生之家APABI
13、关于方正APABI数字资源平台,正确的说法有提供全文检索可以下载全文按照中图法分类
14、超星图书馆支持下列哪检索途径作者书名
15、EBSCO系列数据库中的academic search complete字库提供的检索途径包括Title Author Journal Na个搜索引擎中,都检索式(网络技术fi示逻辑费操作正确
55.我国专利法规定的发明专利权限为自申请之日起20年正确
1、输入comput*可以检索到包含下列字段的文献
computingcomputationcomputer
2、专利文献中常见的几种日有
申请日公开日公告日优先权日

知识网络的结构与演化 概念与理论进展

知识网络的结构与演化  概念与理论进展

谢谢观看
一、知识网络的基本概念
知识网络是一个由知识节点和知识边构成的拓扑结构,其中知识节点表示各种 知识实体,知识边表示这些知识实体之间的关联关系。在知识网络中,知识节 点可以是概念、实体、事件等,知识边可以是语义关系、分类关系、关联关系 等。
知识图谱是一种以图形化方式表示知识网络的方法,它将知识节点和知识边以 图形化的方式展现出来,使得人们可以直观地理解和分析知识网络的结构和关 系。
二、R软件的开发者合作结构
R软件的开发者合作结构非常开放和活跃。R软件的源代码完全公开,任何用户 都可以查看、修改和分享源代码。开发者可以通过提交新的功能或者修复bug 来贡献自己的力量。
开发者社区由全球范围内的志愿者组成,他们来自不同的领域和专业背景。开 发者可以通过邮件列表、论坛和社交媒体等方式进行交流和合作。此外,R软 件还拥有一个官方的开发者工具包(R-devel),这个工具包为开发者提供了 最新的源代码和文档,方便他们进行开发和测试。
然而,目前知识网络的研究还存在一些不足之处,例如如何更有效地表示和存 储复杂的知识网络、如何解决知识网络的语义异构和概念漂移等问题。未来, 随着和大数据技术的不断发展,我们可以通过研究更加高效和智能的知识网络 表示方法、构建更加全面和准确的知识库以及开发更加智能和便捷的知识网络 应用系统等手段,进一步推动知识网络的普及和应用。
未来,随着机器学习和的发展,R软件可能会进一步扩展其知识结构,包括更 多的算法和工具。随着云计算和大数据技术的发展,R软件的开发者合作结构 也可能会发生变化,包括更多的跨学科合作和更广泛的应用场景。
总结:R软件的知识结构和开发者合作结构是相互促进、共同演化的。一方面, R软件的知识结构不断发展和完善,以满足用户不断增长的需求;另一方面,R 软件的开发者合作结构也日益活跃和开放,以吸引更多的贡献者和用户。这种 良性的循环使得R软件得以在激烈的竞争中保持领先地位,同时也为数据分析 领域的发展做出了重要贡献。

中国风在博物馆非遗文化传播中的交互应用

中国风在博物馆非遗文化传播中的交互应用

86 黑龙江画报 2021·非遗传承·当前阶段,随着互联网信息技术的高效研究与应用,交互模式的应用类型和范围越来越广,我国在非物质文化遗产的保护、宣传等工作方面也逐渐加大了重视力度,中国风能够在很大程度上促使非遗文化得到更为全面的传播效果,基于此,本文结合中国风与交互应用之间的联系进行分析,并对中国风在非遗文化传播过程中的具体应用展开深入探讨和研究,供相关从业者参考。

在艺术设计方面,西方许多国家都有着不同程度的突破和进展,中国也踏上了艺术设计及文化传播的新道路,但在这个过程中,由于我国在该方面的发展经验稍显匮乏,在艺术设计方面非常容易出现缺失中国元素的设计内容,导致整体效果并不符合我国民族特色艺术的传播。

在这种情况下,中国风元素应运而生,其中包括挖掘于中国文化的元素、符号、精神、传统文化等方面,通过设计将这些属于我国的特色象征广泛应用到不同的领域。

中国风与交互设计之间的联系“中国风”从概念上来看,是部分欧洲国家对我国传统艺术样式,例如花纹、图样等方面的审美欣赏和艺术借鉴,不难看出,我国传统民族艺术在世界艺术中占据了一定的艺术地位,是一种拥有蓬勃生命力与感染力的艺术类型。

具体到交互设计,交互设计最为主要的特点是其用户体验感,作为一种非常重视人的主观感受的艺术理念,近几年来进入到我国设计领域,以加强各类型产品的功能拓展,并为人们提供更加优质、舒适的体验感。

例如,在不同功能的智能软件或相关产品中,衣、食、住、行等方面都大规模的应用交互设计。

给人们提供了不同程度的便捷,其中,关于中国风的交互设计广泛应用在室内设计领域或行业,包括传统风格的木质加工工艺,在这种交互设计的应用下,能够将难以理解的2D 平面图有效转化为3D 立体图,使人们能够更加清晰、直观的了解各种类型的产品工艺,同时也能很好的加强人们对中国风元素的认识。

非遗博物馆交互应用中体现的中国风设计元素■信息的架构层次若想将中国风元素及其设计得到有效的传播效果,需建立一种具有一定层次效用的信息构架,将人们与文化之间形成特有的桥梁通道,有利于传递信息,同时,也能够将用户的真实感受进行实时反馈。

多层次概定义与复杂关系表达-繁体字知网的新增架构

多层次概定义与复杂关系表达-繁体字知网的新增架构

多層次概念定義與複雜關係表達-繁體字知網的新增架構陳克健、黃淑齡、施悅音、陳怡君台北 中央研究院資訊所kchen@.tw, {josieh,yuehyin,chenyijun}@.tw1. 前言董振東先生於1988年創建知網,提出了建構世界知識的幾項重要原則,如:以屬性標注而非分類的方法來表達世界知識、建立知識辭典而非語義辭典等等(董&董,2001)。

根據這些原則,他以兩千多個義原以及兩百多個動態角色和屬性來表達通用概念的意義,以及這些概念間的關係,實例如下:(1) NO.=046870W_C=獲益G_C=VW_E=be benefitedDEF={obtain|得到:possession={Advantage|利:host={Situation|狀況}{entity|實體}{event|事件}}}這裡的obtain|得到、Advantage|利等都是義原,possession (佔有物)、host(宿主)則是動態角色與屬性。

這種定義式標示出概念與概念之間如何結合而產生一個新的概念,不僅能清楚表達通用概念所含的各種訊息,也便於架構一個完整的知識本體,對自然語言處理很有幫助。

2003年,中央研究院資訊所詞庫小組與董振東先生展開建構繁體字知網的合作計畫,我們承續知網的語意定義機制,嘗試將中央研究院詞庫小組辭典(CKIP Chinese Lexical Knowledge Base)中的7萬多詞條與知網連結。

在學習與研究的過程中,我們在概念的表達上遭遇一些困難:首先是複雜概念用義原定義時,如果定義詳細,表示式會很複雜;如果表示式太簡化,會造成不同意義詞有相同的表示式(如知網中弓箭/左輪/自動炮三詞定義相同,必須以其英文翻譯不同來區分其義)。

其次是複雜關係的表達不易,在知網的語意關係表達中,其關係變數(argument)都是以中心成分(head)為主要變數的設計,例如:(2) 白雲Def : {CloudMist|雲霧:color={white|白}}在這個例子中,color的關係變數即是中心成分「CloudMist|雲霧」,因此也可以寫成Def : {CloudMist|雲霧:color(CloudMist|雲霧)={white|白}},表示「雲霧的顏色白」。

基于《知网》的中文信息结构消歧研究

基于《知网》的中文信息结构消歧研究

基于《知网》的中文信息结构消歧研究张瑞霞;庄晋林;杨国增【摘要】《中文信息结构库》是《知网》的重要组成部分之一,可以作为中文语义分析的规则库,对其进行消歧是实际应用的基础之一.因此,该文首先对中文信息结构进行了形式化描述;接着对其进行优先级划分;然后根据其构成形式提出了四种不同的消歧方法:即词性序列消歧法、图相容匹配消歧法、图相容度计算消歧法、基于实例的语义相似度计算消歧法;最后针对不同优先级的中文信息结构集设计了不同消歧流程.实验结果证明消歧正确率达到了90%以上.%The Chinese Message Structure Database, as an important component in HowNet, can be treated as a rule base for Chinese semantic analysis. The disambiguation of Chinese message structures is the first step in bring the base into practical application. In this paper, the Chinese message structures are firstly formalized and then divided into different priority levels. Afterwards,, four diverse disambiguation approaches are proposed, including the syntax list judgment, the graph compatibility matching, the graph compatibility computation and the semantic similarity computation based on examples. Finally, different disambiguation processes are designed according to the different priority levels. Experimental results prove the accuracy rate of the disambiguation yields more than 90%.【期刊名称】《中文信息学报》【年(卷),期】2012(026)004【总页数】8页(P43-49,60)【关键词】知网;中文信息结构;消歧;图相容度;语义相似度【作者】张瑞霞;庄晋林;杨国增【作者单位】华北水利水电学院信息工程学院,河南郑州450011;华北水利水电学院信息工程学院,河南郑州450011;郑州师范学院数学系,河南郑州450044【正文语种】中文【中图分类】TP3911 引言语义分析在中文信息处理领域中占有重要地位,特别是随着一些知识库和语义分析理论的成熟,使得语义分析的自动化成为可能。

中国知网新旧平台区别、新版数据库检索方法及技巧

中国知网新旧平台区别、新版数据库检索方法及技巧

要查找何类文献,直接在首页检索框中输入
文献默认检索期刊、博 硕、会议、报纸、年鉴
2014-8-14
查阅更多文献资源---切换标签页
点击更多,查看到底有 概念„„只要切换标签页即可!唤醒沉睡的资源!
指数检索-新增:多维关注度趋势图
检索不仅为检索,还可实现分析、对比的功能
2014-8-14
新平台(KNS60)发布
一框式检索平台,快速上手
更加精准结果,利用高级检索 各类资源的入口
机构馆/个人馆入口
2014-8-14
提升友好性
平台升级所带来的……
• 让检索更加简单---快速上手 • 更加精细的需求---同时兼顾 • 想要更加丰富多彩的功能?
资源揭示
智能检索
分析
分享传播
直观阅读
2014-8-14
直观阅读
• 每次看文献都要下CAJ浏览器?想一次看多篇?
• 丰富浏览方式
– 在线实时浏览—无插件,更便捷 – 文献重组汇编,可挑选文章组成“知网刊”汇编文集
• 多终端浏览
– 支持智能终端浏览,突破终端限制
– Android、IOS、Windows、MAC OS、
2014-8-14
一站式导航
资源揭示
智能检索
分析
分享传播
直观阅读
2014-8-14
回顾55平台,若要挑选出较新的有价值文献,需通 过排序人工干预 2014-8-14 如何验证检索式输入的是否正确?
智能检索
• 智能用户输入提示
– 根据检索项自动提示、纠错 – 词典根据用户输入自动更新调整
• 智能检索、复合排序
兼容拼音字母、大小写
智能检索,复合排序
长句的切分、精准匹配

繁体字知网架构下之功能词表达初探陈怡君,黄淑龄,施悦音,陈克健

繁体字知网架构下之功能词表达初探陈怡君,黄淑龄,施悦音,陈克健

繁體字知網架構下之功能詞表達初探陳怡君、黃淑齡、施悅音、陳克健台北中央研究院資訊所詞庫小組{chenyijun, josieh, yuehyin}@.tw, kchen@.tw摘要詞彙的核心語意主要由實質概念與關係概念組成,此ㄧ特性在功能詞和實詞之間並無清楚之區分,僅只是程度上功能詞較重關係概念較輕實質概念,實詞則反之。

繁體字知網以多層次語意定義方式表達功能詞的意義,定義式能同時表現出其在句法層次上所建立之概念間的語意關係及實質語意。

繁體知網另建立功能詞相關語意角色架構上下位關係,有助於角色與概念的整合並提供額外訊息以區辨概念的類別。

整個表達架構有助於未來完成語義自動合成及分解的機制。

關鍵字:功能詞、知網、語意角色1.序論知網的語意定義機制為利用有限義原定義實體與事件所代表的概念,以必要角色框架描述概念之間以及概念的屬性之間的語意關係(董振東、董強,2001)。

繁體字知網係中央研究院資訊科學研究所詞庫小組與董振東先生之合作計畫,除承續知網的語意定義機制,將中研院詞庫小組辭典七萬筆詞條與知網相連結外,另新增多層次定義架構與複雜關係表示式,以符合人類認知方式的簡單概念取代語意無法再分解的有限義原,作為定義複雜概念的元素,其目的在以更精確的方式表達知識(陳克健等,2004)。

功能詞在句法層次上表示兩概念之間的關係,具有語法意義(程祥徽、田小琳,1992;陸儉明、馬真,1999)。

然而知網對功能詞之標注方式未能呈現出其在句法層次上表達兩概念之關連性,例如介詞與連詞等功能詞因其無實質概念語意,知網僅以「FuncWord|功能詞」作為功能詞的主要特徵標記,而以comment與emphasis等語意角色標示該功能詞之使用功能。

繁體字知網因而些許修改知網對功能詞之定義方式,目的在使功能詞定義式呈現其完整的句法意義及實質語意,使語意合成操作能在知網架構下順利進行。

此外,另建立功能詞相關語意角色架構上下位關係,並將其整併於繁體知網先前架構之實體概念、事件概念與複雜關係的語意角色上下位關係架構。

基于多层次概念语义网络结构的中文医学信息语义标引体系和语义检索模型研究

基于多层次概念语义网络结构的中文医学信息语义标引体系和语义检索模型研究
人脑对于语义的识别是一个复杂的过程。人通
过认知性的学习过程, 在大脑中逐渐积累了基本知 识 (程度、 时空、 质量、 性质和属性等范畴知识) 、 普通 知识 (语言、 艺术、 数理、 科技、 哲学和心理等文化知 识) 和专业知识 (生物学和医学等特殊知识) , 并建立 了相应知识领域的概念以及概念与概念之间的关 系。这些概念以及概念与概念之间的关系在大脑中 分别映射为语义类型和语义关系。所有的语言都具 有相同的基本概念体系。这个基本概念体系是人类 思维的一个普遍特征, 同时也是建立兼容多语种语 义网络的理论基础。不同语言在语义上的共同之处 表现在逻辑、 范畴、 心理、 感知、 认知、 文化、 环境、 科 学和技术的一致性上。信息检索是用户吸收信息、 重新构架和组织大脑内知识结构的动态过程。认知 建构的组织过程正是信息检索的机制。多层次概念 语义网络结构客观地反映了概念体系在人脑中的语 义映射方式, 符合人脑的认知规律。建立多层次概 念语义网络结构可以降低语义网络的复杂性, 增强 语义网络的逻辑性, 避免语义网络的循环性, 提高语 义检索的多样性。本文以认知理论为基础, 将多层 次概念语义网络结构的基本模式设定为: 根据概念 的种类划分把整个语义网络结构分为多个层次, 每 个层次均由概念的语义类型和语义关系构成。
(期
基于多层次概念语义网络结构的中文医学信息语义标引体系和语义检索模型研究
(’)
义分析。选 用 !"#$ 语 义 类 型 表、 !"#$ 语 义 关 系 表、 语义场框架表、 基元概念语义网络表和基本概念 语义网络表等作为工具表, 并依此对分析集进行语 义分析, 建立适用于中文医学信息语义分析和表达 的多层次概念语义网络结构及其各个层次的语义类 型表和语义关系表以及数据库处理用的概念表、 同 义词词表和蕴含词词表。 (%) 建立语义标引体系。基于多层次概念语义 网络结构、 概念表、 同义词词表和蕴含词词表建立语 义标引体系, 确定中文医学信息语义标引的步骤和 方法; 以浏览的方式从检索集中选出与肿瘤相关的 文献 &’’ 篇, 逐一进行语义标引, 形成标引集。 (() 建立语义检索模式。根据多层次概念语义 网络结构、 概念表、 同义词词表和蕴含词词表建立语 义检索模型。

繁体字的现状分析与定位

繁体字的现状分析与定位

繁体字的现状分析与定位繁体字的现状分析与定位学院:吉首大学文学与新闻传播学院班级:汉语言文学(师范类)姓名:李天心【摘要】汉字存在至今,一直存在繁、简字体之分。

在文字发展演变的趋势下,我们不可以荒废包括繁体字在内的传统文化的传承。

但是也不可以忽略汉字发展至今演化出的简体字的发展。

有关于繁体字的争论在学术界一直未曾休止过。

本文就繁体字在中国内陆,及港澳台地区的使用现状进行了调查分析。

并就繁体字在中国内陆的发展趋势做出了定位分析。

【关键词】繁体字简化字港澳台中国内陆定位【正文】汉字的发展,由甲骨文至繁体汉字到简体汉字。

这样广阔的文字发展领域是我们汉民族的一种国粹精华文化,也是我们汉民族文化发展过程中一个有利的交流载体。

繁体汉字作为一种传统文化的传播工具是不可舍弃的。

一、港澳台等地区使用繁体字现状繁简字体的明确区分,始于1956年。

之前主要采用的字体为繁体字。

目前,中国的繁字体用于香港特别行政区、澳门特别行政区、台湾地区。

简体字用于大陆。

1.中国台湾地区繁体字使用现状台湾未退出联合国前,联合国所有中文文件都是使用繁体字。

台湾地区使用繁体字的标准为《常用国字标准字体表》、《次常用国字标准字体表》和《罕用字体表》。

标准写法和中国大陆的写法有些不同。

繁体字的字形严谨,字形的来历也很有渊源。

从六书直至康熙字典,古人也做了相当的标准的规范。

现在的台湾地区都基本以康熙字典的字形作为自己的汉字标准。

台湾地区一向称繁体字为正体字。

2.中国香港特别行政区繁体字使用现状我们都说香港是一个商业化社会,但在繁体字上,却维持了中华民族的悠久传统。

中国香港地区和中国台湾地区繁体字使用情况,总体而言,差异并不大。

香港地区以《常用字字形表》为准。

但也与些许的汉字与台湾地区差异较明显。

如“充”“读”“裹”“著”等字。

二者标准写法不甚相同。

香港用的一些繁体字包括广东方言、特殊地名等。

3.繁体字在周边国家地区的影响及现状值得一提的是,由于繁体字具有数千年的历史,所以不仅在中国,在中国周边国家中,繁体字仍旧具有非常的影响力。

hownet简介

hownet简介

知网简介知网(英文名称为HowNet)是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。

今天它终于上网面世了。

我们期待会有越来越多的人关心它,使用它,甚至参与它的完善、扩充和发展。

1. 问题的提出1988年前后,董振东曾在他的几篇文章中提出以下的观点:(1) 自然语言处理系统最终需要更强大的知识库的支持。

(2) 关于什么是知识,尤其是关于什么是计算机可处理的知识,他提出:知识是一个系统,是一个包含着各种概念与概念之间的关系,以及概念的属性与属性之间的关系的系统。

一个人比另外一个人有更多的知识说到底是他不仅掌握了更多的概念,尤其重要的是他掌握了更多的概念之间的关系以及概念的属性与属性之间的关系。

(3) 关于如何建立知识库,他提出应首先建立一种可以被称为知识系统的常识性知识库。

它以通用的概念为描述对象,建立并描述这些概念之间的关系。

(4) 关于由谁来建立知识库,他指出知识掌握在千百万人的手中,知识又是那样博大精深,靠三、五个人甚至三、五十个人是不可能建成真正意义上的全面的知识库的。

他提出:首先应由知识工程师来设计知识库的框架,并建立常识性知识库的原型。

在此基础上再向专业性知识库延伸和发展。

专业性知识库或称百科性知识库主要靠专业人员来完成。

这里很类似于通用的词典由语言工作者编纂,百科全书则是由各专业的专家编写。

知网的研究和建设是实践上述观点的努力。

2. 知网的哲学要掌握和利用好知网系统,必须首先了解知网系统的哲学思想。

知网系统的哲学也就是它对客观世界的认识与把握。

知网哲学的根本点是:世界上一切事物(物质的和精神的)都在特定的时间和空间内不停地运动和变化。

它们通常是从一种状态变化到另一种状态,并通常由其属性值的改变来体现。

试以人为例,人的生老病死是一生的主要状态。

这个人的年龄(属性)一年比一年大{属性值},随着年龄的增长头发的颜色(属性)变为灰白{属性值}。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多層次概念定義與複雜關係表達-繁體字知網的新增架構陳克健、黃淑齡、施悅音、陳怡君台北 中央研究院資訊所kchen@.tw, {josieh,yuehyin,chenyijun}@.tw1. 前言董振東先生於1988年創建知網,提出了建構世界知識的幾項重要原則,如:以屬性標注而非分類的方法來表達世界知識、建立知識辭典而非語義辭典等等(董&董,2001)。

根據這些原則,他以兩千多個義原以及兩百多個動態角色和屬性來表達通用概念的意義,以及這些概念間的關係,實例如下:(1) NO.=046870W_C=獲益G_C=VW_E=be benefitedDEF={obtain|得到:possession={Advantage|利:host={Situation|狀況}{entity|實體}{event|事件}}}這裡的obtain|得到、Advantage|利等都是義原,possession (佔有物)、host(宿主)則是動態角色與屬性。

這種定義式標示出概念與概念之間如何結合而產生一個新的概念,不僅能清楚表達通用概念所含的各種訊息,也便於架構一個完整的知識本體,對自然語言處理很有幫助。

2003年,中央研究院資訊所詞庫小組與董振東先生展開建構繁體字知網的合作計畫,我們承續知網的語意定義機制,嘗試將中央研究院詞庫小組辭典(CKIP Chinese Lexical Knowledge Base)中的7萬多詞條與知網連結。

在學習與研究的過程中,我們在概念的表達上遭遇一些困難:首先是複雜概念用義原定義時,如果定義詳細,表示式會很複雜;如果表示式太簡化,會造成不同意義詞有相同的表示式(如知網中弓箭/左輪/自動炮三詞定義相同,必須以其英文翻譯不同來區分其義)。

其次是複雜關係的表達不易,在知網的語意關係表達中,其關係變數(argument)都是以中心成分(head)為主要變數的設計,例如:(2) 白雲Def : {CloudMist|雲霧:color={white|白}}在這個例子中,color的關係變數即是中心成分「CloudMist|雲霧」,因此也可以寫成Def : {CloudMist|雲霧:color(CloudMist|雲霧)={white|白}},表示「雲霧的顏色白」。

這種設計如果遇到指涉其它變數的概念時,就無法表達。

例如:(3) 牙縫Def: {縫隙=InBetween(牙齒)}在這個例子中,關係特徵InBetween的關係變數並不是中心成分「縫隙」,而是「牙齒」,因此我們必須在後面的括弧中加以標明。

在主要變數即是中心成份的單一設定下,有許多結合關係(composite relations)也不容易表達,例如親屬關係、方位關係等。

故知網中不同的親屬概念往往只能用同一表示式表達,只描述它們的輩份和性別(如:阿姨/嬸娘/舅媽三詞定義相同)。

針對以上兩個問題,本文的研究目標是建構一個方便的表達方法,希望可以簡單的做到每一個不同意義的概念都有不同的表示式。

在文章第二節,我們提出一種「多層次」的定義架構來解決第一個問題。

第三節則針對第二個問題提出一種新的複雜關係表示式,便於用來定義任何具有多重結合關係的人際概念、時空概念與比較概念。

第四節則作一總結並提出對未來工作的展望。

2. 繁體字知網的多層次定義架構2.1 什麼是多層次定義架構知網的定義架構是以有限的義原來表達無限的概念,它的優點是:當新概念出現時,能很容易地納入同一知識本體,不必重新調整架構;其次,要比較概念與概念間的關係時,可以藉計算知識本體的上下位距離來得到答案。

這些都是對自然語言處理有利的條件。

但是,通用概念中有許多複雜概念,從認知的角度來看,它們是建立在我們對簡單概念的認知上,但不一定及於義原層次。

如「大丹狗」為「狗」,就是一個複雜概念相對於簡單概念的關係,而狗非義原。

在認知上不會直接認為「大丹狗」是「牲畜」,因此在定義「大丹狗」時似乎也不應將其以義原關係直接定義為一種「牲畜」。

如果所有的複雜概念都從最基本的義原開始表示,會使表示式變得複雜而且難懂。

因此,不妨仿效人的認知過程來建立定義架構,我們的構想是:每一個複雜概念都是由一些簡單的概念所定義,這些簡單的概念又可以進一步分解成更簡單的概念,一直進行到最基本、不能再分解的概念為止,就是以義原定義的方式表達。

我們將這個架構稱之為多層次定義架構。

舉幾個例子來看:(4) 大丹狗Def1:{狗: telic={狩獵:instrument={~},size={大型},evaluation={溫和},color={黑白}}}Def2:{livestock|牲畜: telic={engage|從事:content={catch|捉住:patient={animal|獸}},domain={agricultural|農},instrument={~},size={big|大},evaluation={gentle|柔},color={black|黑}{white|白}}}(5) 主桅桿Def1: {桅:predication={懸掛:patient={帆},place={~}},qualification={主要}}Def2: {part|部件:whole={ship|船},predication={hang|懸掛:patient={part|部件:whole={ship|船},predication={drive|駕馭:instrument={~}}},place={~}},qualification={important|重要}}上面兩個例子的Def1都是以簡單概念來定義被定義詞,Def2再以義原表示式取代簡單概念的位置。

這樣不僅能更精確的表達被定義詞,也比直接用義原定義容易理解。

而且,簡單概念所包含的大量訊息也不會被遺漏,例如「狗」所帶的訊息就比「牲畜」多。

要補充說明的是,當簡單概念出現歧義時,我們的解決方法是暫時以WordNet同義詞集(synset)加以限定,如下例:(6) 三讀通過Def1: {通過:content={法案},domain={politics|政}}Def2: {accept|接受:content={document|文書:domain={law|律法}},domain={politics|政}}Def wnn:{[01530096V+00541962V]1:content={ [02585552N]:domain={[06243906N]} },domain={ [00403663N]}}Def wnc:{[(accept,take,have)+(accept,consent,go_for)]:content={ [(document)]:domain ={[(law,jurisprudence)]}},domain={ [(politics)]}}此例中「通過」是一歧義詞,藉由將知網的每一個義原與WordNet同義詞集作連結,可以把這裡的「通過」限定在「接受」的意義下,例中Def wnn是以同義詞集的編號取代每一個義原的位置,Def wnc則是以同義詞集的代表詞取代義原位置。

另外,多層次架構中的語義展開應視需要而定,不需要全部展開到義原表示式,它的展開層次也不限兩層,例如:(7) 個人所得稅Def1: {income tax|所得稅:possessor={individual|個人}}Def2: {tax|稅: reason={income|所得}, possessor={human|人:modifier={alone|獨自}} Def3: {expenditure|費用:predication{levy|徵收goal={~}}, reason={ income| 所得},1我們將義原與WordNet同義詞集作連結時,以同義、並列、上位、複合四種關係連結,此處的+號表示並列。

possessor={human|人:modifier={alone|獨自}}Def4: {expenditure|費用:predication{levy|徵收,goal={~}, reason={ wealth|錢財:predication={earn|賺:goal={~}}}, possessor={human|人:modifier={alone|獨自}}我們可以視實際需求來決定那些是該展開的概念,以同時兼顧表示式的簡單性和可理解性。

此外,以WordNet同義詞集(synset)表達意義的另一個好處是將知網推展到其他語言。

2.2多層次定義架構的優點多層次定義架構有許多優點,可以歸納如下:1) 所有的概念最後仍可以用有限的義原表示,因此具備知網原有的優點。

2) 它不受有限義原的限制,能夠更精確的表達知識。

3) 由於符合人的認知方式,對標注者而言較簡單,他們可以靈活的運用簡單概念進行定義。

4) 標注者使用不同的簡單概念定義同一詞彙時,最後仍可轉換為相同或相近的義原,並可利用上下位承襲規範進行整合,有利於知識庫建立的方便性與一致性。

5) 利用簡單概念定義複雜概念,可以減少訊息的重複登錄,只需把額外的訊息補充說明即可,因此表示式較清楚易懂。

6) 表示式比較容易轉換為自然語言。

2.3多層次定義架構的困難多層次表示法具有許多優點,但在將簡單概念表示式轉換為義原表示式時,有時會產生意義重複或角色重疊的現象,使展開後的義原表示式冗長難懂或文法錯誤,因此必須建立規則,使意義整合、角色合併與文法檢查的工作能自動進行。

先看以下例子:(8) 下帖子Def1: {發:patient={帖}}Def2: {send|發送:patient={letter|信件:predication={invite|邀請:instrument={~}}}}(9) 門望Def1: {聲望: host={家}, qualification={顯赫}}*Def2: {Reputation|名聲:host={group|群體}{human|人}, host={family|家庭},qualification={famous|著名}}Def2: {Reputation|名聲:host={family|家庭}, qualification={famous|著名}}(10) 花販Def1: {小販:telic={賣:possession={花},agent={~}}}*Def2: {human|人:HostOf={Occupation|職位},domain={commerce|商業},predication={sell|賣:agent={~}},telic={sell|賣:possession={FlowerGrass|花草},agent={~}}}Def2: {human|人:HostOf={Occupation|職位},domain={commerce|商業},telic={sell|賣:possession={FlowerGrass|花草},agent={~}}}例(8)是一個較單純的例子,由簡單概念轉換為義原時,意義和角色都沒有重複。

相关文档
最新文档