VantagePoint & Aureka:专利分析软件说明及其应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

VantagePoint & Aureka:专利分析软件说明及其应用

VantagePoint

VantagePoint是开发商Search Technology开发的一种数据挖掘产品,能深层次挖掘专利信息。

1.系统简介

系统采用多种算法(algorithms used)如通过模型匹配、基础规则和自然语言加工技术等进行文本挖掘。其操作平台是Windows 95、Windows 98、Windows NT或Windows2000,系统使用的数据由用户直接向数据供应商购买。输入网址,即可以进入该产品网站。

2.系统特点

VantagePoint分析工具对题录数据库数据进行文本挖掘。用户通过数据库供应商提供的搜索引擎进行专利检索,并将原始数据下载到用户计算机上。如果数据量较大,系统将打包发送数据。VantagePoint最佳工作环境是几百条数据,当然也可以对几千条数据加以分析。

检索完成后,用户将数据导入VantagePoint,系统为每一个数据库或数据供应商提供唯一的数据库文件结构。通过模型匹配、基础规则等进行文本挖掘,VantagePoint还可以利用自然语言加工技术,从文摘中提炼有意义的词汇和词组。

借助数据导入编辑器导入数据后,系统生成各种表格,显示前十名的数据(如专利权人或专利申请国别一维表格),并可以浏览相关的每一篇文献。此外,系统允许用户比较任意两个由VantagePoint产生的列表,区分表格中共同的或不同的条目。利用时间序列,用户能及时发现新技术主题、新专利权人或新的研究单位等。

使用相关数据矩阵(二维表格),用户可以快速浏览交叉列表。如利用专利权人和专利公开年份数据矩阵,用户可以了解专利公开的趋势,从而获得他们在过去的时间里,在某一技术领域的技术开发信息,以及他们是否继续所从事的工作。从数据矩阵中,还可以获得其他可视的图表。

在一维和二维分析的基础上,VantagePoint提供多维分析功能,以帮助在主题(概念)、专利权人、国家或各种关系中建立聚类或相互联系

VantagePoint提供数据清洗或整理工具(Data Cleaning Tools)。它应用模糊匹配技术来识别和整理数据,以减少不规范的数据量。例如该工具可以处理拼写错误、连字符号、大小写,以及不同人名拼写习惯等,从而提高数据质量。

VantagePoint 允许用户创建用户管理辞典(User-Managed Thesauruses),提炼特定数据。利用辞典,用户可以方便地综合某一数据变量的多种形式。例如,美国有United States、US、U.S、USA 等描述形式,通过用户辞典,系统会将这些有关“美国”的不同描述形式,视为同义词,自动进行归一化处理。

此外,用户可以进行其他类型的整理,如综合数据要素到更宽泛的目录中。例如将“aluminum alloys”、“magnesium alloys”、“carbon fiber reinforced plastics”和“copper alloys”等词条归类到材料类( Materials)中。或将美国、加拿大、墨西哥归类到“北美”类目中。此外,该系统最大的特点是操作简单,价格合理。

科学技术的日新月异使得世界各国专利申请量以惊人的速度增长,专利分析人员依靠人工手段从成千上万的专利文献中寻找有用信息犹如大海捞针一样费时费力,还难以对信息进行综合提炼和抽象概括,只有借助于计算机和专利分析软件,分析人员才能轻松地处理信息分析的样本数据库,及时获得用户所需要的专利技术情报。

Aureka

Aurigin Systemss Inc公司推出的Aureka IPAM系统是知识产权管理的综合性系统,该系统中集成了多个分析软件,其中专利分析工具功能强大,兼容性好。

1.Aureka开发商

系统开发商是Aurigin Systems Inc 公司,但 2002 年后,版权归 Micropatent,LLC. 所有。

2.系统特点

Aurigin的数据平台上安装有专利数据库,数据范围包括美国专利(全文)、欧洲专利(全文)、PCT国际专利申请的著录项目、日本专利(英文摘要)。专利数据定期更新。

系统操作平台(Platforms used):-Client/server or -Web access,检索算法(Searching algorithms):语言检索、布尔运算。系统自然语言算法使用了一种专门的字典,该字典包含了某一领域特定的技术术语。系统允许用户对专利检索结果加以注释,同时可以增加或减少检索结果。

系统中的ThemeScape Software,提供了一种相当有用的文本分析工具。该工具依据分析的专利样本中的相关词汇的词频,应用聚类分析生成词汇地形图来描述专利技术主题分布情况。该软件可以辨别和提出词汇系列中最经常一起出现的词组,以及它们在文献中的相关关系。根据用户需要,专利地图上还可以同时显现某一特定技术主题涉及的专利权人。该软件是从太平洋国家实验室(Pacific Northwest National Lab.,Operated by Battelle)得到许可。

系统中的Aureka引文树软件(Aureka Citation Tree)利用专利引证信息构建双向引证树,形象化地显示出研究对象(所指定的专利)引用在先专利和被其后专利引证的信息。根据需要用户可以按专利申请人、发明人、申请日和公开日等不同内容构建引证树,由此确定某一

技术领域的发展趋势和研究某一竞争对手的专利投资。根据大量的前向和后向专利引用信息,确定核心专利。

系统中的Aureka报告工具(Auerka Reporting Tool)可为客户提供各种研究报告或某一领域(诸如发明人、专利权人等)相关信息,以及某一专利或自定义专利组的专利期满和引文信息。该工具可提供3种类型的报告。

一是信息摘要,属于快报性质,为用户提供特定技术领域各种统计排序信息。比如报道某技术领域专利申请量前 10 位的专利申请人或专利受让人等信息。

二是详细文本式报告,是根据统计分析的结果,由专利分析人员进行综合提炼后为用户提供的特定技术领域的详细研究报告。

三是图表式报告,是信息分析人员将提取到的相关专利信息导入到Microsoft Excel中,进行数据处理制作各种图表,并根据需要合并或组合成要点图表,形象直观地揭示研究内容。

此外,系统使用ThemeScape绘制技术地图时,用户不能加入同义词词组或希望关注的主题概念是系统的一个缺陷。有时,某一技术领域的相关词组,因为出现太频繁而被系统剔除,造成分析误差。有时技术地图上的峰值并不十分相关。此外,引文树软件绘制的专利文献引证关系图只能显现直接的引用关系,而无法显现整个引文链,造成分析的不完整性。而且引文树软件仅适用美国专利引文数据,以及系统使用费十分昂贵都制约了该软件的使用和发展。

相关文档
最新文档