信息计量学复习整理

信息计量学复习整理
信息计量学复习整理

信息计量学复习整理

一、信息计量学的由来与发展

1.每年发表的文献量增长较快,并逐步形成了本学科的核心情报源

2.确立并提高了学科的地位

3.主要分支领域的研究取得重要成果

4.文献计量工具和手段的现代化取得重要进展

5.专业教育起步快、发展迅速

6.形成一支骨干队伍(核心研究队伍已基本形成)

7.国际交流与合作发展势头良好

二、信息计量学的概念和内容体系

概念:采用定量方法(数学、统计学等)来描述和研究情报(信息)的现象、过程和规律的一门学科。广义信息计量学——以广义信息论为基础(作为世界三个基本要素之一的信息)的信息计量;狭义信息计量学——研究情报信息(或文献情报)的计量问题。

三、信息计量学与相关学科(论述)

第一层——母体学科:图书馆学、文献学、情报学

第二层——工具性学科:数学、统计学、文献计量学、科学计量学

第三层——相似性学科:计算机科学、科学学、预测学、科技管理学、科学评价学

1.信息计量学与数学和统计学

信息计量学是数学方法应用于信息情报研究领域相结合而形成和发展起来的。信息计量学研究的最显著特征是定量分析,而数学正是定量分析的最强有力的工具。数学方法的应用程度成为信息计量学发展水平的重要标志。

2.信息计量学与文献计量学

从研究内容上来看,许多共同的研究内容,又有不尽相同的地方

从世界层次来看,文献计量学对应“世界I”——客观物理世界,信息计量学则属于“世界III”——客观知识世界。

从信息的层次来看,信息计量的范围包括“零次信息”的概念,但毫无疑问,文献信息时整个科学情报的主体。

从任务和方法上来看,信息计量学研究的任务更艰巨,更难找到恰当的定量方法及途径。

3.信息计量学与科学计量学

科学计量学——用定量方法研究科学学的一门学科,或者说,用以研究科学发展过程的各种定量方法的总和。

从研究目的来看,科学计量学从定量的角度来探讨科学发展的内在规律,信息计量学一是探明科学文献本身的规律,以提高信息管理的科学性,二是通过信息规律的讨论进而揭示科学技术的规律性。

从研究对象和方法来看,极为类似。

信息计量学的范围比科学计量学范围广很多。

服务信息科学的研究需求vs. 研究并验证科学的产生、传播和利用的量的规律性4.信息计量学与网络信息计量学

网络信息计量学是信息计量学的一个新的发展方向和重要的研究领域。继承与发

展的关系。

5.信息计量学与科学评价学

广义的科学评价:用科学的方法进行评价——评价的科学化。

信息计量学的理论原理和方法技术都被广范应用于定量科学评价中。

四、文献信息流的特征

静态特征:在一定时间内科学文献在空间的分布性质,如集中-离散分布、按著者分布、词汇在文献中分布、引文分布、主题相关分布等的规律性。

动态特征:科学文献随时间的延续而增长和老化的性质。既增长又老化。五、文献增长的指数增长规律

一般以文献累计数据为依据

正常的、日益增长的科学领域内的文献是按指数增加的。

F(t)=a·e^(bt)

t——时间,以年为单位

a——条件常数,即统计的初始时刻(t=0)的文献量

e——自然对数的底

b——时间常数,即持续增长率:某一年的累计增加量与前一年文献累计总数的比重。

六、文献老化的概念

1.过程观:历时观察

2.状态观:共时观察

3.过程状态辩证观:过程是状态连续变化的过程,状态是某一时刻过程的状态。

4.老化的不是科学情报本身,而是包含这些情报的文章(文献老化速度快,情

报老化速度较慢)情报老化相对于情报对象(客观存在的物体、事实、现象及其性质和特征等)而言,文献老化相对于情报用户(利用情报的人)而言。

5.表现:文献包含的信息失效;文献被替代;文献知识成为常识;文献内容不

再是研究热点。

七、文献老化的指标

1.半衰期(中值引文年限)、

历时半衰期:已发表的文献情报中有一半已不再使用的时间。

共时半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长的一段时间内发表的。

2.普赖斯指数

Pr = 出版年限不超过5年的被引文献数量/ 被引文献总量* 100%

普赖斯指数越大半衰期越短,只适用于文献情报。

3.剩余有益性指标

某一年份某一期刊被用户所利用的文献数称为期刊有益性。经过若干年后,期刊还保留的有益性——即剩余有益性。

4.老化系数

负指数变化,与半衰期成正比。

八、文献信息集中与离散分布规律——布拉德福定律

1.区域描述:如果将一定时间内(通常一年)的按某学科载文量等级排列的期

刊划分为三个区,使每一个区所包含的相关论文数量相等,三个区中的期刊数量成n1:n2:n3 = 1:a:a^2的关系。

a——布拉德福常数,或称比例系数

2.图像描述:n1:n1-2:n1-3 = 1:b:b^2

n1-2 = n1+n2

n1-3 = n1+n2+n3

b——分散系数

3.一个定律,十来个经验公式,四个数学模型

九、齐普夫定律的理论基础——最省力法则

每一个人的运动都在一定的途径上进行,而且都将收一个简单的基本法则的制约,千方百计的选择一条最省力的途径。

从经济上、安全上、时间上,并结合本人主观条件及客观条件等种种因素考虑,想方设法地选择一个最符合自己条件和要求的方法或途径,使自己付出的“力”最小。

最小的“力”最少。(利益最大化——理性人假设)

十、文献信息词频分布规律——齐普夫定律

把一篇较长的文章(约5000)中每个词出现的频次统计起来,按照高频词在前,低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,Fr表示频次,r表示等级序号,则Fr·r = C。

fr表示频率,fr·r = c 。

取对数,直线图像描述。b·lg r + lg Fr = lg C

十一、文献信息作者分布规律——洛特卡定律

生产n篇文章的作者书是生产1篇文章作者的1/n^2左右,生产1篇文章的作者是全体作者的60%左右。

y(x)= y(1)/ x^2

广义洛特卡定律:f(x)= C / x^n ,x = 1,2,3,···Xmax(一定时期内作者撰文的最大能力)

十二、文献信息统计原则

1.针对性

2.准确性(核心要求)

3.代表性

4.可比性

5.累积性

十三、确定统计指标的原则

上述五条

6.指标概念明确

7.计算方法简便

8.单位明确

十四、文献信息统计的基本步骤

1.统计调查

(1)确定具体方法

(2)选准统计工具

(3)明确指标项目

2.统计整理

(1)计算

(2)排序

(3)表示

3.统计分析

(1)理论指导下的分析

(2)数值分析

(3)图像(函数值、斜率)分析

十五、引文分析法基本概念

利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。

十六、引文分析法的步骤

1.选取统计对象

2.统计引文数据

3.引文分析

4.作出结论

十七、SCIE的结构、功能、特征

1.结构

(1)概括性的总体介绍

(2)引文索引

1)作者引文索引

2)团体作者引文索引

3)匿名作者引文索引

4)专利引文索引

(3)团体索引

1)地区部分

2)机构部分

(4)来源索引

(5)轮排主题索引

2.功能

(1)简易检索

(2)全面检索

1)一般检索

A.主题检索途径

B.著者检索途径

C.来源期刊名检索途径

D.著者地址检索途径

2)被引文献检索

A.被引著者检索

B.被引著作检索

C.引文年代检索

3)结构检索

4)高级检索

3.特征

(1)特色链接(内部/外部)

(2)浏览器界面,超文本格式

(3)每周更新

(4)检索整个数据库与指定检索年份

(5)直接收录纯电子期刊

十八、ESI的结构、功能、特征

1.结构

(1)科学家排名

(2)机构排名

(3)国家排名

(4)期刊排名

(5)高被引论文

(6)热门论文

(7)基线(篇均被引频次,百分点)

(8)研究前沿

(9)顶尖论文

(10)图表界面(5年一时间段的论文数/引用频次/篇均被引频次)(11)引证信息

(12)特殊话题

(13)《科学观察》

2.功能

(1)检索功能

1)引文排序(By field / By name)

2)高被引论文的检索(By field / By searching)

3)研究前沿

4)检索规则

(2)评价功能

3.特点

(1)基本的分析工具

(2)服务对象的广泛深入

(3)综合全面的数据、论文和课题

(4)与其他信息资源的连接与整合

十九、引文分布规律

1.影响因子

相对数指标,主要用以调整和修正大刊、老刊凭借发表论文绝对数量而在期刊被引上所占的优势,同时选择期刊被引数量达到最高峰时来计算其平均被引率,所以更能反映期刊被使用的真实情况。

影响因子= 某刊前两年发表论文在概念的被引证次数/ 该刊前两年发表论文总数

2.即年指标

测度期刊被引用速度的指标,表征期刊的“即时反应速率”。

即年指标= 该刊某年发表的论文在当年的被引次数/ 当年发表论文的篇数二十、引文耦合与同被引

1.文献耦合:A和B两篇文献共同引证了一篇或多篇参考文献,或者说他们共

同具有一篇或多篇同样的参考文献,则称A和B两篇文献具有引文上的耦合关系。(耦合强度n)

2.同被引:两篇(或多篇)论文同事被后来的一篇或多篇论文引证,则称这两

篇论文(被引证论文)具有“同被引”关系。(同被引强度=同被引频率)3.异同

(1)引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被引证文献之间的关系。

(2)引文耦合强度是固定不变的,同被引强度则随时有可能发生变化。(3)引文耦合反映的是文献间的关系是一种固定的长久的关系,而同被引反映的则是变化或暂时的关系。

(4)引文耦合属于“回向引证”,而同被引属于“前向引证”。

(5)对动态结构来说,“同被引”比“引文耦合”更具有优越性

二十一、引文分析法的局限性

(1)文献被引证并不完全等于重要

(2)著者选用引文受到可获得性的影响

(3)引文关系上假联系的影响

(4)马太效应的影响

二十二、核心期刊的概念

针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就称为该学科(专业)的核心期刊(学科核心期刊&馆藏核心期刊)。

二十三、测定核心期刊的意义

1.图书情报单位科学管理上的需要

2.科技工作者重点阅读的需要

3.提高信息检索和文献信息服务效率的需要

二十四、核心期刊的测量方法

1.利用信息计量学工具和指标直接选定各学科的核心期刊(SCI,JCR)

2.利用文献计量学方法,按照一定的基本步骤来测定

(1)以载文量为标准的方法包括布氏定律法及百分比补偿和累计百分比法(2)以摘引率为标准的方法,包括文摘发和尹文发

(3)以流通量为标准的方法

(4)综合评价法

二十五、研究科学发展特点

1.科学发展速度加快

2.科学发展具有继承性

3.科学发展具有阶段性

4.学科间具有交叉渗透性

5.科学发展重点的转移

6.科学劳动的集体性

二十六、研究科学发展结构

1.利用书目(篇目)分析法研究科学结构(学科结构,学科动态发展特征)

2.利用引文分析法研究科学结构(静态、动态、超结构的微观研究)

3.利用词频分析法研究学科发展结构

二十七、研究科技史

每一篇论文都是科学发展过程中特定事件的记录,每个历史事件都是在不同的时间点上发生的。

二十八、研究科技政策

科学家的分布、科学生产率的测定为科技政策的制定提供依据

二十九、信息计量学评价人才的原理

1.科技人员的成就和学术造诣预期发表的文献数量有关

2.科技人员的成就和学术造诣与其发表文献的被引次数有关

三十、信息计量学评价人才的内容

1.评选杰出科学家

2.预测未来获奖者

三十一、信息计量学评价人才的方法

1.书目(篇目)分析法

2.引文分析法

三十二、网络信息计量学的概念

采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互印证和开发利用等进行定量描述和统计分析,以解释其数量特征和内在规律的一门新兴分支学科

三十三、网络信息计量学的主要特征

1.计量方便

2.统计全面

3.结果准确

4.学科新颖

5.方法净值

6.应用广泛

7.更新较快

生物信息学复习题及答案

生物信息学复习题 名词解释 1. Homology (同源):来源于共同祖先的序列相似的序列及同源序列。序列相似序列并不一定是同源序列。 (直系同源):指由于物种形成的特殊事件来自一个共同祖先的不同物种中的同源序列,它们具有相似的功能。 (旁系(并系)同源):指同一个物种中具有共同祖先,通过基因复制产生的一组基因,这些基因在功能上的可能发生了改变。基因复制事件是促进新基因进化的重要推动力。 (异同源):通过横向转移,来源于共生或病毒侵染而产生的相似的序列,为异同源。 Score:The sum of the number of identical matches and conservative (high scoring) substitutions in a sequence alignment divided by the total number of aligned sequence characters. Gap总是不计入总数中。 6.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 7. E值:得分大于等于某个分值S的不同的比对的数目在随机的数据库搜索中发生的可能性。衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义,E值越接近零,越不可能找到其他匹配序列。 值:得分为所要求的分值比对或更好的比对随机发生的概率。它是将观测得到的比对得分S,与同样长度和组成的随机序列作为查询序列进行数据库搜索进行比较得到的HSP(高分片段对)得分的期望分布联系起来计算的。通常使用低于来定义统计的显著性。P=1-e-E 9.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法,是序列相似性分析的基础,其不同的选择将会出现不同的分析结果。 10.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。 :美国国家生物技术信息学中心,属于美国国立医学图书馆的一部分,具有BLAST, Entrez ,GenBank等工具,还具有PubMed文献数据库。另外还具有Genome, dbEST, dbGSS , dbSTS, MMDB, OMIM, UniGene, Taxonomy, RefSeq, etc. 序列格式:是将DNA或者蛋白质序列表示为一个带有大于号(>)开始的核苷酸或者氨基酸序列的新文件,其中大于号后可以跟上序列的相关信息,其他无特殊要求。 13genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释,主要包含生物功能或数据库信息;第三部分是feature,对序列的注释;第四部分是序列本身,以“统发生树(Phylogenetic tree )是研究生物进化和系统发育过程中的一种用树状分支图来概括各种生物之间亲缘关系,是一种亲缘分支分类方法。在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。是用来研究物种进化与多样性的基础,是相近物种相关生物学数据的来源。17.基因树与物种树:物种树反映一组物种进化历程的系统树,其中每一个内部节点就代表一个物种形成的过程,而基因树则是代表来源于不同物种的单个同源基因的差异构建的系统树,而其内部的一个节点则代表一个祖先基因分化为两个新的独特的基因序列的事件。基因

信息计量学考试知识点整理-精选.

信息计量学 一、信息计量学概述 1. 信息计量学的由来和发展 1.1 信息计量学的由来 ※信息计量学来自于德文Informetrie,由德国学者昂托.纳克(Otto Nache)在1979年最早提出,其后很快出现了与之对应的英文术语informetrics; ※由于1987年以来的有关学术会议论文集上都有informetrics标题,因此,很多情报学家都将1987年看成是informetrics被国际情报学界正式承认的一年; ※我国将informetrics译为情报计量学,将其作为对应于“情报学”的三级分支学科,1992年,我国有关部门将information从情报改译为信息,informetrics也改译为信息计量学。 1.2 信息计量学的产生背景 (1)信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的;(文献计量学主要服务于图书馆学,情报数量>文献数量,情报计量方法>文献计量方法,情报学需要开辟与情报学对应的定量化研究领域); (2)信息计量学是情报学发展的需要和必然产物。 布鲁克斯提到:情报学如果不实现定量化,它将是一堆支离破碎的技艺,而不会成为科学。情报学定量化研究不可或缺。 (3)一批杰出的学科带头人和骨干力量推动了信息计量学发展。 1.3 信息计量学的形成与发展 (1)信息量化研究的前期实践 (2)信息计量规律的探索和发现 (3)信息计量学的形成 Statistical bibliography(1923)——Bibliometrics(1969) ——Scientometrics(1969)——Informetrics(1979) (4)信息计量学的发展 1988年,英国布鲁克斯提出informetrics代替bibliometrics; 1990年,比利时埃格赫和鲁索在Introduction to informetrics:quantitative metiods in

信息计量学复习题

第一章 1.信息计量学的发展逻辑过程:统计书目学—文献计量学—科学计量学—信息计量学 2.(了解)与文献计量学和信息计量学相类似,网络计量学的内容体系是由它的理论、方法 和应用三部分组成的,理论是基础,方法是手段,应用是目的。 3.信息计量学(名词解释):主要内容是应用数学、统计学等定量方法来分析和处理信息过 程中的种种矛盾;从定量的角度分析和研究信息的动态特性, 并找出其中的内在规律 4.信息计量学的三大定律:布拉德福定律、齐普夫定律、洛特卡定律 5.引文分析(名词解释):就是利用各种数学和统计学的方法和比较、归纳、抽象、概括 等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证 和被引证现象进行分析,以揭示其数量特征和内在规律的一种 文献计量分析方法 6.信息计量学与文献计量学的关系:从信息计量学的概念和内容体系来看,信息计量学与文 献计量学彼此交叉渗透,既有许多共同的研究内容,又 有着不尽相同的地方: 1)信息计量学着眼于“信息”本身的计量问题,文献计 量学主要以作为情报载体的“文献”为计量对象 2)信息计量学较之文献计量学来说,其研究范围更广泛 一些 3)从任务和方法上来看,信息计量学研究的任务更为艰 巨,更难找到恰当的定量方法及途径 第二章 1.文献信息流的特性:文献信息流的静态特性和动态特性。(静态特性是指在一定时间内科 学文献在空间的分布性质,如集中-离散分布、文献按著者分布、词 汇在文献中分布、引文分布、主题相关分布等规律性;动态特性是指: 科学文献随时间的延续而增长和老化的性质) 2.科学知识量的急剧增长的科学文献激增的主要原因 3.普赖斯是最早提出“文献信息指数增长规律” 4.文献信息增长规律的应用(论述):1)在科学学和科技史研究中的应用:通过文献数量的 增长变化规律来判断和预测科学知识的增长状况, 继而探索整个科学的发展规律,是科学史和科学学 研究中常用的方法。 2)在情报研究中的应用:从科学情报学的角度出发, 科学文献增长规律的研究是科技人员和情报工作人 员开展情报分析研究,掌握科技发展动态,进行科 学预测的可靠手段。科学文献数量的增长可以反映 一个国家某项技术发展的最敏感指标 3)在文献信息管理中的应用:一个图书馆或情报机构 确定经费的合理分配、资料搜集的原则、馆藏增加 的策略、存储空间扩大的措施、情报加工处理和传 递交流新技术的应用,等等,都要以科学文献的数 量及未来的增长趋势作为重要的决策依据 第三章 1.半衰期(名词解释):指某学科现时尚在利用的全部文献中较新的一半是在多长一段时间内

生物信息学题库

■一、选择题: 1.以下哪一个是mRNA条目序列号: A. J01536■. NM_15392 C. NP_52280 D. AAB134506 2.确定某个基因在哪些组织中表达的最直接获取相关信息方式是:■. Unigene B. Entrez C. LocusLink D. PCR 3.一个基因可能对应两个Unigene簇吗?■可能 B. 不可能 4.下面哪种数据库源于mRNA信息:■dbEST B. PDB C. OMIM D. HTGS 5.下面哪个数据库面向人类疾病构建: A. EST B. PDB ■. OMIM D. HTGS 6.Refseq和GenBank有什么区别: A. Refseq包括了全世界各个实验室和测序项目提交的DNA序列B. GenBank提供的是非冗余序列 ■. Refseq源于GenBank,提供非冗余序列信息D. GenBank源于Refseq 7.如果你需要查询文献信息,下列哪个数据库是你最佳选择: A. OMIM B. Entrez ■PubMed D. PROSITE 8.比较从Entrez和ExPASy中提取有关蛋白质序列信息的方法,下列哪种说法正确:A. 因为GenBank的数据比EMBL更多,Entrez给出的搜索结果将更多B. 搜索结果很可能 一样,因为GenBank和EMBL的序列数据实际一样■搜索结果应该相当,但是ExPASy中的SwissProt记录的输出格式不同 9.天冬酰胺、色氨酸和酪氨酸的单字母代码分别对应于:■N/W/Y B. Q/W/Y C. F/W/Y D. Q/N/W 10.直系同源定义为:■不同物种中具有共同祖先的同源序列B. 具有较小的氨基酸一致性但是有较大的结构相似性的同源序列 C. 同一物种中由基因复制产生的同源序列 D. 同一物种中具有相似的并且通常是冗余的功能的同源序列 11.下列那个氨基酸最不容易突变: A. 丙氨酸B. 谷氨酰胺 C. 甲硫氨酸■半胱氨酸 12.PAM250矩阵定义的进化距离为两同源序列在给定的时间有多少百分比的氨基酸发生改变: A. 1% B. 20%■. 80% D. 250% 13.下列哪个句子最好的描述了两个序列全局比对和局部比对的不同:A. 全局比对通常用于比对DNA序列,而局部比对通常用于比对蛋白质序列B. 全局比对允许间隙,而局 部比对不允许C. 全局比对寻找全局最大化,而局部比对寻找局部最大化■全局比对比对整体序列,而局部比对寻找最佳匹配子序列 14.假设你有两条远源相关蛋白质序列。为了比较它们,最好使用下列哪个BLOSUM和PAM矩阵:■BLOSUM45和PAM250 B. BLOSUM45和PAM 1 C. BLOSUM80和PAM250 D. BLOSUM10和PAM1 15.与PAM打分矩阵比较,BLOSUM打分矩阵的最大区别是:A. 最好用于比对相关性高的蛋白B. 它是基于近相关蛋白的全局多序列比对 ■它是基于远相关蛋白的局部多序列比对D. 它结合了全局比对和局部比对 16.如果有一段DNA序列,它可能编码多少种蛋白质序列: A. 1 B. 2 C. 3 ■. 6 17.要在数据库查询一段与某DNA序列编码蛋白质最相似的序列,应选择: A. blastn B. blastp C. tblastn D. tblastp■blastx 18.为什么ClustalW(一个采用了Feng-Doolittle渐进比对算法的程序)不报告E值:A. ClustalW报告E值■使用了全局比对 C. 使用了局部比对 D. 因为是多序列比对 19.Feng-Doolittle方法提出“一旦是空隙,永远是空隙”规则的依据是:A. 保证空隙不会引物序列加入而填充B. 假定进化早期分歧的序列有较高优先级别■假定最近序列空隙应 该保留 D. 假定最远序列空隙应该保留 20.根据分子钟假说:A. 所有蛋白质都保持一个相同的恒定进化速率 B. 所有蛋白质的进化速率都与化石记录相符合C. 对于每一个给定的蛋白质,分子进化的速率是逐 渐减慢的,就如同不准时的钟■对于每一个给定的蛋白质,其分子进化的速率在所有的进化分支上大致是恒定 21.系统发生树的两个特征是: A. 进化分支和进化节点■树的拓扑结构和分支长度C. 进化分支和树根D. 序列比对和引导检测方法 22.下列哪一个是基于字母特征的系统发生分析的算法:A. 邻位连接法(NJ法)B. Kimura算法■最大似然法(ML)D. 非加权平均法(UPGMA) 23.基于字母特征和基于距离的系统发生分析的算法的基本差异是:■基于字母特征的算法没有定义分支序列的中间数据矩阵 B. 基于字母特征的算法可应用于DNA或者蛋白质序列,而基于距离仅能用于DNA C. 基于字母特征的算法无法运用简约算法 D. 基于字母特征的算法的进化分支与进化时间无关 24.一个操作分类单元(OTU)可指:A. 多序列比对■蛋白质序列C. 进化分支D. 进化节点 25.构建进化树最直接的错误来源是:■多序列比对错误B. 采样的算法差异C. 假设进化分支是单一起源D. 尝试推测基因的进化关系 26.第一个被完整测定的基因组序列是:A. 啤酒酵母的3号染色体B. 流感病毒■ФX174 D. 人类基因组 27.普通的真核生物线粒体基因组编码大约多少个蛋白质:■10 B. 100 C. 1000 D. 10000 28.根据基因组序列预测蛋白质编码基因的算法的最大问题是:A. 软件太难使用■. 假阳性率太高,许多不是外显子的序列部分被错误指定C. 假阳性率太高,许 多不是外显子功能未知 D. 假阴性率太高,丢失太多外显子位点 29.HIV病毒亚型的系统演化研究可以:A. 证实HIV病毒是由牛病毒演化而来■. 用于指导开发针对保守蛋白的疫苗C. 证实哪些人类组织最容易遭受病毒侵染 30.一个典型的细菌基因组大小约为多少bp:A. 20000■. 200000 C. 2000000 D. 20000000

生物信息学课后题及答案-推荐下载

生物信息学课后习题及答案 (由10级生技一、二班课代表整理) 一、绪论 1.你认为,什么是生物信息学? 采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋 白质等)的收集、加工、储存、分析、解释的一门学科。2.你认为生物信息学有什么用?对你的生活、研究有影响吗?(1)主要用于: 在基因组分析方面:生物序列相似性比较及其数据库搜索、基因预测、基因组进化和分 子进化、蛋白质结构预测等 在医药方面:新药物设计、基因芯片疾病快速诊断、流行病学研究:SARS 、人类基因组计划、基因组计划:基因芯片。 (2)指导研究和实验方案,减少操作性实验的量;验证实验结果;为实验结果提供更多的支持数据等材料。 3.人类基因组计划与生物信息学有什么关系? 人类基因组计划的实施,促进了测序技术的迅猛发展,从而使实验数据和可利用信息急剧增加,信息的管理和分析成为基因组计划的一项重要的工作 。而这些数据信息的管理、分析、解释和使用促使了生物信息学的产生和迅速发展。 4简述人类基因组研究计划的历程。 通过国际合作,用15年时间(1990-2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA 的全部核苷酸序列,定位约10万基因,并对其他生物进行类似研究。 1990,人类基因组计划正式启动。 1996,完成人类基因组计划的遗传作图,启动模式生物基因组计划。 1998完成人类基因组计划的物理作图,开始人类基因组的大规模测序。Celera 公司加入,与公共领域竞争启动水稻基因组计划。 1999,第五届国际公共领域人类基因组测序会议,加快测序速度。 2000,Celera 公司宣布完成果蝇基因组测序,国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作。 2001,人类基因组“中国卷”的绘制工作宣告完成。 2003,中、美、日、德、法、英等6国科学家宣布人类基因组序列图绘制成功,人类基因组计划的.目标全部实现。2004,人类基因组完成图公布。 2.我国自主知识产权的主要基因组测序计划有哪些?水稻(2002),家鸡(2004),家蚕(2007),家猪(2012),大熊猫(2010) 2.第一章 、管路敷设技术通过管线不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。在管路敷设过程中,要加强看护关于管路高中资料试卷连接管口处理高中资料试卷弯扁度固定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术包含线槽、管架等多项方式,为解决高中语文电气课件中管壁薄、接口不严等问题,合理利用管线敷设技术。线缆敷设原则:在分线盒处,当不同电压回路交叉时,应采用金属隔板进行隔开处理;同一线槽内,强电回路须同时切断习题电源,线缆敷设完毕,要进行检查和检测处理。、电气课件中调试对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行 高中资料试卷调整试验;通电检查所有设备高中资料试卷相互作用与相互关系,根据生产工艺高中资料试卷要求,对电气设备进行空载与带负荷下高中资料试卷调控试验;对设备进行调整使其在正常工况下与过度工作下都可以正常工作;对于继电保护进行整核对定值,审核与校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料试卷试验方案以及系统启动方案;对整套启动过程中高中资料试卷电气设备进行调试工作并且进行过关运行高中资料试卷技术指导。对于调试过程中高中资料试卷技术问题,作为调试人员,需要在事前掌握图纸资料、设备制造厂家出具高中资料试卷试验报告与相关技术资料,并且了解现场设备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案。 、电气设备调试高中资料试卷技术电力保护装置调试技术,电力保护高中资料试卷配置技术是指机组在进行继电保护高中资料试卷总体配置时,需要在最大限度内来确保机组高中资料试卷安全,并且尽可能地缩小故障高中资料试卷破坏范围,或者对某些异常高中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并且拒绝动作,来避免不必要高中资料试卷突然停机。因此,电力高中资料试卷保护装置调试技术,要求电力保护装置做到准确灵活。对于差动保护装置高中资料试卷调试技术是指发电机一变压器组在发生内部故障时,需要进行外部电源高中资料试卷切除从而采用高中资料试卷主要保护装置。

『金融计量学』 『金融计量学基础』

『金融计量学』 『金融计量学基础』 『The Fundamentals of Financial Econometrics』 『Analysis of Financial Time Series』 教学纲要 张明恒 上海财经大学经济学院 一、课程信息 题目:金融计量学基础或金融时间序列分析) 年级:07数量经济(中外) 代码:100098 时间: 共计13周,2011年2月21日~6月3日 周一10:05至11:45am (1207 教室) 周三15:25至17:05am (1207 教室) 二、课程目的 1)研究和掌握基本的金融时间序列的计量模型和分析方法2)描述金融市场的统计特征(非高斯、非平稳、非线性)3)理解金融时间序列的统计特征和计量局限性 4)训练发现问题、收集数据和量化模型的实证分析 三、课程背景 1)概率论和数理统计 2)计量经济基础

四、教材及读物 1)教材: ①Analysis of Financial Time Series by Ruey S. Tsay (John Wiley, 2005), 2nd Ed., ISBN 0471690740(Textbook). See, the website of Prof.Tsay https://www.360docs.net/doc/744728041.html,/ruey.tsay/teaching/bs41202/sp200 7 或 ②金融时间序列分析(in Chinese) Translated by Prof. Pan, Pressed by 机械工业出版社, ISBN711118386X, 2006-4-1(Textbook). 2)读物: ①Essentials of Stochastic Finance - Facts, Models Theory by Albert N. Shiryaev, 2003, World Scientific. ②The Econometrics of Financial Markets by Campbell, Lo, and MacKinlay, 1997, Princeton University Press. ③Options, Futures, and Other Derivatives, 6th Ed. by J.C. Hull, 2005, Prentice-Hall. ④Modern Applied Statistics with S-Plus by W.N.Venales and B.D.Ripley, 1997, Springer. ⑤Modeling Financial Time Series with S-plus by E. Zivot and J. Wang, 2005, 2nd Ed., Springer. ⑥SAS系统与股票市场分析by 高惠璇etal, 1998, 北京大学. ⑦A.J. McNeil, R.Frey, and P.Embrechts, Quantitative Risk Management: Concepts, Techniques, and Tools, Princeton Press, 2005

信息计量学期末复习资料

1、 信息计量学有代表性的各种定义,其有共同之处,构成的基本要素为: a 是一门学科; b 采用数学、统计学等方法; c 以各类文献为基础; d 对文献及其各种特征进行定量统计分析 2、 信息计量学研究的内容是由研究的对象与任务决定的,形成三大模块:时间序列、信息 分布、引证研究。是以文献计量学为基础,向网络计量学发展 3、 信息计量学研究的方法体系:统计分析法,数学模型分析法,引文分析法,计算机辅助信 息计量分析法 4、 信息计量学形成的三个基本条件:文献可计量;大数量;有规律 5、 文献计量学的特点(现象):人为的计量、近似的统计、精确的计算 6、 信息计量学研究对象:消息、数据、事件、实物、文本和文献 7、 信息计量学研究的基本规律有哪些?文献增长/分散/老化/引用/著者/词频/利用…… P19 8、 图书馆有那些可量度的单位? 枚举图书馆常用的文献计量学单位(量度)或衡量一个图 书馆的基础指标是哪些?馆藏量/馆舍/TDB/用户数。藏书,建筑面积,年经费,工作人员…… 成为衡量一个馆大小的量度 9、 文献计量学特征变量:文献量/类型/读者/馆空间容量/文献信息检索点。如:期刊,学位 论文,专利,DB 10、 图书馆工作中的计量单位:利用率,满意度,文献购置结构,差错率,借阅率,拒 借率。藏书利用率=全年出借册数/全馆藏书总册数x100% 11、 从图书馆OPAC 查书,(小于100),可借状态下,在架的拒借率是与什么因素有关? 12、 信息计量工具:SCI (WOS ), SSCI A&HCI, ESI, JCR CSCD, CSSCI, CNKI SPSS 13、 文献计量学研究的是情报的“载体”表象—形式特征。 信息计量学研究的是情报 的“信息”知识—内容特征 14、 文献信息统计分析法类型有:出版物、著者、科技用语、引文分析、信息利用等统 计 15、 统计一般过程:收集 (聚集)\整理 (分类 / 整序)\分析(找规律)\推断(预测) 16、 统计特征值有:中位数,极差,众数,平均值,加权,环比 17、 情报吸收系数 I=N/M 统计时内发文总数/被利用的文献总数P262 18、 文献信息统计原则: 针对性,准确性,代表性,可比性,累积性 19、 文献增长规律研究的模型:与质量有关,指数;逻辑;滑动;直线 20、 增长模型。按指数曲线增长,其翻番如何计算,年增长量又如何计算 21、 普赖斯曲线的主要性质,特点时的文献累积量当年的文献累积量∞→---->+=-t t t F b ae k t F kbt κ)()0(1)( 22、 文献老化机理(现象) 内容:知识的时效性, 载体:物理的破损性, 理论:用户兴趣与 数模相对稳定性 (成本信价比提高) 23、 文献老化: 定义。。。。利用的减少论 内容的过时论 使用价值的衰减论 24、 方向: 文献老化理论—文献传播动态规律 /定量描述文献数模方法与老化规律 /文 献老化应用研究,指导馆藏建设等 25、 半衰期:在被使用的学科文献中,近期文献增长并占全部文献一半所花去的时间 26、 普赖斯指数 bt Ae t F A bt F =+=)(ln %100*)5(被引文献总引 量年被引文献P r ≤=λ λλ)(Ae t F ,bt ==)(0 ,4/1,2/1,4/31

生物信息学试题整理

UTR的含义是(B ) A.编码区 B. 非编码区 C. motif的含义是(D )。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是(B )。 A.登录号 B. 算法 C. RGR^ (D )。 A.在线人类孟德尔遗传数据 D.水稻基因组计划 下列Fasta格式正确的是(B) 低复杂度区域 D. 幵放阅读框 碱基对 D. 结构域 比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析,应使用(D) A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是(A )。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是(D )。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是(A)0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化 从cDNA文库中获得的短序列是(D )o A. STS B. UTR C. CDS D. EST con tig的含义是(B )o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR (AtDB)数据库是(C)o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是(D )o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

信息计量学

1.文献计量学:是采用数学统计方法,对各类文献的诸计量特征进行统计分析,进而揭示、研究文献情报规律,文献情报科学管理以及科学发展趋势的一门学科。 2.质量牵制原则:出版物的增长数量与其质量有关,不同质量的出版物有不同的出版速度;质量高的文献增长速度慢。 3.文献老化:科学文献随着其年龄的增长,逐渐失去了作为科学情报源的价值,越来越少的被用户利用的过程。 4.半衰期:某学科现在尚在被使用的全部文献中,较新的一半是在多长时间内发表的。 5.普赖斯指数:指在某一领域内,出版年龄不超过5年的被引证文献与被引证文献总数之比。 6.文献耦合:是指引用文献通过参考文献建立起来的耦合,如果A、B两篇文献共同引用了一篇或多篇相同的论文,则A、B两篇论文的关系即为耦合关系,也叫文献合配。 7文献信息流:文献所含情报的汇流称文献信息流。 8文献老化:科技文献随着其"年龄"的增长,其内容日益变得陈旧过时,失去了作为科学情报源的价值,以及因此越来越少被科学工作者和专家们利用的过程。 9科学生产率:个体科研人员在一定时期内所撰写的论文数量。 10引文分析:利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析,以揭示其特征和内在规律。 11影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。 12信息计量学:是以信息作为对象进行计量研究的学问,采用数学、统计学等定量方法,对信息基本循环图式所描述的社会化的信息交流过程中的信息组织,存储,分布,传递,相互引用和开发利用等进行定量描述和统计分析,以便揭示社会信息交流过程的数量特征和内在规律。 13网络信息计量学是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示七数量特征和内资规律的一门新兴学科。 文献信息老化的主要度量指标有哪两个?两者有何异同? 文献信息老化的主要度量指标是半衰期和普赖斯指数。两者既有联系又有区别。它们都是从文献被利用的角度出发,但以不同的方式来反映文献老化的情况。普赖斯认为,“有现时作用”的引文数量与“档案性”引文数量的比例,是比引文的“一半寿命”更为重要的特征。文献的“半衰期”只能笼统地衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一领域的全部文献,也可用于评价某种期刊、某一机构,甚至某一作者或某篇文章的老化特点。半衰期概念可以适用于一般情报老化,而普赖斯指数只适用于文献情报。 简述布拉德福定律的基本内容。 布拉德福定律的文字表述为:如果将科学期刊按照其登载某个学科论文载文率的大小,按渐减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。这时,核心区期刊的数量与相继各区期刊数量的关系将是1:a:a 2 ……。 a 为布拉德福常数,或称比例系数。图象描述:如果取上述登记排列的期刊序号(级数)的对数1gn为横坐标,以相应的论文累积数R(n)为纵坐标进行图象描述,可得到一条曲线。

信息计量学期末复习—Conway

信息计量学 1.简述文献计量学的主要进展(7个方面) ①每年发表的文献量增长较快,并逐步形成了本学科的核心情报源; ②确立并提高了学科的地位; ③主要分支领域的研究取得重要成果; ④文献计量工具和手段的现代化取得重要进展; ⑤专业教育起步快,发展迅速; ⑥形成了一支骨干队伍(核心研究队伍已基本形成); ⑦国际交流与合作发展势头良好。 2.信息计量学与文献计量学和科学计量学的关系(论述题) (1)信息计量学与文献计量学的关系:文献计量学是信息计量学的基础,信息计量学是文献计量学的发展方向。 ①首先,信息计量学着眼于“信息”本身的计量问题,文献计量学主要以作为情报载体的“文献”为计量对象(有时也涉及文献情报)。 ②其次,信息计量学较之文献计量学来说,其研究范围更广泛一些。 ③再次,从任务和方法上来看,信息计量学研究的任务更为艰巨,更难找到恰当的定量方法和途径。(2)信息计量学与科学计量学的关系: ①从研究目的来看,科学计量学主要是从定量的角度来探讨科学发展的内在规律,最终促进科学技术的进步;而信息计量学的目的也在于:一是探明科学文献本身的规律,以提高信息管理的科学性;二是通过信息规律的探讨,进而揭示科学技术的规律性。 ②从研究对象和方法来看,两者极为类似。科学计量学研究的科学文献及其数量也是信息计量学的研究对象之一。在方法上,两者都要运用数学和统计学的定量方法,对科学文献等信息进行定量的分析研究;在研究内容上,信息计量学与科学计量学在一个相当大的范围内是彼此交叉的。 ③但是,应当明确指出:信息计量学与科学计量学有着很大的区别。首先,信息计量学的范围要比科学计量学的范围广很多;其次,它们的研究目的是不一样的;最后,它们应用的领域也有所不同,信息计量学在文献,人才,学科,单位,数据评价方面发挥了很大作用,可以涉及的面非常广泛。而科学计量学在科学机制和科学政策的制定方面发挥了非常重要和独特的作用。 3.什么叫文献信息流,文献信息流的特性。 文献信息流:在信息计量学中,通常把文献所含信息的汇流称为文献信息流。由于文献是信息的最基本的载体形式,文献信息流是具有一系列主题特征的科学文献的集合,所以有时将文献 信息流简称为文献流。 特性:静态特性和动态特性。 4.什么叫格鲁斯下垂。 格鲁斯下垂:布拉德福曲线在进入直线部分后,并非无休止的直伸下去,后来总要弯曲下垂,因而使得布拉德福的图形变为明显的三个部分:上升的曲线部分—直线部分—弯曲下垂部分。 5.什么是文献老化和半衰期。 文献老化:科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全丧失其利用价值。(过程观认为文献老化是一种过程,状态观认为文献老化是一种 状态,过程状态辩证观认为文献老化既是一种过程又是一种状态。) 半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期);这与该学科一半文献失效所经历的时间(历时半衰期)。 6.什么叫普赖斯指数。 普赖斯指数:在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当做指数,用以度量文献的老化速度和程度。

2019版国科大生物信息学期末考试复习题

中科院生物信息学期末考试复习题 陈润生老师部分: 1.什么是生物信息学,如何理解其含义?为什么在大规模测序研究中,生物信息学至关重要? 答:生物信息学有三个方面的含义: 1)生物信息学是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和 解释的所有方面,是基因组研究不可分割的部分。 2)生物信息学是把基因组DNA序列信息分析作为源头,破译隐藏在DNA序列中的遗传语 言,特别是非编码区的实质;同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测;其本质是识别基因信号。 3)生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它 是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。 2.如何利用数据库信息发现新基因,其算法本质是什么? 答:利用数据库资源发现新基因,根据数据源不同,可分2种不同的查找方式: 1)从大规模基因组测序得到的数据出发,经过基因识别发现新基因: (利用统计,神经网络,分维,复杂度,密码学,HMM,多序列比对等方法识别特殊序列,预测新ORF。但因为基因组中编码区少,所以关键是“数据识别”问题。)利用大规模拼接好的基因组,使用不同数据方法,进行标识查找,并将找到的可能的新基因同数据库中已有的基因对比,从而确定是否为新基因。可分为:①基于信号,如剪切位点、序列中的启动子与终止子等。②基于组分,即基因家族、特殊序列间比较,Complexity analysis,Neural Network 2)利用EST数据库发现新基因和新SNPs: (归属于同一基因的EST片断一定有overlapping,通过alignment可组装成一完整的基因,但EST片断太小,不存在数据来源,主要是拼接问题) 数据来源于大量的序列小片段,EST较短,故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略。其主要步骤有:构建数据库;将序列纯化格式标准化;从种子库中取序列和大库序列比对;延长种子序列,至不能再延长;放入contig库①构建若干数据库:总的纯化的EST数据库,种子数据库,载体数据库,杂质、引物数据库,蛋白数据库,cDNA数据库; ②用所用种子数据库和杂质、引物数据库及载体数据库比对,去除杂质; ③用种子和纯化的EST数据库比对 ④用经过一次比对得到的长的片段和蛋白数据库、cDNA数据库比较,判断是否为已有序列,再利用该大片段与纯化的EST数据库比对,重复以上步骤,直到序列不能再延伸; ⑤判断是否为全长cDNA序列。 (利用EST数据库:原理:当测序获得一条EST序列时,它来自哪一个基因的哪个区域是未知的(随机的),所以属于同一个基因的不同EST序列之间常有交叠的区域。根据这种“交叠”现象,就能找出属于同一个基因的所有EST序列,进而将它们拼接成和完整基因相对应的全长cDNA序列。而到目前为止,公共EST数据库(dbEST)中已经收集到约800万条的人的EST序列。估计这些序列已覆盖了人类全部基因的95%以上,平均起来每个基因有10倍以上的覆盖率。)

华中师范大学情报学真题笔记(信息管理学基础 完全版)

信息管理学基础 第一章:绪论 1、信息的概念 (1)从信息的作用来定义信息,认为信息是“不确定性的消除”、“负熵”等。(没有揭示信息的本质) (2)从信息的范围来定义信息,认为信息是消息、知识、情报、数据等。(只指出了信息概念的外延,及信息的范围,定义应该表达概念的内涵) (3)从信息的内容来定义信息,认为信息是“交换的内容”。(已经注意到了信息的质的方面,但是a信息的范围没有划定,b这个“内容”到底是什么) (4)从本体论和认识论角度来定义信息,认为信息是物质的属性、规律、运动状态、存在标志等。 a、从本体论层次上来考察,信息是一种客观存在的现象,是事物的运动状态及其变化方,亦即“事物内部结构和外部联系的状态以及状态变化的方式”。 b、从认识论层次上看,信息就是主体所感知或所表达的事物运动状态及其变化方式,是反映出来的客观事物的属性。 (揭示了信息的本质,但不够通俗,并且从两方面定义,不便于对信息概念的整体把握)我们认为,信息是事物发出的信号所包含的内容。(此定义实际上包含了上面第三、四类观点,因此该定义基本上属于第三类定义,但事物发出的信号中所包含的内容,实质上是事物的存在方式、事物运动状态和相互联系特征的一种表达和陈述,也可以说是物质存在方式和状态的自身显示) 2、信息的属性 (1)普遍性。凡是有物质的地方必然存在着信息,相互之间也存在着信息交换。 (2)多样性。 (3)可识别性。信息在一定范围内可以被不同的主体所识别。 (4)可加工性。信息可以被汇总和组织、分析和综合、扩充和浓缩,也就是说人们可以对信息的内容将进行加工处理。 (5)与载体的不可分析。信息需要传递和保存,必须借助于一定的载体。 (6)与载体的独立性。绝大部分信息不会因载体形式的变化而改变其信息内容。 (7)可传递性。信息可以通过多种渠道进行传递或交流。 (8)可共享性。同一信息可以被很多人共同享用、同时享用。 (9)非消耗性。可以多次开发,反复利用。 (10)强时效性。信息老化和更替。 3、信息与相关概念的关系 (1)信息与知识、情报 知识是通过人脑加工过的自然和社会信息,是人们对这自然和社会形态与规律的认识和描述。知识具有社会性(知识区别于信息的根本属性)、语言性、积累性等基本属性。 情报是具有特定利用价值的动态知识。情报具有知识性、动态性(情报区别于知识的根本属性)和有用性等基本属性。 从三者的范围大小来看,信息>知识>情报,三者之间属于一种包含关系 (2)信息与数据

信息计量学_邱均平_模拟试卷三与答案

《信息计量学》模拟试卷三 年级:专业:姓名:学号: 一.单项选择 1. 以下不属于目前讨论的广义上的科学评价主要范围的是() A科学出版物评价B 信用评价C 科研工作评价D 学科评价 2. 科学文献的指数增长规律是由()率先提出的。 A齐普夫B 布拉德福C 普赖斯D 布鲁克斯 3. 齐普夫认为,在任何语言中,凡是使用频率()的词,功能总是不会太()。因为词义 本身在这个场合中价值(),因而传递它们所需要的“力”就不()。A低、小、小、大B 低、大、小、小C 高、小、小、大D 高、大、小、大 4. 信息计量学的发生发展符合恩格斯提出的()的结构模式:若从信息计量学的内容的发 生来看,它是服从()的;若从信息计量学的形式的发生来看,它是服从()的。 A双律性、他律性、自律性B 双律性、自律性、他律性C 自律性、双律性、他律性 D 他律性、双律性、自律性 5. 许多研究表明,引文的分布随时间呈现出一定的规律性。一般来说,随着年度的由远而 近,引文量呈()趋势,即时间愈(),被引证的文献愈()。

A减少、近、少B增长、远、多C 减少、近、少D 增长、近、多二.多项选择 1. 信息计量学的三个层次的体系结构分别是() A现象学层次B 元学层次C理论学层次D数学层次E 方法学层次 2. 下列指标中,属于文献信息统计中最常用的指标有() A流通量B 藏书利用率C 图书周转率D 读者借阅率E 时差系数F 情报吸收系数 3. 每一篇被引文献,对于引证者(论文作者)来说,就是有了一篇(),而对于被引证者 来说,则是有了一篇()。通常将这种相互引证的关系结构称为()。A引文网络B 参考文献C 参考网络D 引证关系 E引证文献、 4. 布拉德福分布存在着众多的分布模型,主要有() A 西蒙的随机模型 B 布鲁克斯的混合泊松分布模型 C 纳兰南的序性流模型 D 阿拉麦斯 库的科学势扩散模型 5. 布拉德福定律得基本原理是由其()和()两部分组成的。 A 数学表达 B 经验描述 C 区域描述 D 图像描述 三.简答题 1. 简述信息计量学研究的基本目的。 2. 试述信息计量学与文献计量学的关系。 3. 简述文献信息指数增长规律。

生物信息学复习题及答案(陶士珩)

生物信息学复习题 一、名词解释 生物信息学, 二级数据库, FASTA序列格式, genbank序列格式, Entrez,BLAST,查询序列(query),打分矩阵(scoring matrix),空位(gap),空位罚分,E值, 低复杂度区域,点矩阵(dot matrix),多序列比对,分子钟,系统发育(phylogeny),进化树的二歧分叉结构,直系同源,旁系同源,外类群,有根树,除权配对算法(UPGMA),邻接法构树,最大简约法构树,最大似然法构树,一致树(consensus tree),bootstrap,开放阅读框(ORF),密码子偏性(codon bias),基因预测的从头分析法,结构域(domain),超家族,模体(motif),序列表谱(profile),PAM矩阵,BLOSUM,PSI-BLAST,RefSeq,PDB数据库,GenPept,折叠子,TrEMBL,MMDB,SCOP,PROSITE,Gene Ontology Consortium,表谱(profile)。 二、问答题 1)生物信息学与计算生物学有什么区别与联系 2)试述生物信息学研究的基本方法。 3)试述生物学与生物信息学的相互关系。 4)美国国家生物技术信息中心(NCBI)的主要工作是什么请列举3个以上NCBI 维护的数据库。 ¥ 5)序列的相似性与同源性有什么区别与联系 6)BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么 7)简述BLAST搜索的算法。 8)什么是物种的标记序列 9)什么是多序列比对过程的三个步骤 10)简述构建进化树的步骤。 11)简述除权配对法(UPGMA)的算法思想。 12)简述邻接法(NJ)的算法思想。 13)简述最大简约法(MP)的算法思想。 14)简述最大似然法(ML)的算法思想。 ? 15)UPGMA构树法不精确的原因是什么 16)在MEGA2软件中,提供了多种碱基替换距离模型,试列举其中2种,解释其含义。 17)试述DNA序列分析的流程及代表性分析工具。 18)如何用BLAST发现新基因 19)试述SCOP蛋白质分类方案。 20)试述SWISS-PROT中的数据来源。 21)TrEMBL哪两个部分 22)试述PSI-BLAST 搜索的5个步骤。[ 3) 三、操作与计算题 1)如何获取访问号为U49845的genbank文件解释如下genbank文件的LOCUS行提供的信息: LOCUS SCU49845 5028 bp DNA linear PLN 21-JUN-1999

相关文档
最新文档