Burrell公式及修正式与广义Egghe公式的比较与评价
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Burrell公式及修正式与广义Egghe公式的比较与评价
张贤澳(福建农林大学情报研究所福建 350002)
Burrell 公式及修正式与广义Egghe 公式的比较与评价
Abstract :Burrell s formula is a resul t of Q.L.B urrell s quanti tative discussion of Professor R.W.Trueswell s 80/20law.But,whether Burrell s formula and the related corrective formula can apply to scien tific essays,explaining and de picting the concentrated distribution among scientific researchers,this article gives a negative answer by the use of the gen eralized Egghe s formula and the test of the empirical data.
Keywords :bibliometrics;comparative study/Burrell s formula;the generalized Egghe s formula
英国曼彻斯特大学伯勒尔(Q.L.Burrell)先于埃格黑(L.Egghe)用定量解析的形式讨论了美国工程学教授特鲁斯威尔(R.W.Trueswell)提出的!二八律?,得到
= ( ln +1)
(1)
其中, =
1!ln (1-
1!
)!为给定的时间内馆藏文献的平均流通次数。
公式(1)
的含义为: (%)的馆藏满足 (%)的流通量,我们将
表1 Burrell 公式及修正式计算结果与实际统计结果比较
1论文数2作者数3
作者累积数4论文累积数5 实际统计值%6 实际统计值%7
*理论
值%8
| -
*|9
依表2取值 *计算值%
10
| - *|11
依表2取值
*计算值%12
| - *
|3611360 030 690 220 00470 220 00470 220 004735~2301360 030 690 220 00470 220 00470 220 00472212580 071 110 400 00710 400 00710 400 00712113790 11 520 580 00940 580 00940 580 009420251190 172 280 910 01380 910 01380 910 013819051190 172 280 910 01380 910 01380 910 013818051190 172 280 910 01380 910 01380 910 013817051190 172 280 910 01380 910 01380 910 013816161350 202 591 060 01531 060 01531 060 015315171500 242 881 210 01661 210 01661 210 016614071500 242 881 210 01661 210 01661 210 016613181630 273 131 360 01771 360 01771 360 017712191750 313 361 510 1851 510 01851 510 0185115142300 484 412 200 02212 200 02212 200 0221108223100 755 953 230 02723 230 02723 230 027********* 956 993 960 03033 960 03033 960 0303816444921 509 445 760 03685 760 03685 760 0368725696672 3512 88 320 44816 640 038416 640 03846361058833 5716 9411 650 05323 290 063519 800 028556216711935 6822 8916 730 061630 120 072325 100 022149726415818 9730 3423 660 066837 860 075233 130 02793223487225016 5543 1836 770 064151 480 08347 800 04622506993326233 7562 658 650 39570 370 077864 510 01911 1949
2942
5211
100
100
120
0 20
100
注:在Burrell 公式计算中n=2 268,!=1 771244。
#
37#?情报理论与实践?
省教育厅资助课题,项目编号J A01124S 。
ITA 实践研究
其称为Burrell公式。
伯勒尔用公式(1)计算的结果与实际统计结果相比较,二者基本相符,这说明 > 的确存在,但却不可能达到 =20%的有效馆藏满足 =80%流通的需要这种集中程度。
埃格黑受伯勒尔工作的启发,以狭义洛特卡定律为基础,导出了E gghe公式,应用Egghe公式可以从理论上粗略地说明,!二八律?用于科技论文在科技工作者中分布的可能出现,但!要近似地等于5[1]。
既然Egghe公式能够描述科技论文在科技工作者中的集中分布,而且埃格黑受伯勒尔工作的启发,那么,由于Egghe公式只局限于参数n=2的情况,对于n%2时,Bur rell公式是否也可以用于描述科技论文在科技工作者中集中分布?20世纪90年代初,我国学者曾做过这方面的尝试[2,3],认为几乎可以不加任何修改地移用B urrell公式。
事实上,B urrell公式应用于科技论文在科技工作者中集中分布的描述,与Egghe 公式一样都存在局限,公式中只考虑参数!,而没有考虑学科特征参数n(广义洛特卡定律)。
因此用经验数据验证Burrell公式,缺陷是明显的,即Bur rell公式的计算结果与经验数据的统计结果相去甚远。
采用文献[4]统计的科学生产率的数据,运用Bur rell公式,以实际的值代入计算,将实际的值与计算得出的*理论值进行比较,如表1的第1~8列。
由于li m
(ln +1)=0
补充定义 ( )=0 ?(-(,0] (ln +1) ?(,1] 1 ?(1,+()
不难看出,Burrell公式具有分布函数的基本性质,即非负性、非减且连续, (+()=1,因此可以将Burrell公式形式地看成分布函数,在0 01显著水平下,柯尔莫哥洛夫检验的最大容许值为1 63/5211=0 0225,显然由表1第8列max| - *|=0 0668>0 0225,Burrell公式与经验数据不符。
文献[2]也注意到这个问题,提出在Burrell公式中增加一个调节系数?,即
=? (ln +1)(2)而?的取值,随所处的区间不同而不同,实际上,?是一个的分段递减函数,见表2。
表2 ?( )的取值
0 1~0 20 2~0 30 3~0 40 4~0 50 5~1?( )2 01 81 61 41 2
文献[2]认为?的取值是经过大量的运算而归结出来的,具有普遍的可操作性。
但遗憾的是,纯粹凭有限的经验数据的规范和提炼归结出来的经验?值,往往缺乏普适性和可靠性。
很显然对于(1)式,当=1时, =1,一旦乘上一个系数,溢出的情况必然发生,即当=1时,却有=1 2。
如果不论这个误差,使用(2)式,同样利用表1的著者科学生产率数据,计算结果max| - *|的值为0 083反而大于用(1)式计算的结果,这说明对于文献[4]的经验数据使用调节系数并没有改善Burrell公式,反而使情况更糟,见表1第9~10列。
文献[3]认为,表2?取值不尽合理,而且失之过简,建议?取值依发表的论文数2~6取值,见表3。
表3 ?按论文数取值表
论文数234567))?1 11 31 41 51 7?
依然使用表1的著者科学生产率数据,按表3?取值计算,在论文数为2,3,4,5,6处,理论值 *有所改善,最大绝对偏差有所降低,相对于依表2取值, *更贴近实际的统计结果,见表1的第11~12列。
但最大绝对偏差仍为4 62%,且撰写论文7至最高产著者论文数的?值,文献[3]认为难以统
一,即难以从现有的经验数据中寻找到具有可操作意义的?值。
Burrell公式是在简单流通模型的基础上导出来的一个适用于馆藏流通问题的公式,将其移用于科技论文在科技工作者中集中分布的描述,虽然与Burrell公式所揭示的少量的文献在流通中起主要作用,在意义上有相通之处,但他们所解释的对象却有很大的差别。
对于每一个图书馆来说,馆藏与读者因素各异,但用一个馆藏流通平均值也许可以综合反映他们之间的差别,而对于科技工作者群体著述能力的差别,不但存在学科之间的差异,而且还存在平均科学生产力的高低。
Burrell公式中只包含均值!,而没有学科之间科技论文在科技工作者中集中分布程度反映的变量,将Burrell公式移作它用,显然是不合适的。
如果Burrell公式的修正朝这个思路开拓,也许能获得一个与实际情况比较贴切的结果。
事实上,现在已不必在Burrell公式上修修补补,而只要利用广义Egghe公式即可[5]。
在n%2的情况下(n=2时,可用Egghe公式): =
1
2
n+1
n-1
(2-n)!+n
1-n
2-n
1
2
n+1
n-1
(2-n)!+n
1-n
2-n
-
1
2
(1+n) -
1
2
n+1
n-1
(2-n)!+n(1- )+
1
2
n
1-n
2-n
1
2
n+1
n-1
(2-n)!+n
1-n
2-n
-
1
2
(1+n) *=1?
#
38
#?第26卷2003年第1期? 实践研究ITA =1
2
n+1
n-1
(2-n)!+n
1-n
2-n
-
1
2
n
1-n
2-n
1
2
n+1
n-1
(2-n)!+n
1-n
2-n
-
1
2
(1+n)
令 k=1-n 2-n A=1
2n+1
n-1
(2-n)!+n
则 =A k-A k- 1
2
(n+1) *r
1
k
-A
1
2
n-A
或 =A k-A k-(
1
2
n)k *
1
k
-A
1
2
n-A
(3)
同样使用文献[4]的科学生产率数据,用(3)式计算,即将 *实际的统计值代入广义E gghe公式计算,计算结果如表4所示。
表4 广义Egghe公式计算结果
论文数实际统计
值(%)
实际统计
值(%)
广义Egghe公式
计算 *值(%)
| - *|
360 030 690 20580 0048 35~230 030 690 20580 0048 220 071 110 47730 0063 210 101 520 67880 0084 200 172 281 14240 0114 190 172 281 14240 0114 180 172 281 14240 0114 170 172 281 14240 0114 160 202 591 33830 0125 150 242 881 59690
0128 140 242 881 59690 0128 130 273 131 78890 0134 120 313 362 04260 0132 110 484 413 09130 0132 100 755 954 66710 0128
90 956 995 77130 0122
81 509 498 5750 0087
72 3512 8012 3750 0043
63 5716 9417 0180 0008
55 6822 8923 5680 0068
48 9730 3431 5350 0119
316 5543 1844 6550 0148 233 7562 6063 5040 0090 11001001000 公式(3)具有分布函数的基本特征,非负性、非减且连续、(1)=1,适当补充定义,也可以将(3)式形式地看成是分布函数。
表4中max| - *|=0 0148远小于0 01显著水平下柯尔莫哥洛夫检验最大容许值0 0225,这说明(3)式与经验数据是相符的。
广义Egghe公式是以广义洛特卡定律为基础的,与表2、表3两种?取值函数的Burrell修正式或Burrell公式本身相比,无论是数值计算的精度还是理论基础,广义Egghe公式显然优于Burrell公式及其修正式。
?
参考文献
1 丁学东文献计量学基础北京:北京大学出版社,1993
2 王崇德关于Price定律的研究情报学报,1990(3)
3 王正兴进一步修正Price定律的建议情报科学,1991(4)
4 刘丽华 +高等学校化学学报,论文著者服从洛氏分布的统计
分析情报学报,1997(增)
5 张贤澳 Egghe公式的推广:基于广义洛特卡定律的与的关
系情报学报,2001(5)
作者简介:张贤澳,男,1946年生,研究员。
已发表论文60篇。
收稿日期:2002 04 18
(上接第45页)
思想不相吻合,与企业自身的特点不一致,而业务流程的设计被强迫与新的信息系统一致,或是企业文化与新技术相抵触,员工未得到很好的
培训,传统观念没有改变等等。
这些都可能导致业务流程再造的失败。
4 结束语
几年来,企业业务流程再造一直是企业管理者!心中的痛?。
企业若不改造,肯定会落后于形势;实施再造工程,见过的失败教训太多。
但是失败的症结在哪?那些成功的改造中有哪些是值得我们借鉴的?他们的共性又是什么?只有找到了有规律性的东西,企业再造才能普遍推行,成功的机会才能增加。
研究业务流程中的信息管理问题也许能找到这些规律。
但即使有了这些规律,也还需要企业能够认识它、掌握它,并把它融入到企业文化当中,只有这样,企业才算是真正意义上的现代化企业。
?
参考文献
1 Hammer M,Champy J.Reengineering the Corporation:A Manifes to
for Busi ness Revolution.Ne w York:Harper Collins Publis hers Inc, 1993
2 芮明杰主编再造流程杭州:浙江人民出版社,1997
3 Integration Definiti on for Functi on Modeling Available fro m:http://
/doc/2c4637001.html,/Downloads/pd f/idef0.pdf
4 Hammer M.Reengineering Work:D on t Automate Obli terate Harvard
Business Revi ew,1990,7/8
5 客户关系管理Available from:http://as /doc/2c4637001.html,/
6 D avenport T H.Saving I T s Soul:Human centered Information M an
agement.Harvard Busi ness Review,1994,3/4
作者简介:李枫林,男,1962年生,博士生。
收稿日期:2002 03 04
#
39
#
情报理论与实践? ITA 实践研究。