药品数据统计分析与应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11、统计分析的两类错误和风险:
第一类错误:把质量好的一批成品当作质量坏的一批成品去看待、处理的错误;
α:第一类错误的概率值,也叫第一类错误的风险率。
第二类错误:把质量坏的一批成品当作质量好的一批成品去看待、处理的错误;
β:第二类错误的概率值,也叫第二类错误的风险率。
12、药品抽样检验的风险:抽样检验是由样本的质量状况去推断总体的质量是要冒风险的。
7、数据分析的前处理(筛选)
数值的修约(GB/T8170-2008)
四舍六入五考虑,五后非零则进一,五后全零看五前,五前偶舍奇进一,不论数字多少位,都要一次修约成。
修约的位数:试验运算中,应比规定的有效数字多保留一位数,后根据有效数字的修约进舍至规定有效位。标准差一般按二位有效即可,最多保留小数点后二位。
4.1、散点图:又称相关图,是研究成对出现的两组相关为数据之间相关关系的简单图示技术。用来发现、显示和确认两组相关数据之相关关系,并确定其预期关系。
4.2因果图:又名特性要因图,表示结果(特性)与原因(影响特性的要因)之影响情形或两者关系之图形。定性寻找引发结果的原因。
4.3排列图:又叫柏拉图。它是将质量改进项目从最重要到最次要顺序排列而采用确定主导因素的一种图表。
第1步:计算方法六个结果的平均值: =93.45%
第2步:计算极差R=94.0=93.9=0.7
第3步:计算可疑值与增均值之差的绝对值再用极差除: =(91.0-93.45)/0.7=0.79
第4步:与临界值t=0.76(n=6)比较
ti=0.79>t=0.76,说明94.0%是一个离群数据,应舍弃。
下控制线UCL= -3S
4.4.4控制图——过程控制的核心手段
(1)分析用控制图
主要分析:①所分析的过程是否处于统计控制状态;
②该过程的过程能力指数是否满足要求,达到技术稳态。须将过程调整到技术稳态。
(2)控制用控制图:当过程达到了所确定的状态后,才能将分析用控制图的控制线作为控制用限,进入日常管理后关键是保持所确定的状态。
数据筛选的方法
(1)按美国E·J鲍尔推荐的方法进行处理。步骤如下:
1计算这群检测值的平均值;
2计算极差R;
3计算可疑值Xi与平均值之差的绝对值,再用极差R除,得出ti与规定附表的临界值比较,若ti比表上的t值大,则应弃去此可疑值。
4附表如下:抛弃无效测量的临界伸值
n
3
4
5
6
7
8
9
10
11
12
13
14
三、GMP实施中常用的数据分析工具
1、描述性统计技术
用来对统计数据进行整理和描述的技术。主要有:折线图、饼分图、因果图、树图、排列图。
2、推断性统计技术:
在统计数据描述的基础上立新功,对所反映的问题再进行分析解释和作出推断性结论的技术。主要有:控制图(分析用图)、回归分析、假设检验。
3、过程控制所用的技术:下次试验、过程能力、控制图(控制用图)
98.02
98.11
移动极差RS
0.01
0.26
0.16
0.35
0.04
0.15
0.44
0.09
控制图:minitab15
结论:
含量X的单值控制图检验结果
检验1。1个点,距离中心线超过3.00个标准差。
检验出下列点不合格: 7
检验5。3点中有2点,距离中心线超过2个标准差(在中心线的同一侧)
检验出下列点不合格: 2
4、常用质量分析图的应用
序号
名称
作用
1
折线图
直观地表现出数据的变化趋势
2
饼分图
表示一个系统中各部分所占比率
3
散点图
判断两个质量因素之间的相关性
4
因果图
分析原因与结果的关系,找到问题的原因
5
树图
对主题构成因素进行系统分析展开
6
排列图
寻找影响产品质量的主要问题
7
控制图
判断生产过程是否异常及导致导常的因素
0.84
批号
9
10
11
12
13
14
15
16
含量
98.08
98.02
98.08
97.87
98.28
97.55
97.44
97.73
移动极差RS
0.18
0.06
0.06
0.21
0.41
0.73
0.11
0.29
批号
17
18
19ห้องสมุดไป่ตู้
20
21
22
23
24
含量
97.72
97.46
97.62
98.27
98.31
98.46
(3)控制界限就是区分偶然波动与异常波动的科学界限。
[实例3]某制药厂生产××链霉素×年×月的含量(%)控制如下表,分析本月的生产控制情况
批号
1
2
3
4
5
6
7
8
含量
97.24
97.31
97.67
97.80
97.89
97.96
97.06
97.90
移动极差RS

0.07
0.36
0.13
0.09
0.07
0.90
4.4.8.1判异的理论基础是“小概率事件原理”
小概率事件原理又称小概率事件不发生原理,其数学定义是:事件A发生的概率很小(如0.01),现经过一次或少数次试验,事件A居然发生了,就有理由认为A的发生是异常。
统计方法的应用是为捕捉异常先兆。因此,在应用前应确定小概率α,小概率α实际是允许判断错误的概率,称为风险度、风险概率、风险水平或显著水平。根据被判断事物的重要度,α可取0.01、0.05、0.10等。与风险度α相对应的是置信度(1-α),又称为置信概率、置信水平。由于风险度α不可能为“0”,所以置信度(1-α)不可能为100%。
结论:有经验的色谱工作人员很容易将RSD控制在1%以内,可认为该实验人员的技术还不够稳定,操作不够熟练。
5、数据分析的基础
制药生产现场的数据是分析的基础,生产工序的稳定是收集可靠数据的前提,抓住生产现场的六大因素是生产的关键。
6、数据分析的形式
算一算:特征数
看一看:动力变化
比一比:统计值
找一找:相关因素
检验6。5点中有4点,距离中心线超过1个标准差(在中心线的同一侧)
检验出下列点不合格: 24
含量X的MR控制图检验结果
检验1。1个点,距离中心线超过3.00个标准差。
检验出下列点不合格: 7
4.4.5控制图的判断有判稳和判异两种判断方法
4.4.6控制图判断的两类错误
第Ⅰ类错误:弃真概率α(虚发警报)
由于休哈特确定了3σ原则,所以弃真概率α=0.0027,数值很小。
第Ⅱ类错误:取伪概率β(漏发警报)
由于α=0.0027数值很小,所以导致取伪概率β的数值很大。
4.4.7判断的概念
由于α=0.0027数值很小(虚发警报的概率很小)。所以在控制图中打1点超界就判异,置信度达99.73%,很可靠。
由于β数值很大(漏发警报的概率很大)。所以,在控制图中打1点在界内就判稳,置信度很低,不可靠。
(1)数据是信息的载体;
(2)数据统计是数据转为信息的加工过程,统计技术是企业质量体系中的一个重要要素,分析数据,控制过程中的异常,坚持不懈地持续改进,提高产品质量,提升企业的核心竞争力。
4、数据是企业的无形资产
掌握现状
工序调节
工序管理
检查和评价
分析和改进
二、数据分析的有关基础知识
1、数据分析的类型
4.4控制图:是地过程质量特性值的数据进行分析和判断工序是否处于稳定状态所使用的带有控制界限的图。从而监察过程是否处于控制状态的一种用统计方法设计的图。
4.4.1作用:对生产过程进行监控发现异常,及时告警;
4.4.2控制图的种类:
分析用控制图
控制用控制图
4.4.3其结构:中心线CL=
上控制线UCL= +3S
(2)G—检验法(格鲁布斯法)
步骤:
1算出包括可疑值在内的平均值;
2计算可疑值与平均值之差;
3算出包括可疑值在内的标准偏差;
4用标准偏差除可疑值与平均值之差得G值:
5查G的临界值表,若计算的G值大于查到的值,就可把可疑值舍弃。
,查表G(6,0.05)=1.89,所以这个值应舍去。
Grubbs检验法的临界值
2、数据是实施GMP管理的支持
数据是一各观测值,是实验、测量、观察、调查等活动中以数量的形式给出的结果。数据分析是企业有目的地收集数据、分析数据,使之成为信息的过程,这一过程是在产品的整个生命周期的支持过程;是实施GMP管理的支持,是建立并实施高质量的药品质量体系的支持过程。
3、数据统计分析——质量管理体系的支持过程
描述性数据分析:是对一组数据的各种特征的分析,以便描述测量样本的各种特征及其所代表的总体的特征;
推断性数据分析:也叫探索性数据分析,是为了形成值得假设的检验而对数据进行分析的一种方法;
验证性数据分析:是对社会调查数据进行的一各统计分析。通过因子间的关系是否符合研究者所设计的理论;
2、定量数据的分类
计数值数据:不能连续取值的数据;
12.1生产方风险(PR):对于给定的抽样方案,当批产品或过程质量水平(如不合格品率)为某一指定的可接收值(如可接受质量水平)时的拒收的概率,即把质量好的批产品判为不合格,用α表示。
12.2 使用方风险(CR):对于给的抽样方案,当批产品或过程质量水平为某一指定的不满意值(如极限质量水平)时的接收概率,即把质量差的批产品判为合格,使用方风险一般用β表示。
15
20
t
1.53
1.05
0.86
0.76
0.69
0.64
0.60
0.58
0.56
0.54
0.52
0.51
0.50
0.46
注:用分式 计算t,如计算值超过表上的值时,则所调查的值是无效的,此概率约为0.95。,
[实例2]某分析者对一样品检测,得:93.3% 93.3% 93.4% 93.4% 93.3% 94.0%,问:第六个结果有效吗?
计量值数据:可以连续取值的数据;
差别:当数值是百分率时,取决于给出数值的数学式分子,分子为计量值,则求得的百分率是计量值;如分子为计数值,求得的百分率虽不是整数提也属于计数植。
3、值得注意的概念
总体:指所要研究的对象的全体;
个体:指组成总体的每一个基本单位;
样本:从总体中随机抽出的一部分样品,样本中所包含榈数目称为样本大小,又叫样本量,常用n表示;
21
2.73
3.03
10
2.29
2.48
22
2.76
3.06
11
2.36
2.56
23
2.78
3.09
12
2.41
2.64
24
2.80
3.11
13
2.46
2.70
25
2.82
3.14
14
2.51
2.76
8、质量特性值的正态分布
绝大多数质量特性值服从或近似服从正态分布。正态分布的中心点(均数)最高,然后逐渐向两侧下降,以均数为中心,两端对称,永远不会与X轴相交的钟形曲线。
4、数据的特征值
位置特征值:子样平均值
了样中位数量
差异特征量:极差
标准差
相对标准差
[实例1]对气相层析的实验人员进行技术考核,进样10次,每次0.5ul,得色谱峰高(mm)为:
142.1 147.0 146.2 145.2 143.8 146.2 147.3 150.3 149.9 151.8
=146.98s=3.00 RSD=2.04%
13、关于样本
13.1 样本要有代表性:要代表总体,如果做不到这一点,将导致对总体特性作出不良估计;
13.2 样本也会产生误差:即使样本代表总体,但从样本得到的信息也会产生一定程度的误差,这种误差的大小可增大样本量来减小但却不能消除。
14 百分比抽样的不科学性
在百分比抽样中,在相同的批不合格品率的情况下,产品批量越大,则批的接收概率越小,产品批量越小,则批的接收率越大,即“大批量严,小批量宽”,不能正确鉴别批产品的质量水平,所以,这是一种不科学的抽样检验方法,工业发达国家早已淘汰。
范围
机率
μ±0.67σ
50.00%
μ±1σ
68.26%
μ±1.96σ
95.00%
μ±2.0σ
95.45%
μ±2.58σ
99.00%
μ±3σ
99.73%
10、产品质量波动
10.1正常波动:同随机原因引起的产品质量波动,生产过程在控制中,呈稳定状态;
10.2异常波动:同系统原因引起的产品质量波动;引起波动的原因5M1E:人、机、料、法、环、测……,生产过程在失控中,呈不稳定状态。
但是β<1,所以连续打m点进行判稳,β总=βm数值很小,很可靠。
判稳准则
在控制图中连续打m点,界外点数≤d时判稳
(1)m=25,d≤0,即,25点不得出现一点在界外。
(2)m=35,d≤1,即,35点允许出现一点在界外。
(3)m=100,d≤2,即,100点允许出现两点在界外。
4.4.8判异准则的制定
药品数据统计分析与应用
一、导言
1、我们面临大数据时代的挑战
数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。——麦肯锡
大数据时代已经降临,在商业、经济及其它领域中,决策将日益基于数据和分析而作出,项并非基于经验和直觉。——《纽约时报》
测定次数
置信界限
测定次数
置信界限
95%
99%
95%
99%
3
1.15
1.15
15
2.55
2.81
4
1.48
1.50
16
2.59
2.85
5
1.71
1.76
17
2.62
2.89
6
1.89
1.97
18
2.65
2.93
7
2.02
2.14
19
2.68
2.97
8
2.13
2.27
20
2.71
3.00
9
2.21
2.39
相关文档
最新文档