数据分析及统计技术应用规范软件公司
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析及统计技术应用规范
1 目的
为提高公司对质量数据进行统计分析的水平提供技术支持,加强各项工作,形成PDCA循环,提高产品质量管理水平。
2 适用范围
2.1 用户满意(包括不满意)信息
2.2 软件开发中间结果(如文档、代码)、软件产品测试结果、产品质量趋势2.3 软件研发过程(包括软件测试过程)能力
2.4 服务提供过程能力
2.5 人力资源管理、设备管理、用户需求获得过程、采购过程等的结果与能力2.6 内审、管理评审、过程检查、纠正措施、预防措施等过程的结果与能力
3 职责
行政部负责统计技术及其应用的研究。
其余部门按相关技术的要求进行数据统计与分析,行政部汇总。
4 统计技术
4.1 数据及其相关概念
4.1.1 数据的分类
计量型:指那些作为连续量测得的质量特性值,如长度、重量、强度、时间等。
计量型数据呈连续概率分布,典型为正态分布。
计数型:指那些按个数数得的非连续性取值的质量特性值,如软件的Bug数、审核中的不合格数。计量型数据呈离散概率分布,典型为二项分布和泊松分布。
4.1.2 数据的要求
针对性:针对第二章所列范围。
完整性:数据应能完整地反应被测量地过程,应能追溯,规定的表格应该填写全。准确型:数据应能真实准确地反映实际情况,原始数据不许人为篡改。
及时性:即使是很重要的质量信息,一旦过时,就失去使用价值。所以要明确数据地传递、反馈的时机和方式,做到及时记录、及时传递、及时处理、及时通知。
连续性:为掌握产品和体系的动态变化规律,必须保持数据的连续性。如果数据有中断,可能失去重要信息,影响分析结果。
统一性:数据的位数、表式统一。
4.1.3 管理模式
集中式:建立一个统一的信息管理中心,比如行政部,各职能部门将搜集到的数据交行政部统一加工后,再上报下发。
分散式:除行政部外,在某些职能部门中进行部门的分析统计,比如项目部对软件产品的测试结果进行分析,从而实现分层次管理。
4.2 数据整理
4.2.1 数据的离散性和规律性
每个软件研发批次,其过程质量数据(如千行Bug率、测试的覆盖率等)都有波动,称为数据的离散性。
这些波动一般都存在规律,反映了各批次人员素质、研发技术、软件测试技术、工作环境等实际情况。
行政部进行数据采集和分析的目的,就是为了找出数据的规律,从而为体系改进提供科学的根据。
4.2.2 数据的特征
对于某次抽样样本中的数据,可以计算除其平均值中值、偏差、方差、标准差等。这些数据的计算方法请参考初等数学中有关描述。
频数分布:按照一定间隔区间,将采样数据分为K组,统计出每个区间的数量,成为频数分布。其中K值按下表确定。当将频数的绝对值按K组用柱状图画
岛型的、锯齿形的。
正常型的表明数据分布正常;偏向型的表明该过程受到人为的干涉(这种干涉可能是好的,也可能是坏的);双峰型表明样本来自两个总体,比如两个开发团队开发的代码;孤岛型的数据显示出在远离主分布的地方出现少量的分布,表明在这个过程中出现了较明显的因素波动;锯齿型表明分组不当或测量误差过大。
4.3 数据分析
4.3.1过程能力
4.3.1.1影响过程能力因素
影响过程能力的因素包括5M1E:
人(Man),即公司员工,可通过招聘、培训、绩效考核等方法进行提升;
机(Machine),即开发、测试用设备,可通过采购升级、维护、培训等方法提升;
料(Material),即原材料,如买的中间件、数据库等,可通过调研、采购等方法提升;
法(Method),即管理模式、开发模式、采用技术等,可通过软课题研究、培训等方法提升;
测(Measurement),即测量过程的能力,可通过对测量设备升级、培训等方法提升;
环境(Environment):可对办公环境、绩效考核升职规划等硬软环境的提升得到改善。
可以对以上5各方面的因素进行有机的调整,以提高过程能力。
4.3.2分析方法
4.3.2.1调查表
在质量管理活动中常用调查表来收集数据。因为调查表用起来简便而且能自行整理数据,便于以后的统计分析,所以得到了广泛的应用。调查表的项目和形式要与产品、过程的要求相适应,对不同的目的要求要制订不同的调查表。调查表可以分为以下几种:
(1)瑕疵位置调查表
对于外观瑕疵,如碰伤、脏污等,可将瑕疵标注在产品外形图或展开图的相应部位上。
(2)不良项目调查表
为了调查生产过程中发生的不良项目以及各种不良项目所占的比率,可制订像如下表那样的调查表。每当发生不良时,就在相应栏里记一符号,到一天工作
4.3.2.2排列图
影响产品质量的因素虽很多,但只有关键的少数因素(不超过20%)起着重要作用(对结果的影响占80%),这种规律首先是由意大利经济学家派累托(Vifredo Pareto)提出的,并得出一种能反映出这种规律的图,称派累托图,中文一般称为排列图。
作排列图的步骤一般如下:
1、整理记录,确定作图的分类项目。
为了作排列图,首先要定出分类方法及项目。
2、定出作记录的期限。
根据实际情况定出容易汇总数据的期限,只要有足够的数据就可以,时间不宜过长。
3
4
隙。
5、划累计频率折线
将累计频率按每个项目分别点入图内,画出连接点与点的折线。
%
%
%
%
%
从图上,我们可以看到对结果影响最大的占累积频率70%到80%的项目只有前面的两项,这两项占据不合格品率的80%,因此可视为关键因素,亦即只要解决了这两项的质量问题,产品合格率就会大大提高,所以排列图为我们提供了应着手改善的重点项目。
对排列图的效果验证,可以通过对采取措施前后的排列图进行比较发现。
1、如果如果改进措施有效,排列图在横轴上的项目顺序应有变化;
2、当项目的顺序有变化而总的不合格品数仍没有什么变化时,可认为是生产过程仍然不稳定,未得到控制,应继续找原因;
3、各项目不合格品同时减少时,说明纠正措施效果良好;
4、经改善后,最高项与次高项一同减少,但顺序未变,说明这两项相关;
5、一旦确认了改善后的效果,就应修订响应操作规程,将改进成果巩固下来。
4.3.2.3因果图
因果图也称特性要因图,俗称鱼刺图。其作用就是把产品存在的某个质量问题以及产生这个问题的诸原因加以分析和分类,用一树枝状的图形将其间的因果关系表示出来。如下图所示:
通过作排列图,我们知道控件上图片不够美观是影响界面效果的最重要。为了解决这个问题我们用因果图来分析造成输出不稳的原因。画因果图的步骤如下:
1、明确要管理的特性。问题的确定是通过广泛的调查研究、征求有关人员意见,利用排列图作出来的。
2、画出特性(结果)与主干。在右端画一方框,将要管理的特性填人其中。然后从左向右画一个带箭头的粗线作为该问题的要因图。
3、选取影响特性的要因。先画大枝,在尾端记人大分类的要因并围以方框。对大分类的要因细究下去,再在图上画出中枝、小枝、细枝,直至找到可采取措施的原因为止。
4、第四步:检查要因是否有遗漏,如有应补上。
5、对特别重要的要因附以标记,作为要重点改善的项目。
作因果图时应注意:
1、对特性(结果)要提得具体,不能只说X X的质量不好,要具体指出X X 的什么质量特性存在什么问题。
2、一个特性作一张图。