“网评结果分析”解题思路

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五问:评阅区分度不降,工作量节省多少
各种计算方案,大致为20%
16/20
第六问:想法合理性
首先说清楚纳入网评成绩的利弊所在。 不在乎你提什么方案,而在乎你如何分析你
的方案。 要说服别人,先说服自己
17/20
题目技术要求不高,重在思考能力与分析能力。 但是在此项上总体得分较低,反映不善于深入思考, 流于表面、浅显,珍惜训练机会,习惯养成很重要。
6/20
验证: 由数据统计得到:α =0.49,β =0.707, 代入得:λ = α + 3/4(1- β) = 0.709 实际最终平均通过率为:λ = 0.7 误差在合理范围内,结果可以接受。
7/20
第二问:相关性结论
通过数 一等奖
1 2 3 0 2.87% 8.40%
二等奖
3.15% 21.00% 43.73%
λ=0.86),没有发现此结果与数据统计结果差距太大。
前者反映了思考深度不足,后者反映了严重缺乏建模
经验,模型检验意识缺失。
3/20
介绍一种解题思路。 设每一评委的通过率均为α,任意两评委的一 致率为β,显然β与通过率α无关。 根据数据统计可得:
题目 A B 一致率均值 一致率标准 相同论文数 差 均值 β 0.6964 0.6771 0.2387 0.2809 7.7922 4.7968
三等奖
30.04% 35.72% 33.33%
成功参赛奖
66.80% 40.39% 14.52%
8/20
第三问:公正性与评阅水平的度量
公正性:上偏差与下偏差比较,后者是否明显大,即是
否有“主观压分”现象
评阅水平:与最终成绩的偏差大小,逆序
单用网评一致度来评价水平不妥,用通过率偏差也不妥
主要与最终成绩做比较,而且应分轻重,仅计算次数是
C
D
0ຫໍສະໝຸດ Baidu7288
0.7245
0.1803
0.2374
12.8242
7.3992
据此取β=0.707。
4/20
假设: 1. 评委个人通过率为α,评委一致率为β,且β与α无关; 2. S1+S2+S3+S4=1; 3. S3+S4=α; 4. S1与S4中的论文不会发生误判,即S1中的论文一定被判为“不
谢 谢!
14/20
题目开放性的排名由高至低为:B A C D(第四组)
题目 A B C 一致率标准 一致率均值β 差 0.6964 0.6771 0.7288 0.2387 0.2809 0.1803 相同论文数 均值 7.7922 4.7968 12.8242
D
0.7245
0.2374
7.3992
15/20
2013-7-8
1/20
1. 第一问:评委一致性度量指标
大部分队结论:
1- λ = (1-α)3,
α(1/2)= 0.2063
α(2/3)= 0.3066
2/20
点评:首先,将α当作任一篇论文的通过概率是错误
的,每篇论文按照水平高低不同,其通过的概率是不
同的。α应当是通过文章数量的平均值。
其次,实际上,α=0.48,λ=0.7 (按上式计算:
11/20
12/20
13/20
• 第四问:整体表现分析是否符合实际 整体表现差异指题目差异,而非评委差异。 A:有杆抽油系统的数学建模及诊断 B:基因识别问题及其算法实现(较难评)
C:基于卫星云图的风矢场度量模型与算法探讨
D:基于卫星无源探测的空间飞行器主动段轨道估计与
误差分析(有唯一正确结果,较好评)
通过”,而S4中的论文一定被判为“通过”;
5. S2,S3两个区域中的论文各有50%的误判率,并且S2=S3.
5/20
推导: 记S2=S3=S,据假设1、2、4、5有: β = S1+S4+(S2+S3)/2 = 1-S S = 1- β
1-λ = S1+(S2+S3)/23 = S1+S/22 = 1- α-S+ S/22 = 1- α –3/4 (1- β) 所以,λ = α +3/4 (1- β) α = λ – 3/4(1- β) α (1/2) = 0.28 α (2/3) = 0.45
不合适的。
9/20
第一组:β1=24, β2=4, β3=3 好:42,54,86,08,38 差:09,24,61,37,57
第二组:无效评分比例
第三组:偏差 好:88,87,89,17,27
差:32,37,61,57,85
差:82, 24,57,13,84
10/20
第四组
不落窠臼,思维有深度的表现
数据信息发掘是考点之一,也是数学建模竞赛的
趋势之一,例如一致率,上偏差,下偏差,超常评
判等。
18/20
模型检验意识不强。 单向思维要避免,综合思维要加强。例如, 各种评阅水平指标的引入,应当有切合实际
的利弊分析,否则,显得青涩,缺乏成熟度。
写作规范性及流畅性存在不同程度的问题。
19/20
相关文档
最新文档