基于主成分分析的考试成绩与能力相关性研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

映全部数据的信息[2]遥
1.2 主成分分析步骤
设研究某一事物涉及到 p 个分量袁每个变量都有 n
个数据袁可以得到一个 n伊p 阶的矩阵袁将其记为公式
x 噎 x 杉山
山 11
煽衫 1p 衫


渊1冤[3]院X
= [ x ij
] np
=
讷 山
山 山


衫 衫 衫


x 噎 x 山
删山 n1
衫 np 闪衫
12 科技视界 Science & Technology Vision
Science & Technology Vision
科技视界
高的学生能力偏重设计袁而施工能力偏弱遥 第 四 主 成 分 F4 中 袁 结 构 力 学 袁 砌 体 结 构 袁 混 凝 土 结
0 . 0314 0 . 031 0 . 0304 0 . 027 0 . 026 0 . 0202 0 . 0188 0 . 0174 0 . 0138
81 . 54 84 . 64 87 . 68 90 . 38 92 . 98
95 96 . 88 98 . 62
100
F2 = 0 . 4262X1 + 0 . 2613X2 + 0 . 248X3 + 噎 + 0 . 2764X15 F3 = 0 . 5081X1 - 0 . 13X2 + 0 . 1716X3 + 噎 + 0 . 1678X15 渊 5 冤 F4 = 0 . 4551X1 + 0 . 1536X2 + 0 . 2658X3 + 噎 + 0 . 0581X15 将每个学生的相应科目成绩代入上式袁 可以计算 得到四个主成分值袁 第一主成分各个变量的系数均为 正值袁 且相差不大袁 可以认为第一主成分值代表了学 生的综合实力遥 第 二 主 成 分 中 袁 在 X7 , X9 - X13 , X15 几 个 变 量 的 系 数 出 现 负 数 袁 即 变 量 所 代 表 的 课 程 建 筑施工袁混凝土结构
1 主成分分析法
高校学生的考试成绩数据量庞大袁每个个体又由很 多元数据组成袁 个体数据和群体数据又存在复杂的联 系袁给分析带来了很大的不便遥 采用目前主流的统计分 析方法要主成分分析法袁 借助计算机快速处理信息数 据袁能较为客观地透过数据表象看到数据背后的内容遥
1.1 方法概述
主 成 分 分 析 法 渊 Principal component analysis 袁 简 称
每 位 学 生 的 学 业 成 绩 为 mi = [ X1i , X2i , 噎 , X15i ] 袁 其 中 i 沂
[ 1 , 122 ] 遥
得到考试成绩原始矩阵
X
=
[
m
T 1
,
m
T 2
,

m
T 122
]袁通
过对样本相关阵的内部结构关系的
研究袁 找出影响学生成绩的综合指
标袁 使综合指标为原变量的线形组
其中 i=1,2,噎,n;j=1,2,噎,p遥
渊1冤
渊1冤对矩阵进行标准化处理袁见公式渊2冤[3]院
社x ij
=
x ij - x軃j 滓j
淫基金项目院 浙江省教育科学规划项目 野基于提升工程能力和创新能力的工科专业课考试改革冶
渊 2017SCG169 冤 遥 作者 简 介 院缪盾袁渊1984.08要冤袁女袁汉族袁副教授袁硕士遥
揖关键词铱考试成绩曰主成分分析曰相关性
中 图 分 类 号 院 R95
文献标识码院 A
文 章 编 号 院 2095 - 2457 渊2018冤04-0011-003
Research on Correlation between Test Score and Ability Based on Principal Component Analysis MIAO Dun
建筑施工
房屋建筑 学
X7
X8
工程概预算 与招投标
X15
之间又不相关袁比 原始变量具有一 些更优越的性质袁 使我们在评价学 生的能力时能够 抓住主要方面遥标 准化矩阵并计算
. All Right表s2 Re样s本er数v据ed特.征 值 和 贡 献 率
序号
特征值
差异值
贡献值
累积贡献 率渊%冤
主 成 分 5 0 . 6963
0 . 1251
0 . 0346
75 . 19
样本相关系数袁求 得矩阵的特征值和贡献率袁如表 2 所示院
通过表 2 可以发现前四个主成分的贡献值对最终 结 果 的 影 响 较 大 袁 因 此 本 文 选 取 累 计 贡 献 率 达 到 70 % 为 阈 值 袁 选 择 前 四 个 主 成 分 变 量 代 替 原 始 的 15 个 变 量遥 求得前四个主成分对应的特征向量如下表 3 所 示院
0 . 4699 0 . 4616 0 . 4525 0 . 4019 0 . 3864 0 . 2999 0 . 2796 0 . 2596 0 . 2055
0 . 0083 0 . 0091 0 . 0506 0 . 0156 0 . 0865 0 . 0203 0 . 02 0 . 0541
0
( Zhejiang University , Tongji University , Jiaxing , Zhejiang 314051 , China ) 揖Abstract铱Examination is an important and commonly used measure of education and is widely used in colleges and universities . How to reasonably treat the relationship between students 爷 test scores and abilities is the key to help students understand their own shortcomings and make clear the direction of their efforts . It is also the basis for the selection of students 爷 employment orientation and entrepreneurial basis . Through the method of principal component analysis , data mining is performed on a large number of test data to find comprehensive indicators for evaluation , and the main information of the original variables is preserved , so that we can grasp the main aspects when evaluating
Science & Technology Vision 科技视界 11
Science & Technology Vision
科技视界
n
n
移 姨 移 其 中
xj =
1 n
x ij , 滓 j =
i=1
1 n
(x
ij
-
x軃ij
2
)
i=1

则原始
矩阵计算后得到的标准化矩阵为院
渊5冤 把各变量的原始数据标准化后代入各主成分 方 程 式 中 袁 求 得 综 合 评 价 值 F = 籽1F1 + 籽2F2 + 噎 + 籽mFm 进 行 分析评价遥
r 噎 r 杉山
山 11
煽衫 1n 衫

R
=
山 山 山




衫 衫 衫 衫 衫
=
1 n
r 噎 r 山
删山 p1
衫 pn 闪衫
XTX
渊3冤
渊2冤 求得标准化后矩阵的相关系数矩阵袁 见公式
n
移 渊 4 冤 院 rij =Fra bibliotek1 n
i
=
1
xijxik =
1 n
X
T i
X
k
,
j
,
k
=
1
,
2
,

,
p
渊4冤
渊 3 冤 求 得 相 关 系 数 矩 阵 R 的 特 征 值 [ 姿i ] 和 相 应 的 特
征向量遥
2 考试成绩主成分分析
选 取 某 大 学 2013 级 土 木 工 程 专 业 122 名 学 生 的
15 门 专 业 课 考 试 成 绩 为 分 析 样 本 袁 将 其 各 科 成 绩 作 为
变 量 袁 生 成 122*15 的 矩 阵 袁 部 分 数 据 如 图 1 所 示 院
将课程变量用代码表示袁如表 1 所示院
个指标[3]遥
设 计原 理 袁基 础 工程 设 计等 课 程的 成 绩低 袁 则 F2 值 高 袁 这 些 课程 均 为专 业 课 袁因 此可 以 认 为 F2 值 高 代 表 了 学 生 的 专业基础扎实袁但是专业能力还比较弱遥
第 三 主 成 分 F3 中 袁 工 程 制 图 袁 结 构 力 学 袁 气 体 结 构 袁 建筑施工袁建筑设备五门课程变量的系数为负值袁成绩 越低袁此分量的值越高袁而混凝土结构设计袁基础工程设 计 和 钢 结 构 设 计 三 个 变 量 与 F3 是 正 相 关 的 袁 说 明 得 分
. AlstludeRntsi爷ghabtilsitiesR. eserved.
揖Key words铱Test score s ; Principal component analysis ; Correlation
0 引言
考试作为一种常规性的评价手段袁 是用来评估教 与学质量和水平的重要方法袁 且贯穿于学生求学的各 个阶段节点上遥 尤其在高校袁 一门课程的考试就意味 着这门课程的终结袁 考试成绩与学生能力的关系被简 单的赋予正相关的关系袁 即考试成绩高袁 则认为学生 能力高袁 导致学生尧 家长甚至是教师都一味的追求高 分袁 却忽略了高分背后是否真正体现了高能遥 考试能 力不代表学生真正的专业能力和学业能力袁 因此如何 合理看待学生考试成绩与能力的关系袁 是学生明晰自 身能力偏向袁 择业方向的关键袁 也是教师综合评价学 生能力袁潜力和个性化教学的判别依据遥
从上表得到主成分计算公式分别是院
主 成 分 6 0 . 5712
0 . 1013
0 . 0321
78 . 4
F1 = 0 . 1792X1 + 0 . 2762X2 + 0 . 2525X3 + 噎 + 0 . 2722X15
主成分 7 主成分 8 主成分 9 主 成 分 10 主 成 分 11 主 成 分 12 主 成 分 13 主 成 分 14 主 成 分 15
Science & Technology Vision
科技视界
基于主成分分析的考试成绩与能力相关性研究
缪盾 渊 同 济 大 学 浙 江 学 院 袁 浙 江 嘉 兴 314051 冤
揖摘 要铱考试是一种重要的尧常用的教育测量手段袁在高校中被广泛使用遥 如何合理的看待学生考试成绩 与能力的关系袁是帮助学生了解自己不足袁明确努力方向的关键袁也是学生就业方向选择和创业的判别依据遥 通过主成分分析的方法对大量考试数据进行数据挖掘袁找出评价的综合指标袁保留原始变量的主要信息袁使我 们在评价学生的能力时能够抓住主要方面遥
主 成 分 1 7 . 2792
5 . 9332
0 . 4893
48 . 93
主 成 分 2 1 . 346
0 . 4432
0 . 1005
58 . 98
主 成 分 3 0 . 9028
0 . 039
0 . 0707
66 . 05
主 成 分 4 0 . 8638
0 . 1675
0 . 0568
71 . 23
课程 名称
代码
课程 名称
代码
工程制图
X1 混凝土结构
基本原理 X9
图 1 样本数据采集
表 1 课程代码表
结构力学 工程地质
测量学
土木工程 材料
砌体结构
X2
X3
X4
X5
X6
建筑设备
地下工程
基础工程 设计
建筑钢结 构设计
建设工程 法规
X10
X11
X12
X13
X14
合遥 综合指标不仅保留了原始变量
的主要信息袁彼此
PCA 冤 首 先 是 Hotelling 在 1933 年 提 出 的 遥 主 成 分 分 析 法
是一种利用数学思想达到降低维数的统计方法 [1]袁即
把多指标转化为少数几个综合指标渊即主成分冤袁使每
个主成分能够反映原始变量的大部分信息袁 这种方法
在引进多方面变量的同时将复杂因素归结为几个主成
分袁 使问题简单化袁 同时得到的结果更加科学有效反
p
渊 4 冤 确 定 要 选 取 的 主 成 分 个 数 袁 我 们 称 为 姿k / 移 为 k=1
m
p
移 移 第 k 个 主 成 分 的 贡 献 率 袁 记 为 籽k 袁 称 姿k / 姿k 为 前
k=1
k=1
m 个主成分的累积贡献率袁当前 m 个主成分累积贡献
率超过规定的阈值时袁 取前 m 个主成分代替原来的 p
相关文档
最新文档