1 课题背景介绍
在实际统计工作中,经常遇到多指标 (变量)系统的排序评估问题,例如对企业的经济效益进行评估、对某类地区的发展状况进行评估等。如何科学、客观地将一个多指标问题综合为少数乃至单个指标的形式,主成分分析法是目前较为流行的一种方法。由于主成分分析方法能浓缩信息,简化指标的结构,使分析问题的过程简单、直观、有效,故广泛应用于各个领域.人们经常利用主成分分析方法综合评价企业或事业单位的经济效益、技术进步状况,并收到了良好的效果。
本课题研究了主成分分析法在数据降维中的应用,并且将其应用在高校学生成绩评价中。成绩作为考试的结果,不仅是对学生学业和教师教学效果的检验和评定,具有激励学生学习及教师工作,更是一种信息,具有反馈教学活动、服务于教育决策、为教育科研提供资料等作用。为充分发挥考试的效能,综合评价考试质量,及时反馈教学效果,沟通教学信息,教学部门对考试成绩进行统计分析和总结是非常必要的。目前,对学生综合评价的一般模型主要有平均分模型、平均学分积模型等。多元统计分析中的主成分分析、层次分析法、模糊评价法等也是很好的综合评价方法,但大多数大学或院系都是用前两种模型即平均成绩、平均学分积模型作为评价学生的定量依据。用这两种方法比较简单,但有缺点,掩盖了学生的个性,不能反映学生各方面的特点,也反映不出学生的专业能力,对学生作全面的综合评价来说不是很理想。
因此,本课题着重突出主成分分析方法,具有典型性和代表性,力求通过成绩给学生一个相对完美的评价。
2 课题内容概述
本课题研究了主成分分析法在数据降维中的应用,并且将其应用在高校学生成绩评价中,。使得对学生成绩的分析更客观,准确,对将来学生的成绩变化趋势做一定的参考和预测,也使学生个人对自己的学习有更深刻的了解和更好的分析。
2.1 主成分分析法
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主要方法有特征值分解,SVD,NMF等。
2.2 传统分析法
