• 优质范文
  • 工作总结
  • 工作计划
  • 作文大全
  • 心得体会
  • 述职报告
  • 实习报告
  • 写作方案
  • 教案反思
  • 演讲稿
  • 发言稿
  • 读书笔记
  • 精美散文
  • 读观后感
  • 当前位置: 博通范文网 > 述职报告 > 正文

    应用多元统计分析习题解答-因子分析

    时间:2020-08-31 来源:博通范文网 本文已影响 博通范文网手机站

    第七章因子分析 7.1 试述因子分析与主成分分析的联系与区别。

     答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、 简化数据的技术。② 两种分析的求解过程是类似的, 都是从一个协方差阵出发,利用特征值、特征向量求解。因 子分析可以说是主成分分析的姐妹篇, 将主成分分析向前推进一步便导致因子分析。

     因子分 析也可以说成是主成分分析的逆问题。

     如果说主成分分析是将原指标综合、 归纳,那么因子 分析可以说是将原指标给予分解、演绎。

     因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标 变换到变异程度大的方向上为止, 突出数据变异的方向, 归纳重要信息。而因子分析是从显 在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因 子模型。

     7.2 因子分析主要可应用于哪些方面? 答:因子分析是一种通过显在变量测评潜在变量, 通过具体指标测评抽象因子的统计分析方 法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说,①因子 分析可以用于分类。如用考试分数将学生的学习状况予以分类; 用空气中各种成分的比例对 空气的优劣予以分类等等②因子分析可以用于探索潜在因素。

     即是探索未能观察的或不能观 测的的潜在因素是什么,起的作用如何等。对我们进一步研究与探讨指示方向。

     在社会调查 分析中十分常用。③因子分析的另一个作用是用于时空分解。

     如研究几个不同地点的不同日 期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判 断各自的影响和变化规律。

     7.3 简述因子模型 、一 m

     卜中载荷矩阵 A A 的统计意义。

     答:对于因子模型 X i PF W2F 2 • O j Fj •… WmF m ; i i =1,2,… , p

     X i 与 F j 的协方差为: m Cov(X i , F j ) =Cov(" a ik F k 「 F j ) kT m = Cov(" a ik F k ,F j ) Cov( ; i ,F j ) k d = =a ij 若对 X i 作标准化处理,= = a 0

     , ,因此 a jj —方面表示 X i 对 F j 的依赖程度;另一方面也反映了 变量 X i 对公共因子 F j 的相对重要性。

     m 变量共同度 h ; 八 a j 2

     i =1,2,… , p j 4 a 11 8 8 21 因子载荷阵为 A =二1

     a l2 a 22 a p2 a 1m a 2m = (A,A 2 , ,A m ) )

     a pm 2 2 2 2 2 D(X i ^a i1 D(F 1 pHa i2 D(F 2 ^ 1

     +a im D(F m pH D^ , h +d i

     说明变量 X i

     的方差由 两部分组成:第一部分为共同度 h :

     ,它描述了全部公共因子对变量 X j 的总方差所作的贡献, 反映了公共因子对变量 X i 的影响程度。第二部分为特殊因子 ; i 对变量 X i 的方差的贡献,通 常称为个性方差。

     p 而公共因子 F j 对 X 的贡献 g 2 a :

     j =1,2,… , m i £ 表示同一公共因子 F j 对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重 要性的一个尺度。

     7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么? 答:因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。

     但有时直接 根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。

     这种因子模型反而是不 利于突出主要矛盾和矛盾的主要方面的, 也很难对因子的实际背景进行合理的解释。

     这时需 要通过因子旋转的方法, 使每个变量仅在一个公共因子上有较大的载荷, 而在其余的公共因 子上的载荷比较小。

     最大方差旋转法是一种正交旋转的方法,其基本思路为:

     ① A A

     , * * * - 1

     p 其中令 A = A 『二 (a ij ) p m , d ij = a j /h i d j _ d :

     p

     im A 的第 j j 列元素平方的相对方差可定义为 V j 二丄 7 (df-d j ) 2

     p id :

     ② V -V 1

     V m

     最大方差旋转法就是选择正交矩阵 r ,使得矩阵 A * 所有 m m 个列元素平方的相对方差之和达 到最大。

     7.5 试分析因子分析模型与线性回归模型的区别与联系。

     答:因子分析模型是一种通过显在变量测评潜在变量, 计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存 ( (数量) )关系, , 用函数关系式表达出来。

     因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即 X j =&応 +a 2 F 2 +… +a m F m

     +色,( i …p ) 该模型可用矩阵表示为:x = AF

     + e 而回归分析模型中多元线性回归方程模型为:

     是偏回归系数,

     二2

     正态性:随机误差(即残差) e e 服从均值为 0 0,方差为 x x,残差 e e 的条件方差为 cr2 2

      ,且口为常数; x x 的条件下,残差 e e 的条件期望值为 0 (本假设又称零均值假设) 无自相关性:各随机误差项 e e 互不相关。

     两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。

     ) )"来描述, 在因子分析时,从约相 , ,所以找前两个特 征值所对应的公共因子即可, 又知对应的正则化特征向量分别为 (0.707,- - 0.316,0.632) 及(0 0, 0.899 , 0.4470 )",要求:

     通过具体指标测评抽象因子的统 是常数项, 因子模型满足: (1) m<p

     ; (2)

     Cov( F , 9=0,即公共因子与特殊因子是不相关的; 0 01 1

     (3)

     D F

     =D( F)= _1 ,即各个公共因子不相关且方差为 1 1; m (4)

     馬2

     ,即各个特殊因子不相关,方差不要求相等。

     而回归分析模型满足( 态分布;(2 2)等方差:对于所有的自变量 立性:在给定自变量 +的正 (3 3)独 ;(4 4) 7.6 设某客观现象可用 关阵出发计算出特征值为 「:

     - 由于 (1) 计算因子载荷矩阵 A A,并建立因子模型。

     11213 (2)

     计算共同度 。

     (3) 计算第一公因子对 X X 的“贡献” 。

     0,936 0 \ 10.413 0.899 1 0.837 0.4470/ I I 建立因子模型为 (2)

     (3)因为是从约相关阵计算的特征值,所以公共因子对 X X 的“贡献”为 7 7.7 利用因子分析方法分析下列 0 30 个学生成绩的因子构成,并分析各个学生较适合学文科 还是理科。

     序号 数学 物理 化学 语文 历史 英语 ( 1 65 61 72 84 81 79

      2 77 77 76 64 70 55 3 67 63 49 65 67 57 4 80 69 75 74 74 63 5 74 70 80 84 81 74 6 78 84 75 62 71 64 7 66 71 67 52 65 57 8 77 71 57 72 86 71 9 83 100 79 41 67 50 10 86 94 97 51 63 55 11 74 80 88 64 73 66 12 67 84 53 58 66 56 13 81 62 69 56 66 52 14 71 64 94 52 61 52 15 78 96 81 80 89 76 16 69 56 67 75 94 80 17 77 90 80 68 66 60 18 84 67 75 60 70 63 19 62 67 83 71 85 77 20 74 65 75 72 90 73 21 91 74 97 62 71 66 22 72 87 72 79 83 76 23 82 70 83 68 77 85 24 63 70 60 91 85 82 25 74 79 95 59 74 59 26 66 61 77 62 73 64 27 90 82 98 47 71 60 28 77 90 85 68 73 76 29 91 82 84 54 62 60 30 78 84 100 51 60 60 解: :令数学成绩为 X X i ,物理为 X X 2 ,化学为 X X 3 , 语 文 为 X X 4 , 历 史 为 X X 5 , 英 语 为 X X i , 用 S P S S 分析学生成绩的因子构成的步骤如下:

     1.在 S SPSS 窗 口中选择 Analyze ^ Data Reduction ^ Factor ,调出因子分析主界面,并将 六个变量移入 Variables 框中。

     图 7.1 因子分析主界面

     2•点击 Descriptives 按钮,展开相应对话框,见图 7.2。选择 Initial solution 复选项。这 个选项给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。单击 Continue 按钮,返回主界面。

     園 Factor Analysis:: Descriptives rStatistics- Univariate descriptives 0 Initial solution rCorrelation Matrix ------------------------------

     Coefficients □ Inverse Significance levels | Reproduced Determinant □ Anti-image □ KMO and Bartlett"s test of sphericity Continue Cancel Help 图 7.2 Descriptives 子对话框 3 3 •点击 Extraction 按钮,设置因子提取的选项,见图 7.3。在 Method 下拉列表中选择 因子提取的方法,S SPSS 提供了七种提取方法可供选择, 一般选择默认选项, 即“主成分法”。

     在 Analyze 栏中指定用于提取因子的分析矩阵,分别为相关矩阵和协方差矩阵。在 Display 栏中指定与因子提取有关的输出项,如未旋转的因子载荷阵和因子的碎石图。在 Extract 栏 中指定因子提取的数目,有两种设置方法:一种是在 Eigenvaluesover 后的框中设置提取的 因子对应的特征值的范围,系统默认值为 1 1,即要求提取那些特征值大于 1 1 的因子;第二种 设置方法是直接在 Number of factors 后的矩形框中输入要求提取的公因子的数目。

     这里我们 均选择系统默认选项,单击 Continue 按钮,返回主界面。

      图 7.3 Extraction 子对话框 4.点击 Rotation 按钮,设置因子旋转的方法。这里选择 Varimax (方差最大旋转 ),并选 择 Display 栏中的 Rotated solution 复选框,在输出窗口中显示旋转后的因子载荷阵。单击 Continue 按钮,返回主界面。

     图 7.4 Rotation 子对话框 5•点击 Scores 按钮,设置因子得分的选项。选中 Save as variables 复选框,将因子得分 作为新变量保存在数据文件中。选中 Display factor score coefficient matrix 复选框,这样在 结果输出窗口中会给出因子得分系数矩阵。单击 Continue 按钮返回主界面。

      图 7.5 Scores 子对话框 6.单击 0K 按钮,运行因子分析过程。

     结果分析:

     表 7.1 旋转前因子载荷阵 表 7.2 旋转后因子载荷阵 成份矩阵a

      成份 1 2 x1 -.662 .503 x2 -.530 .478 x3 -.555 .605 x4 .900 .233 x5 .857 .357

      |x6 | .816 I .498 I 旋转成份矩阵a

     提取方法 :主成分分析法。

      成份

      1 2

     x1 -.245

     .795

     x2 -.152

     .698

     x3 -.099

     .815

     x4 .867

     -.335

     x5 .904

     -.209

     x6 .953

     -.072 从表 7.1 中可以看出, 每个因子在不同原始变量上的载荷没有明显的差别,为了便于对因 子进行命名,需要对因子载荷阵进行旋转,得表 7.2。经过旋转后的载荷系数已经明显地两 极分化了。第一个公共因子在后三个指标上有较大载荷,说明这三个指标有较强的相关性, 可以归为一类,属于文科学习能力的指标; 第二个公共因子在前三个指标上有较大载荷, 同 样可以归为一类,这三个指标同属于理科学习能力的指标。根据表 3 7.3 易得:

     F1 =0.064X1 0.085X2 0.137X3 0.332X4 0.378X5 0.432X6 F2 =0.439X1 0.400X2 0.484X3 0.014X4 0.073X5 0.169X6 表 3 7.3 因子得分系数矩阵

     成枱 1 2 X1 .064 .439

     .005 400 x3 137 .4S4 X4 332 ^.014 x5 .378 .073 X6 432 169

     将每个学生的六门成绩分别代入 F1、F2,比较两者的大小,F1 大的适合学文, F2 大的适合学理。

     计算结果为学号是 1、16、24 的学生适合学文,其余均适合学理。

     8 7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况, 为了避免有些指标间的相关关系 影响预测结果,需首先进行因子分析来简化指标系统。

     下表是抽查欧洲某汽车市场 7 7 个品牌 不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。

     品牌 价格 发动机 功率 轴距 宽 长 轴距 燃料 容量 燃料 效率 A 21500 1.8 140 101.2 67.3 172.4 2.639 13.2 28 A 28400 3.2 225 108.1 70.3 192.9 3.517 17.2 25 A 42000 3.5 210 114.6 71.4 196.6 3.850 18.0 22 B 23990 1.8 150 102.6 68.2 178.0 2.998 16.4 27 B 33950 2.8 200 108.7 76.1 192.0 3.561 18.5 22 B 62000 4.2 310 113.0 74.0 198.2 3.902 23.7 21 C 26990 2.5 1/0 107.3 C 33400 2.8 193 107.3 C 38900 2.8 193 111.4 D 21975 3.1 175 109.0 D 25300 3.8 240 109.0 D 31965 3.8 205 113.8 D 27885 3.8 205 112.2 E 39895 4.6 275 115.3 E 39665 4.6 275 108.0 E 31010 3.0 200 107.4 E 46225 5.7 255 117.5 F 13260 2.2 115 104.1 F 16535 3.1 170 107.0 F 18890 3.1 175 107.5 F 19390 3.4 180 110.5 F 24340 3.8 200 101.1 F 45705 5.7 345 104.5 F 13960 1.8 120 97.1 F 9235 1.0 55 93.1 F 18890 3.4 180 110.5 G 19840 2.5 163 103.7 G 24495 2.5 168 106.0 G 22245 2.7 200 113.0 G 16480 2.0 132 108.0 G 28340 3.5 253 113.0 G 29185 3.5 253 113.0 68.4 176.0 3.1/9 16.6 —26 68.5 176.0 3.197 16.6 24 70.9 188.0 3.472 18.5 25 72.7 194.6 3.368 17.5 25 72.7 196.2 3.543 17.5 23 74.7 206.8 3.778 18.5 24 73.5 200.0 3.591 17.5 25 74.5 207.2 3.978 18.5 22 75.5 200.6 3.843 19.0 22 70.3 194.8 3.770 18.0 22 77.0 201.2 5.572 30.0 15 67.9 180.9 2.676 14.3 27 69.4 190.4 3.051 15.0 25 72.5 200.9 3.330 16.6 25 72.7 197.9 3.340 17.0 27 74.1 193.2 3.500 16.8 25 73.6 179.7 3.210 19.1 22 66.7 174.3 2.398 13.2 33 62.6 149.4 1.895 10.3 45 73.0 200.0 3.389 17.0 27 69.7 190.9 2.967 15.9 24 69.2 193.0 3.332 16.0 24 74.4 209.1 3.452 17.0 26 71.0 186.0 2.911 16.0 27 74.4 207.7 3.564 17.0 23 74.4 197.8 3.567 17.0 23 解:令价格为 X1,发动机为 X2,功率为 X3,轴距为 X4,宽为 X5,长为 X6,轴距为 X7,燃 料容量为 X8,燃料效率为 X9,用 S SPSS 找简化的指标系统的具体步骤同 7.7 。

     此时在系统默认情况下提取因子,结果是只抽取了一个成分,从方差贡献来看,前三个 成分贡献了 90.9% ,因此重复因子分析过程,并在第三步 Extraction 子对话框中的 Number of factors 后的矩形框中输入 3 3,即为要提取的公因子的数目。因子分析结果如下:

     表 7.4 旋转后的因子得分系数矩阵 咸常揖分系数矩阵

      1 2 3 X1 -3S9

     .342 X2 *015 .525 -.278 x3 -.060 .700 -.409 K4 305 -.344 .241 X5 354 J 95 -336 X6 sgg -JOO -.332 x7 .036 -.291 .494 xe -1B6 -.221 .651 xS -.071 0G2 -.239

     其简化了指标体系为 F1 、 F2 、 F3 ,从旋转后的因子得分系数矩阵得:

     F1 =-0.399X1 —0.015X2 —0.060X3 0.305X4 0.354X5 0.599X6 0.036X7 —0.186X8 —0.071X9 F2 =0.289X1 - 0.525X2 0.700X3 —0.344X4 0.195X5 —0.100X6 —0.291X 7 —0.221X 8 0.082X9 F 3 =0.342X1 -0.278X2 -0.409X3 0.241X4 -0.338X5 -0.332X6 0.494X7 -0.651X8 -0.239X9 9 7.9 根据人均 GDP、第三产业从业人员占全部从业人员的比重、 第三产业增加值占 P GDP 的比 重、人均铺装道路面积、万人拥有公共汽电车、万人拥有医生、百人拥有电话机数、万人拥 有高等学校在校学生人数、人均居住面积、百人拥有公共图书馆藏书、人均绿地面积等十一 项指标对目前我国省会城市和计划单列市的城市化进行因子分析, 并利用因子得分对其进行排序和评价。(数据可从《中国统计年鉴》查获)

     ( 略 )

     7.10 根据习题 5.10 中 2003 年我国省会城市和计划单列市的主要经济指标数据,利用因子 分析法对其进行排序和分类,并与聚类分析的结果进行比较。

     解:对其进行因子分析的步骤与 7.7 相同,结果如下:

     表 7.5 特征根与方差解释分析表 解释的聽右差 成祖

     提取平方和臥

     旨+ 专差的% 累槟% 合计 有差的%

     合计 右差的%

     1 5.059 56.199 56 199 5 056 56.199 56J99 3.972 44.138 44.130 2 2390 2G551 02750 2 390 26.551 82750 3 475 36.612 62.750 3 .814 9.041 91790

      4 341 3 794 95.675

      5 .248 2.759 99.333

      6 .100 1.100 99.441

      7 .027 .304 99.744

      8 .020 .219 Q9.Q64

      g 003 .036 100.000

      由表 7.5 可知,提取的两个因子方差贡献达到了 82.75% 。

     表 7.6 旋转后的因子得分系数矩阵 成常得分系数描阵

      1 2 X1 -093 .315 X2 -.100 ,316 x3 .1S7 -103 X4 .25E -.097 x5

     .017 x6 .249 -.022 x7 -.057 .282 xS ose 169 X9 .233 -.009

     由上面的因子得分矩阵可知:

     F1 - £.093X1 -0.100X2 0.167X3 0.258X4 • 0.219X 5 0.248X6 -0.057X 7 0.086X8 - 0.233X9 F2 =0.315X1 0.316X2 -0.103X3 -0.097X4 0.017X5 -0.022X6 0.282X7 0.169X8-0.008X9 与主成分分析中计算综合得分同理,用 F ^F1 -F2 进行加权,得排序:

     送人 Z

     F1 F2 F 深圳 382417.42 392989.93 385811.19 上海 157848.03 52892.05 124157.16 厦门 114461.78 107589.61 112255.81

      广州 125604.86 49740.69 101252.46 杭州 94835.17 45211.64 78906.02 宁波 91203.35 43854.84 76004.48 北京 102885.84 17864.73 75594.07 南宁 102885.84 17864.73 75594.07 天津 89055.66 32589.70 70930.09 海口 89055.66 32589.70 70930.09 南京 82495.01 39893.01 68819.77 青岛 79248.60 22497.55 61031.51 大连 71586.92 27254.60 57356.24 济南 56561.73 25507.43 46593.30 成都 76035.96 -27268.81 42875.13 福州 51129.12 25240.89 42818.99 乌鲁木齐 50117.93 23629.54 41615.16 沈阳 52143.03 19031.14 41514.12 武汉 53771.95 15104.91 41359.83 长春 48409.60 21920.52 39906.60 太原 43732.74 15165.88 34562.78 郑州 41745.50 15185.84 33219.85 海口 39732.42 17509.21 32598.77 昆明 41593.76 13263.93 32499.88 兰州 37263.61 21287.59 32135.31 长沙 42382.92 9666.19 31880.85 石家庄 40997.75 11439.53 31509.56 重庆 62656.07 -34641.39 31423.58 呼和浩特 36273.21 20652.68 31259.02 西安 37702.57 7531.88 28017.78 哈尔滨 35493.87 9735.24 27225.35 南昌 32831.80 14359.21 26902.10 合肥 32205.35 13387.12 26164.70 贵阳 34499.43 6397.94 25478.85 银川 28935.56 16943.87 25086.23 西宁 23503.44 9499.18 19008.08 南宁 25923.91 4138.99 18930.95 根据 F F 的最终数值进行分类, 由于没有给出具体的分类标准, 分类具有一定的主观性, 只要 合理即可。聚类分析的结果见 5.11,可将两者进行比较。

    推荐访问:统计分析 因子 习题

    • 读/观后感
    • 精美散文
    • 读书笔记
    • 演讲
    • 反思
    • 方案
    • 心得体会