主成分分析因子载荷过程中如何选择在哪些变量上有较大载荷

科学教育 | 学习帮助 | 出国/留学 | 工程技术科学 | 教育/科学 | 英语听力 | 梦幻西游电脑版 | 视频会议 | 口臭 | 暗黑破坏神3（游戏） | 面相 | 赛尔号 | linux | 山西省 | Xbox One | 思修 | 易经 | solidworks | 钢铁雄心4 | 休闲游戏 | 魔兽争霸3混乱之治 | 显卡 | 武汉大学 | 塞尔达传说（游戏） | 校服 | 剑侠情缘网络版叁 | 脱发 | 日本文化 | 数学建模 | 二次元 | 部落冲突（游戏） | 肖战 | 街机游戏 | 拳皇 | 马鞍山市 | 扑克 | 完美世界（游戏） | 三国志（游戏） | 热血传奇（游戏） | 意大利 | 跆拳道 | 东莞市 | 糖尿病 | 古琴 | 三国 | 电视节目 | 百度 | qq音乐 | 配音 | 电视 | 任天堂 | 科幻小说 | 虚拟专用服务器 | QQ游戏 | 大熊猫 | 微电影 | Android | 竞技游戏 | 动画制作 | QQ炫舞 | 电源 | 日语 | 魔兽争霸3冰封王座 | 产业 | ios开发 | 百度云 | 动画电影 | nba篮球 | 羽生结弦 | iOS应用 | galgame | 电吉他 | 平板电脑 | 周星驰（人物） | 离婚 | 后宫·甄嬛传（书籍） | 牙科 | 游戏开发 | 网络直播 | ios游戏 | 电子邮件 | SNH48 | 民国 | 美容 | 舰队 Collection | 心理 | Mac | 羽毛球技术 | 互联网公司 | 大学生兼职 | 烘焙 | 诸葛亮 | 跑跑卡丁车 | 武侠小说 | 微博 | 骨折 | 掌上游戏机 | 玉米 | 中国足球 | 电脑配置 | 洛奇英雄传 | 硬盘 | 张璐 | akb48 | 炉石传说 | 韩国 | 蓄电池 | QQ空间 | 房贷 | 麦克风 | 相声演员 | 抑郁 | 天下2（游戏） | 农业科学 | 神话 | 农历 | 中国足球协会超级联赛（CSL） | 流星花园 | 易烊千玺 | 火影忍者 | 日语歌曲 | 巴西 | 红酒 | 化疗 | 占地 | 网络小说 | 香烟 | 传奇世界 | 名字 | 日本电影 | 表演 | 西藏自治区 | 英雄传说：闪之轨迹（游戏） | 足球彩票 | 摩尔庄园 | 中国工商银行 | 游戏手柄 | 陈奕迅 | 联赛 | 天体物理学 | 英格兰足球超级联赛 | 超级机器人大战 | 命令与征服：红色警戒2（游戏） | 郭富城 | 一级方程式赛车（f1） | Adobe Photoshop | 英文歌曲 | 玄幻小说 | 猫和老鼠 | 杨凡 | 书籍改编电影 | 俄罗斯 | 网络赚钱 | 罗玉凤 | 刺客信条2 | 角色扮演 | 食物 | 药物 | 杨洋（演员） | 信息安全 | 胡歌（演员） | 张子枫 | 古典音乐 | 时尚 | 大片 | 电脑游戏 | 签证 | 徐佳莹 | 耽美 | 游戏攻略 | 音乐剧 | 前女友 | 男性 | 肠胃 | 刺客信条起源 | 剧场版 | 国际足联世界杯 | 彩虹六号（游戏） | 赵丽颖（演员） | 天体生物学 | 战神（游戏） | 吉他学习 | 飞机 | 三菱商事 | 关节炎 | 斗鱼直播 | 发电 | 张继科 | 华语流行音乐 | 搏击项目 | 主题曲 | 李信 | 刘德华（演员） | 即时战略游戏（RTS） | 欧阳娜娜 | 网址导航 | 海贼王 | 山地车 | 豆瓣电影 | 广场舞 |

你的位置：网站首页 >> 频道首页 >>理工学科 >>主成分分析因子载荷过程中如何选择在哪些变量上有较大载荷

主成分分析因子载荷过程中如何选择在哪些变量上有较大载荷

来源：蜘蛛抓取(WebSpider) 时间：2017-05-06 00:46 标签：因子分析选择变量

实案分析：如何用一道多选题给用户画像？-界面设计-火龙果软件工程
&&&&您可以捐助，支持我们的公益事业。
每天15篇文章
不仅获得谋生技能
更可以追随信仰
实案分析：如何用一道多选题给用户画像？
来源：ME网易移动设计发布于：&
178 次浏览
&&&&评价：
本例仅仅是基于调研目的灵活处理的一个例子，适合短平快的项目；如果需要系统了解用户，深入挖掘用户需求，更大的样本量和更扎实的定性研究依然是必不可少的。
现代商业离不开对用户的理解，任何业务的决策者都不会希望在认识用户上存在盲区，因此在用研的日常工作中，“做一个用户画像”是经常收到的需求。但同样的需求背后，往往对应着不同的目标和问题，搞清楚了解用户能帮助业务方解决什么问题，才能更有效地制定研究方案。大而全的数据平台，不一定可以和粒度很细的调研目标精确匹配；传统市场调研或设计调研的方法又会增加周期和成本，不适合短平快的项目。那么是否可以使用简单的测量－统计方法，较敏捷地得到一个需求方期望的“用户画像”呢？本文来分享这样一个案例。
（一）背景－为什么想做一个“用户画像”
在接手话题版块改版方向调研的过程中，其中一项调研目标比较有意思：运营同学发现，网易新闻客户端话题版块中，一些女性相关话题活跃度格外高，这与对目标用户的预期有一些偏差。依照大家的印象，新闻客户端中壮年男性比例偏高，典型用户是一个体制内老刘的形象－时政、社会、历史、军事版块的重度读者－因此在话题运营上也更偏向了此类内容。然而偶尔为之的母婴、情感类的话题，无论从参与热度还是质量来考量，效果都不错。运营同学陷入思考之中，怀疑话题版块活跃着一些假的网易新闻用户。
那么话题社区的活跃用户真的与客户端整体不同吗？运营同学由此提出了调研需求，希望了解话题活跃用户的“性别、年龄、婚姻状况。。”等等的一揽子人口学变量描述，简言之－“做一个话题版块的用户画像”。
不管如何做，先梳理一下需求，把目标拆解成回答以下两个问题：
网易新闻客户端的用户可以分为哪几类？
这几类用户中，哪些是话题版块可以发力的核心用户？
（二）以什么标准区分用户－一个简单的题目设计
大家可能注意到，需求方在提需求的时候，顺带提了一下自己对用户区分维度的界定“性别、年龄、婚姻状况。。”。诚然，人口学变量用来区分用户很经典，但并不适用于所有研究目标，比如在本例中的效果就未必好。原因有二。首先，人口学变量并不直接能落地到业务，还需要基于业务理解进行二次推演，不够直观；而好的分类标准应该能直接与现有资源结合来指导业务；二是完全无预设的情况下，事前很难确定各个人口学变量的影响权重，那么如果需要进行探索性分析，需要在问题中纳入足够多的变量。这样短短问卷难以承载，也会让分析头绪无端变多。
所以研究用了另一个解决方案，直接用内容偏好特征来区分用户。这样做的好处是，作为内容分发平台，直接以内容偏好为标签的用户画像天然具有可落地的属性，而不必再通过人口学特征去推断。另外，对内容的需求偏好往往反映了一个人当前的综合状态－社会经济地位、文化倾向、人口学特征－可以预期是一个很有效的探测点。
相关的问题设计很简单，只是在问卷结尾处加一道内容偏好的多选，备选项参考了主流新闻app的版块分类。
您平时使用网易新闻客户端时，喜欢看哪些内容？（多选）
科技互联网、数码IT
体育赛事、运动健身
财经金融、投资理财
游戏动漫、二次元
影视音乐、摄影旅行
健康医疗、营养养生
社会民生、房产资讯
国际政治局势
历史掌故、军事动态
神跟贴、幽默段子
其他（请注明）
这里有个问题简单说明一下－为什么要把选项切到这么碎，而不加以合并。这种处理方式实际是基于以下两点考虑。
希望基于用户认知形成分类－当然可以根据对业务的理解，对选项内容进行合并和抽象，但预设的归类方式与用户会采用的未必吻合。如果希望降低预设对用户选择的影响，完全通过用户反应情况来建立项目间的关联，那不妨呈现具体细致的选项。这好比景观规划时，直接在行人足迹最深的地方铺路。
准确性和易答性－抽象度越高的描述，包含的信息越多，不同人脑中的典型代表差异会越大，也越可能包括的矛盾案例。回答“是不是喜欢狗”时，更有可能陷入“我有点喜欢松狮但是又有点讨厌泰迪到底选不选喜欢呢”的纠结中，而问“是不是喜欢泰迪”就会更加容易回答。另外，抽象度高的选项，往往需要详细描述并给出具体例子，进一步增加阅读难度；而答题者处理短而多的选项时，未必需要比长而少的选项花费更多认知资源。
因此，问题选项呈现采用了具体细分的列举，而细分项的合并化简，则将在问卷回收后，根据用户的实际反应来处理。
（三）让分析过程更简明－数据降维
问卷投出去一段时间后，样本池渐渐上涨，内容偏好的数据饼图五彩斑斓地分布起来。这时就发现问卷选项细碎的不方便之处－同时考虑18个选项远远超出了人类工作记忆的负荷，让分析过程颇有些尾大不掉。当然这是意料之中的。如前所述，之所以把选项粒度做得很小，是希望通过用户的实际选择模式来找到相关联的内容。因此，首先要使用一下因子分析的方法，把数据进行浓缩。
岔开几句简单说说因子分析的用途。所谓因子分析，是处理多变量数据的一种常用的预处理方法，使用场景是当实际用于测量的变量较多且相关时，可以将比较琐碎繁多的变量，用几个易于解释的因子表达出来，从而更清晰地展示数据的结构和规律。拿这个项目来说，我们得到的多选题数据是用多重二分法表示的－每一个选项作为一个单独变量－题目反应数据共包括18个变量（如下图）。显然这些变量之间是存在相关关系的，存在归纳的可能，这正符合因子分析的使用场景。
因子分析使用SPSS完成，操作过程略去不表，分类结果如下图所示，将18个选项浓缩为5类因子。根据每个选项在各因子上的载荷（也就是原始选项和因子之间的相关系数），可以看出该因子大概代表了哪一类内容。为了便于理解，分别给它们起了一个比较直观的名字。如下图所示。
5个因子作为新的变量保存下来（如下图，注意保留下来的变量已经标准化为Z分数），留作后续进行用户聚类的依据。每个用户对某个因子分数越高，就意味着对该因子对应内容的偏好程度更强。例如第2个用户，就明显是“女性生活”因子相关内容的重度浏览者。
（四）为用户打内容偏好标签－聚类分析
完成了数据化简，接下来根据用户在五个内容偏哈因子上的得分，对用户进行聚类分析。由于因子本身为Z分数，不用再进行标准化处理，直接分析即可。
这里再岔开几句简单说说聚类分析的原理。聚类算法的原理是通过计算各个案例点在变量空间中的距离远近（SPSS中计算距离的方法有30多种，大多数情况只选择默认设置的欧式距离就好），来把它们分簇处理的。变量空间名字听起来挺厉害，其实就是把n个变量当作n个坐标轴，参照三个维度构成三维“空间”的说法，将n个变量的情境称为n维空间。每个case在这n个变量上的取值，构成了一个n维坐标，根据坐标可以计算case间的距离，根据距离远近形成不同的分类簇。例如，上图表格中每一行都是一个五维坐标向量，描述了该行对应用户在“内容偏好空间”的位置，不同用户位置间的距离越近，就越可能被归为一类。
聚类分析仍使用SPSS完成，结果如下表所示。表格中数字代表每类用户对特定内容的偏好程度，数字越大偏好程度越高。根据几类用户的内容偏好模式分别起一个鲜明易记的名字，例如，给更偏好“女性生活”与“宅文化”内容的用户打上“时尚丽人”的标签。
现在每一位样本中的用户都有了一个内容偏好标签，这个标签也保存为一个新的变量（如下图），留待与其它题目进行交叉分析。
首先就可以用内容标签与人口学变量来交叉分析一下，验证一下偏好某类内容的用户是否具有比较特殊的人口学属性。结果如下图所示（具体数据略）。可以看到，尽管由于样本中男性比例偏大造成一些bias，相对趋势的比较还是验证了很多印象：例如“时尚丽人”中年轻女性的比例显著偏高，“财经科技控”高学历高收入比例显著高等等。
纳入与人口学变量的交叉分析结果，最终得到的用户分类如下表所示。从样本占比推断，“随意用户”和“时政历史迷”最有可能是客户端主流人群，这与业务经验得到的印象是一致的。
（五）哪类用户是话题版块的核心用户
现在关键的问题来了，画像的几类人群，哪类是话题版块的核心用户、需要重点发力运营呢？
首先看看活跃用户中各类用户的占比（活跃度根据问卷中觉知情况和使用频次的问题答案来判断）。由下图可以看到，活跃用户的类别分布和整体差异并不大－“随意用户”和“时政历史迷”占了最大的部分。这也符合预期，毕竟话题版块的流量从客户端整体渗透过来，各类用户体量上不应该有太大的差异
那么哪种用户的增量潜力比较大呢？这个问题反过来看比较清晰－我们可以这样假设，如果某类人群中活跃用户比例越大，满意度越高，那么这类用户更可能是话题版块的目标用户。
首先将活跃度与内容偏好进行交叉分析。可以看到，“时尚丽人”中话题使用活跃者占比最高（42％），无觉知者占比则最低（29%）－年轻女性用户看起来天然对话题讨论很敏感。
再看一下满意度的差异。年轻女性用户对话题社区各方面的满意度都高于其他用户，她们在话题社区玩得更开心。
所以，给出结论&建议－年轻女性用户虽然在话题版块的体量不大，但她们的活跃度和满意度更高，讨论质量更好，对促进话题社区良性发展有很大帮助，可以从相关内容版块进行重点引流。而反过来，如果话题社区这种形式对“时尚丽人”独具吸引力，也可以将话题版块与时尚、母婴、情感等垂直频道打通，通过话题运营进行流量反哺。
最后，本例仅仅是基于调研目的灵活处理的一个例子，适合短平快的项目；如果需要系统了解用户，深入挖掘用户需求，更大的样本量和更扎实的定性研究依然是必不可少的。不过在日常工作中，有意识地以经济敏捷的方式扩展关于用户的基础知识，也不失为一种很好的积累沉淀吧。
（本案例数据和结论仅作为例子展示，不涉及真实情况）
更多课程...&&&
更多咨询...&&&
每天2个文档/视频
扫描微信二维码订阅
订阅技术月刊
获得每月300个技术资源
|&京ICP备号&京公海网安备号【因子载荷】SPSS---因子分析_牛宝宝文章网【因子载荷】SPSS---因子分析专题：一、在SPSS统计分析软件的“Analyze”（分析）菜单的“DataReduction”（数据处理）中选择“Factor”（因子）命令，在弹出的“Factoranalysis”（因子分析）对话框中，从框的左侧的变量列表中选择x1、x2、x3、x4、x5、x6、x7····添加到右边的“Variables”（变量）框中。二、单击“Descriptives”（分类叙述）按钮，弹出“Factoranalysis：Descriptives”（因子分析的分类叙述）对话框。①选择输出相关的统计量在因子分析的分类叙述对话框中的“Statistics”（统计学）框中选择需要输出的那些相关的统计量。选择“UnivariateDescriptives”（变量叙述）项，将输出各变量的均数与标准差。选择“Initialsolution”（初始解）项，将输出初始分析结果。即输出的是因子提取前分析变量的公因子方差。对于主成分分析而言，这些值要进行分析变量的相关或协相关矩阵的对角元素；对于因子分析而言，输出的每个变量用其它变量作预测因子的载荷平方和。②数据的检验在因子分析的分类叙述对话框中的“CorrelationMatrix”（相关矩阵）框中，选择“Coefficients”（相关系数）项，要求计算相关系数矩阵；选中“Significancelevels”（显著水平）项，将给出每个相关系数的单尾假设检验的水平；选中“Determinant”（行列式）项，将计算相关系数矩阵的行列式；“Inverse”是相关系数矩阵的逆矩阵项；选中“Reproduced”（再生相关矩阵）项，将给出因子分析后的相关矩阵、剩余方差（原始相关与再生相关之间的差值）；选择“Anti-image”（反映像相关矩阵检验法）项，如果反映像相关矩阵中有些元素的绝对值较大，则说明这些变量不宜进行主成分分析；选择“KMOandBartlettTestofSphericity”（KMO检验法和巴特利特球形检验法）项，将对数据进行KMO检验法和巴特利特球形检验法检验。三、选择因子提取的方法单击“Factoranalysis”对话框的“Extraction”（求解）按钮，进入“Factoranalysis：Extraction”（因子分析求解）对话框，选择因子提取的方法。①分析方法在“Method”（方法）下拉框中，系统提供了七种因子提取的方法。A.主成分分析法（Principalcomponents）该方法假定原变量是因子变量的先行组合。第一主成分有最大的方差，其余主成分的方差依次减少。B.未加权最小平方法（Unweightedleastsquares）该方法不记对角元素，使原相关矩阵和再生相关矩阵之差的平方和最小。C.广义最小二乘法（Generalizedleastsquares）用变量的倒数值加权，使原相关矩阵和再生相关矩阵之差的平方和最小。D.最大概似法（Maximumlikelihood）最大概似法也称极大似然估计法。此方法不要求多元正态分布。E.主坐标分析法（Principalaxisfactoring）主坐标分析法也称主轴因子法。该方法从维相异性矩阵出发，主坐标建立在排序坐标系与主分量分析旋转后的坐标系一样，主坐标不仅正交，而且，第一、二主坐标依次按个点在该轴的平方离差的大小排列，个点对不同2个周到交叉积均为零，因此可以取较少的排序坐标去描述群落（或）样方，而使信息的损失最小。F.因子法（Alphafactoring）G.映像因子提取法（Imagefactoring）映像因子提取法也叫多元回归法。由Guttman提出，把1个变量当作其它各个变量的多元回归。②提取因子的依据“Analyze”框主要用于选择提取因子变量的依据。选中“Correlationmatrix”项，表示以相关矩阵为依据提取因子变量；选择“Covariancematrix”项，将依据协方差变量提取因子变量。③确定因子变量个数的标准“Extract”（求解）框主要用于指定因子个数的标准。在特征向量指标值（Eigenvaluseover）后的文本框中可以输入1个特征值，系统将提取特征值大于该值的因子作为因子变量。该法是SPSS的默认设置，默认的特征值是1。在因子数指定法（Numberoffactors）后的文本框中输入指定要提取的因子变量个数，系统将提取个因子作为分析的结果。④选择输出与因子变量提取的有关信息“Display”（显示）框主要用于选择输出与因子提取有关的信息。选择“Unrotatedfactorsolution”（未旋转的因子答案）项，系统将输出未旋转的因子载荷矩阵；选中“Screeplot”（碎石图）项，系统将输出因子变量及按大小排列的其特征值的散点图。⑤选择收敛迭代次数在MaximumiterationsofConvergence”（最大迭代次数）后的文本框中输入指定分析的最大收敛迭代次数，系统将在迭代到指定的最大收敛迭代次数后终止分析。系统默认的迭代次数是25。四、因子载荷矩阵的旋转与结果输出单击“Factoranalysis”对话框的“Extraction”（旋转）按钮，进入“Factoranalysis：Extraction”（Rotation）对话框，选择因子载荷矩阵的旋转方法。系统默认不进行旋转（None）。①选择因子载荷矩阵旋转的方法系统在Method框中设置了5中因子载荷矩阵的旋转方法，系统默认不进行旋转（None）。A.正交旋转法（Varimax）正交旋转法也叫方差极大旋转法，它使得每个因子上的具有最高载荷的变量数目减少，可以简化因子的解释范围，而使因子变量典型化。B.直接斜交旋转法（DirectOblimin）选中该项，可以在下面的矩形框中输入（δ）值，该值在0与1之间，0之产生最大的相关系数。C.四分最大正交旋转法（Quartimax）此法使得每个变量中需要解释的因子数最少。D.平均正交旋转法（Equamax）平均正交旋转法是正交旋转法和四分最大正交旋转法的结合，对变量和因子同时进行旋转处理。E.斜交旋转法（Promax）允许因子间相关，比正交旋转法收敛快，适用于大样本数据的分析。②旋转因子载荷分析结果的输出“Display”（显示）框主要用于指定旋转因子载荷分析结果的输出信息。选中“Rottedsolution”项，系统将输出选中后的因子载荷矩阵，对于正交旋转法，给出的是旋转后的因子矩阵模式和因子旋转矩阵；对于斜交旋转法输出的是旋转后的因子矩阵模式、因子结构矩阵和因子间的相关矩阵。选择“Loadingplot”（输出载荷散点图）项，系统会给出两两因子为坐标的各个变量的载荷散点图。如果由2个因子，则给出个原始变量在因子1和因子2坐标系中的散点图；如果多于两个因子，系统只输出前三个因子的三维因子载荷散点图。如果只提取出1个因子，则不会输出散点图。选择此项，给出的旋转后的因子载荷图。五、因子得分设置单击“Factoranalysis”对话框的“Scores”（得分）按钮，进入“Factoranalysis：Scores”（因子分析得分）对话框，对因子得分进行设置。①因子得分结果的保存选中“Saveasvariables”项，系统将会把因子得分作为新变量保存在数据文件中。②因子得分的估计方法在Method框中，系统提供了三种因子得分的估计方法。A.回归因子得分法（Regression）其因子得分的平均值为0，方差等于估计因子得分与实际因子得分之间的多元相关的平方。B.巴特利特法（Bartlett）因子得分的平均值为0，超出变量范围的各因子平方和被最小化。C.安德森-罗宾法（Anderson-Robin）因子得分的平均值为0，标准差为1，因子之间不相关。③因子得分结果的输出选中“Displayfactorscorecoefficientmatrix”（输出因子得分系数矩阵）项，系统将输出因子得分系数矩阵。六、设定缺失数据的处理方法和其分析结果的输出单击“Factoranalysis”对话框的“Options”（选择）按钮，进入“Factoranalysis：Options”（因子分析选择）对话框，指定其它因子分析结果的输出，同时选择对缺失数据的处理方法。①缺失数据的处理“MissingValues”框用于选择缺失数据的处理方法。选中“Excludecaseslistwise”项，将去除所有含缺失数据的样本和、再进行分析；选择“Excludecasespairwise”项，当分析计算涉及含有缺失值的变量，则去掉在该变量上的确实值样本；选择“Raplacewithmean”项，当当分析计算涉及含有缺失值的变量时，用平均值代替该缺失值。②载荷系数的输出格式“CoefficientDisplayFormat”框用于选择载荷系数的输出格式。选择“Sortedbysize”格式，载荷系数将按照数值大小排列，并构成矩阵，使得在同一因子上具有较大载荷的变量排列在一起，便于分析。选中“Suppressabsolutevalueslessthan”项，系统将不输出绝对值小于指定值的载荷系数。选中此项，需要在后面的文本框中输入1个0～1之间的数，系统默认值是0.1。选择此项可以突出载荷较大的变量。转载请保留本文连接：分享到：相关文章声明：《【因子载荷】SPSS---因子分析》由“情似戏子”分享发布，如因用户分享而无意侵犯到您的合法权益，请联系我们删除。TA的分享以下试题来自：
多项选择题因子分析中，第j个因子的方差贡献率（）
A.是因子载荷矩阵中各列元素的平方和
B.是因子载荷矩阵中各列元素的平方和占p个变量的总方差之比
C.是因子载荷矩阵中各行元素的平方和占p个变量的总方差之比
D.是说明变量所包含的原始信息被公共因子所解释的部分大小的
E.是衡量各个公共因子相对重要程度的一个指标。
为您推荐的考试题库
您可能感兴趣的试卷
你可能感兴趣的试题
A.主成分的方差矩阵是对角矩阵
B.第k个主成分的方差为对应的特征根
C.主成分的总方差等于原变量的总方差
D.主成分的方差等于第k个主成分与第j个变量样本间的相关系数
E.任意两个主成分的方差是不相关的。
A.各行元素之和
B.各行元素平方和
C.各列元素之和
D.各列元素平方和
A.第k个特征根
B.第k个特征根所对应的特征向量
C.第k个特征根所对应的方差贡献率
D.第k个特征根所对应的累计方差贡献率
A.相关系数为0
B.线性回归系数为0
C.可决系数为0
D.估计标准误差为0
E.变量x与y不一定独立您所在位置： &
&nbsp&&nbsp&nbsp&&nbsp
应用多元统计分析习题解答_因子分析.doc 11页
本文档一共被下载：
次 ,您可全文免费在线阅读后下载本文档。
下载提示
1.本站不保证该用户上传的文档完整性，不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
2.该文档所得收入(下载+内容+预览三)归上传者、原创者。
3.登录后可充值，立即自动返金币，充值渠道很便利
需要金币：150 &&
应用多元统计分析习题解答_因子分析
你可能关注的文档：
·····
··········
第七章因子分析7.1试述因子分析与主成分分析的联系与区别。答：因子分析与主成分分析的联系是：①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的，都是从一个协方差阵出发，利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇，将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳，那么因子分析可以说是将原指标给予分解、演绎。因子分析与主成分分析的主要区别是：主成分分析本质上是一种线性变换，将原始坐标变换到变异程度大的方向上为止，突出数据变异的方向，归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外，主成分分析不需要构造分析模型而因子分析要构造因子模型。7.2因子分析主要可应用于哪些方面？答：因子分析是一种通过显在变量测评潜在变量，通过具体指标测评抽象因子的统计分析方法。目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。具体来说，①因子分析可以用于分类。如用考试分数将学生的学习状况予以分类；用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。即是探索未能观察的或不能观测的的潜在因素是什么，起的作用如何等。对我们进一步研究与探讨指示方向。在社会调查分析中十分常用。③因子分析的另一个作用是用于时空分解。如研究几个不同地点的不同日期的气象状况，就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。7.3简述因子模型中载荷矩阵A的统计意义。答：对于因子模型因子载荷阵为与的协方差为：==若对作标准化处理，=,因此一方面表示对的依赖程度；另一方面也反映了变量对公共因子的相对重要性。变量共同度说明变量的方差由两部分组成：第一部分为共同度，它描述了全部公共因子对变量的总方差所作的贡献，反映了公共因子对变量的影响程度。第二部分为特殊因子对变量的方差的贡献，通常称为个性方差。而公共因子对的贡献表示同一公共因子对各变量所提供的方差贡献之总和，它是衡量每一个公共因子相对重要性的一个尺度。7.4在进行因子分析时，为什么要进行因子旋转？最大方差因子旋转的基本思路是什么？答：因子分析的目标之一就是要对所提取的抽象因子的实际含义进行合理解释。但有时直接根据特征根、特征向量求得的因子载荷阵难以看出公共因子的含义。这种因子模型反而是不利于突出主要矛盾和矛盾的主要方面的，也很难对因子的实际背景进行合理的解释。这时需要通过因子旋转的方法，使每个变量仅在一个公共因子上有较大的载荷，而在其余的公共因子上的载荷比较小。最大方差旋转法是一种正交旋转的方法，其基本思路为：①A其中令的第列元素平方的相对方差可定义为②最大方差旋转法就是选择正交矩阵，使得矩阵所有m个列元素平方的相对方差之和达到最大。7.5试分析因子分析模型与线性回归模型的区别与联系。答：因子分析模型是一种通过显在变量测评潜在变量，通过具体指标测评抽象因子的统计分析方法的模型。而线性回归模型回归分析的目的是设法找出变量间的依存(数量)关系,用函数关系式表达出来。因子分析模型中每一个变量都可以表示成公共因子的线性函数与特殊因子之和。即，（）该模型可用矩阵表示为：而回归分析模型中多元线性回归方程模型为：其中是常数项，是偏回归系数，是残差。因子模型满足：（1）；（2），即公共因子与特殊因子是不相关的；（3），即各个公共因子不相关且方差为1；（4），即各个特殊因子不相关，方差不要求相等。而回归分析模型满足（1）正态性：随机误差（即残差）e服从均值为0，方差为(２的正态分布；（2）等方差：对于所有的自变量x，残差e的条件方差为(２，且(为常数；（3）独立性：在给定自变量x的条件下，残差e的条件期望值为0（本假设又称零均值假设）；（4）无自相关性：各随机误差项e互不相关。两种模型的联系在于都是线性的。因子分析的过程就是一种线性变换。7.6设某客观现象可用X=()’来描述，在因子分析时，从约相关阵出发计算出特征值为由于,所以找前两个特征值所对应的公共因子即可，又知对应的正则化特征向量分别为(0.707,-0.316,0.632)’及（0，0.899，0.4470）’，要求：（1）计算因子载荷矩阵A，并建立因子模型。（2）计算共同度。（3）计算第一公因子对X的“贡献”。解：（1）根据题意，A==建立因子模型为（2）（3）因为是从约相关阵计算的特征值，所以公共因子对X的“贡献”为。7.7利用因子分析方法分析下列30个学生成绩的因子构成，并分析各个学生较适合学文科还是理科。序号数学物理化学语文历史英语
1 65 61 72 84 81 79
2 77 77 76 64 70 55
3 67 63 49 65 67 57
4 80 69 75 74
正在加载中，请稍后...

主成分分析因子载荷过程中如何选择在哪些变量上有较大载荷

我要回帖

更多关于因子分析选择变量的文章

随机推荐

主成分分析 因子载荷过程中如何选择在哪些变量上有较大载荷

我要回帖

更多关于 因子分析选择变量 的文章

随机推荐

主成分分析因子载荷过程中如何选择在哪些变量上有较大载荷

更多关于因子分析选择变量的文章