主成分分析案例
青岛旅游者的相关调查
摘要:
以上分析结果可以看出,关于消费者旅游过程中的一些要素对于在旅游者的重要程度,可以综合用两个新指标,来描述.它们的代
性由大到小.其贡献率分别为59.173%,33.701%.累计贡献率为92.875%.另外对于如安全措施,住宿条件,餐饮条件,物价水平等的进一步分析.可以得出哪些要素对于各阶段年龄,不同性别的人来说没有很大差异,哪些随着年龄的增长有很大的关系,也就是受年龄的影响比较大.
关于来青岛旅游者消费的调查
随着居民生活水平地提高,旅游消费已经越来越受青睐,尤其是青岛这样的沿海城市。在现实中,影响消费者旅游方面的因素又有很多,如景区的环境,安全措施,管理条件,景区周边的交通 ,餐饮,娱乐,住宿等等。按性别和年龄调查不同人群得到十组数据,进行统计、分析、研究;十个组分别对各要素进行打分,最重要的打9分,最不重要的打1分,其余在(1,9)之间。其数据资料如下图
分组 安全交通住宿物价管理景区餐饮娱乐
措施 情况 条件 水平 情况 环境 条件 活动
7.0 6.6 5.4 5.4 4.5 8.4 8.6 8.5 (男
15岁以
下)
7.4 6.2 5.9 5.7 4.6 7.9 8.3 7.9 (男
16~20
岁)
7.8 7.0 6.4 7.2 5.6 7.5 7.7 7.1 (男
21~30
岁)
8.1 6.9 7.5 7.3 6.2 8.6 7.4 5.9 (男
31~40
岁)
8.7 6.3 6.9 7.7 7.0 8.9 6.9 4.5 (男
40岁以
上)
6.9 6.4 5.1 6.0 4.7 7.3 8.2 8.6 (女
15岁以
下)
7.2 6.7 6.7 6.3 4.6 7.6 7.8 7.8 (女
16~20
岁)
8.3 5.9 6.9 6.6 5.4 8.1 7.4 6.7
(21~30
岁)
8.9 6.5 5.8 7.0 5.9 8.8 6.8 5.8
(31~40
岁)
8.6 6.2 5.5 8.0 6.8 9.0 6.3 4.3 (女
40岁以
上)
对上述数据进行处理; R = ( )
=( - )/ = (j =1,2……10)
= (j =1, 2,…10)
= / (i, j =1,2……10)
R=
求解R的特征根和特征向量,可知前两个的特征根的累计贡献率为92.875%,所以取
前两个主成分来综合描述原来10项分组的指标。具体结果为, =5.9173,
=3.3701, = 10。
特
征
评 向 价 量 分
组
0.3297035 -0.296336
0.3617694 -0.248399
0.3823245 -0.058831
0.2951710 0.3311987
0.1833513 0.4831797
0.2951710 -0.356257
0.3440921 -0.265286
0.3806801 0.0953286
0.3280591 0.2963357
0.1886957 0.4575772
5.9173 3.3701 特征根
59.173% 33.701% 贡献率/10
59.173% 92.875% 累计贡献率
对以上两个主成分进行分析:
1 :作为第一主成分
的各分量取值为正,除了,以外,取值大小差异不大,表明对哪一组的要素对于旅游者来说最看重。而对于和来说,可能由于年龄的原因,对某种要素的评价较其他各年龄段的要更看重或者认为更不重要。总之,这个新的综合指标为一般重要指标.如对于安全措施,餐饮条件,交通条件,景区环境等不同年龄段,不同的性别之间差异即使有,但是差异不大.那么,对于青岛旅游部门来说,就要加强这几方面的管理,如着重提高餐饮质量, 监管措施,尽量避免旅游交通拥挤的现象,提高以上各方面的投入力度, ,这样才能使游客的满意程度达到最大,也有利于提高青岛的城市形象.
2:作为第二主成分
无论男性还是女性,随着年龄的增加,对某一种要素的取值由负到正,由小到大。它表明出年龄对要素感觉重要性的影响。因此为年龄指标.对于不同年龄的旅游者来说,可以根据具体情况,设定具体的价格,如40岁以上的可以价格便宜些,尽量使销量增加.而对于年轻人来说,他们需求的是使自己从旅游中得到最大乐趣,而不太在乎商品价格.所以价格仍然可以按正常景区商品价格来定.对于娱乐活动这一要素,随着年龄的增加,对于年龄大的人来说就越不重要,这就需要景区抓住年轻人这一特性,增加一些娱乐设施,提高景区的经济收入.
以上分析结果可以看出,关于消费者旅游过程中的一些要素对于在旅游者的重要程度,可以综合用两个新指标,来描述.它们的代表性由大到小.其贡献率分别为59.173%,33.701%.累计贡献率为92.875%.另外对于如安全措施,住宿条件,餐饮条件,物价水平等的进一步分析.可以得出哪些要素对于各阶段年龄,不同性别的人来说没有很大差异,哪些随着年龄的增长有很大的关系,也就是受年龄的影响比较大.
附表:
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared Loadings Component Total % of Variance Cumulative % Total % of Variance Cumulative % 1 5.917 59.173 59.173 5.917 59.173 59.173 2 3.370 33.701 92.875 3.370 33.701 92.875 3 .373 3.727 96.602
4 .179 1.785 98.387 5 .105 1.049 99.436 6 .041 .410 99.846 7 .015 .154 100.000 8 4.47E-017 4.47E-016 100.000 9 -6.56E-017 -6.56E-016 100.000 10 -3.50E-016 -3.50E-015 100.000 Component Matrix(a)
Component
1 2
VAR00001 .802 -.544
VAR00002 .880 -.456
VAR00003 .930 -.108
VAR00004 .718 .608
VAR00005 .446 .887
VAR00006 .718 -.654
VAR00007 .837 -.487
VAR00008 .926 .175
VAR00009 .798 .544
VAR00010 .459 .840