调研问卷中多选题的分析方法探讨(1)
使用调研问卷的定量研究中,为了更全面地了解研究内容、更广泛地收集信息,经常会用到多选题,但由于多选题多指向性的特点,除了频数表和交叉表(只能与单选题做交叉),较少用到其他的分析方法,损失了很多有用的信息。其实,如果调研时能善用多选题,并在分析时选取适当的方法,就能够充分利用多选题包含的信息,得到更有价值的结论。
本篇主要探讨带有分类性质的多选题,如何进行深入分析,得出分类相关的结论。
带有分类性质的多选题
一般而言,在设置多选题时,并没有想到分类,只是想了解各种情况的排序情况。其实,某些多选题,已经隐含了分类的信息,透过这种潜在的分类信息,能够更深入地了解用户的内在想法、心理特征,甚至推测他们的行为习惯,与其他行为题目相互照应。
带有分类价值的多选题一般具备以下几个特征:
1、题干本身包含分类的含义,如最常遇到的障碍、最亟待解决的问题、最需要的功能、最常用的工具等,或直接询问:哪些服务最适合划分为一类。
2、选项涵盖内容较分散,如果选项都是集中某一个细节点,那就没有分类的必要;只有当选项内容包含多个方面的细节点,且每个方面不止一个细节点,才有分类的必要。此时的方面、细节需根据业务辩证地看,做要取决于选项是否有分类的意义。
3、选项一般超过10个,选项太少没有分类的必要,只有超过一定数量,分类才有价值,分类的目的是为了通过细节概括出看问题的维度,更深入地解读用户心理或行为。
4、限选,这不是必须的,主要根据经验判断,用户在做选择时,是否会倾向于全选,跟题干的问法有关。无法做出准确判断,且需要对选项做出优先级排序时,通常采用限选的方式,可以根据研究目的,限定全部选项数量的一半,或1/3。
5、数据为0/1格式,多选题转换成此种格式,宜于做深入分析。
当有了带有分类价值的多选题,就可以采用下文介绍的方法进行深入分析。
本文中的例子是半年前做过的一次定量调研,带有分类价值的多选题,主要考察:淘宝卖家在经营店铺时,最需要的功能。
聚类分析
首先,采用谱系聚类(Hierarchical cluster)的分析方法,为了使得变量的分类趋于均匀,选择Ward’s法,二分类变量(Binary)欧式平方距离(Squared Euclidean distance)测距方法,查看相应的统计量(略),并结合业务,找出分类数。谱系聚类的树状图查看分类结果比较清楚,也比较方便,建议多用。
综合分析可知,本例的卖家功能划分五类或七类比较合适,但个别分类不易解释,且出现单个类别中只有一个功能,后续应用的价值有限。
因子分析
聚类分析结果不理想,也可以采用因子分析的方法。
经多次尝试,去掉“直通车关键字检索”单独成为一类,利用主成分分析法(Principal components),方差化最大旋转(Varimax),得到KMO值为0.545,Bartlett 球形检验的值为1041.324(df=120)达到显著,可以进行因子分析。最终萃取出7个公因子,累积方差贡献率为55.1%(详见下表),解释效果尚可。
结合业务来看,这些分类能够很好地被解释,从而反映出卖家的心理特征和需求方向。
注:由于本例是多选题,并非量表打分题,且侧重考查的不是变量间的建构效度,仅借用了因子分析的方法进行分类,因此KMO检验和累积方差贡献率的具体值,并没有真正的因子分析那么重要,但必须要查看,甚至需要做信度检验,也要查看重构的相关矩阵残差值,做到心中有数,知其然也要知其所以然。本例中,重构的相关矩阵中,有超过半数残差值大于0.05,如果按照真正的因子分析模型来判断,拟合效果并不好。
相关分析
还有一种简单易行的方法,就是相关分析。经统计学家研究表明,0/1变量同样适用于皮尔逊相关系数(Pearson Correlation)。
本例将17个功能做相关分析,得到简化的相关矩阵如下表:
根据研究目的,此表只需看正向、且相关非常显著的选项即可,但17*17个表格中127个有关联,如何做深入分析呢?根据选项间的关系强弱、是否显著等,可以画出图形,如此,就可以清晰地看出各选项之间的关系,进行分类。
本例中,此种方式的分类结果(如下图),易于解释,且分类数量恰当,便于后续应用。
三种方法所得结果的对比
以上提到的三种方法,所得结果如下表:
可以看出,聚类分析的结果容易出现不易解释的分类,因子分析的结果划分得更细化,相关分析的结果可以根据需要,在一定范围内进行调节,得出适当的分类数量。
不同的案例,应该多尝试不同方法,即便相关分析的结果最可靠,其他方法的结果也能起到补充的作用,以获得更加有价值的研究结论。
进一步的应用
得到合理的分类后,还可以结合选项的频率,给每一个类别赋值,得到类别的优先级排序。
如果最终选定了因子分析的分类结果,单个类别中每个选项的权重可以有因子载荷计算而来;当然,也可以跟聚类分析、相关分析的结果一样,采用算数平均、或加权平均的方法,计算每个类别的平均值。
小结
综上所述,带有分类性质的多选题,分析的流程如下:
1、确定是否有带有分类价值的变量
2、尝试多种方法进行分析,找出最合理的分类
3、利用加权平均,或其他方法,计算每个类别的比例,进行排序
建议继续学习:
扫一扫订阅我的微信号:IT技术博客大学习
- 作者:渡劫 来源: Taobao UED Team
- 标签: 调研问卷
- 发布时间:2011-06-20 13:35:20
- [46] 界面设计速成
- [40] 视觉调整-设计师 vs. 逻辑
- [40] Oracle MTS模式下 进程地址与会话信
- [38] android 开发入门
- [38] IOS安全–浅谈关于IOS加固的几种方法
- [36] 程序员技术练级攻略
- [36] 如何拿下简短的域名
- [35] 图书馆的世界纪录
- [35] 【社会化设计】自我(self)部分――欢迎区
- [32] 读书笔记-壹百度:百度十年千倍的29条法则