我接触过的最高端的问卷是中国社会科学院和全国人大出品的全国性综合社会调查CGSS(China Comprehensive Social Survey),我有幸参与在本次调查中。家访及数据统计及报告撰写。这样一份比较有代表性的调查问卷,选项仍然有限,问题也很开放。
1,我先定义一下社会学的问卷,嗯,毕竟和心理学不一样。
(1)社会学调查问卷:是社会调查中用来收集数据的工具。问卷是精心设计的问题形式,其目的是用来衡量人们的行为、态度和社会特征。它收集有关社会现象和人们社会行为的各种数据。
(2)根据社会调查问卷的使用方法,问卷分为两种不同的类型:
①一种是自填式问卷,由调查人员发给被调查者,由被调查者自己填写;
②另一种问卷称为访谈问卷,即调查者根据问卷向被调查者提问,并根据被调查者的回答填写问卷。
这两类问卷在设计过程中,设计原则、内容和结构相同或相似,但在设计方法和使用方法上存在一定差异。因此,社会学问卷会采用不同的调查方法和具体的调查方法来收集数据。
2、简单介绍一下社会学问卷的结构,后面数据分析会提到。
(1)求职信。
(2)指南
(3)问答
(4)代码和其他信息
我其实心理问卷并没有太多,所以我觉得新封面和指南应该差不多,这两个就省略了。再来看看后两者,@刘科说的也很有意思。 .
那么,先看“问答”,这个方面。
问答是整个问卷的主题部分,也是整个问卷设计的主要内容。
我们来看看社会学的定义:
社会学是一门关于社会良性运行和协调发展的条件和机制的综合性和具体的社会科学。
郑航生《社会学概论》第二版
因此,社会学问卷的题型必须分为开放式/封闭式两种
开放式问题:即只提出问题,但不为回答者提供具体答案的问题,回答者可以根据自己的情况自由回答。简而言之,这只是一个问题,没有答案。
●主要优点:让受访者能够充分自由地表达自己的观点,因此获得的数据丰富而生动。
主要缺点:数据编码和统计分析困难,对受访者有一定的了解和表达能力。填写需求需要大量的时间和精力,还可能会产生一些无用的数据。
封闭式提问:提问的时候,也会给出多个答案,要求受访者根据实际情况选择。
主要优点:填写方便,省时省力,数据易于统计分析。
●主要缺点:数据失去自发性和表达性,答案中的一些错误不容易发现。
问题中提到的社会学问卷有时难以分析,或者需要建立数据库进行数据分析。这肯定存在,我们并不是说一切都很好。至少革命导师马克思说过:综合来看问题,矛盾的两个方面是对立统一,矛盾无处不在~~~~
所以! ! !根据开放式和封闭式问题的不同特点,研究人员经常在不同的调查中使用它们。
在探索性调查中,经常使用由开放式问题组成的问卷; (我想不用解释什么是探索性研究了……嗯~o(* ̄▽ ̄*)o)
在大规模的正式调查中,主要使用由封闭式问题组成的问卷。 (这有利于建立数据库来分析和处理数据(* ̄︶ ̄)y)
因此,这并不意味着心理问卷很好,也不意味着社会学问卷不方便。 ,但不同的学科有自己的特点,这就决定了问卷形式和提问形式的差异。也就是说,有些问题的答案不能完全用封闭式问题来概括或解释。 ,或者,要回答一些问题,你真的不知道如何列出选项。
举个栗子:2014年我参加了湖南省“新公民就业情况调查”,问:“你现在的职业”,嗯,古代有“三百六十”和说“什么都出冠军”,我们现在有多少行业?我猜它已经结束了很多次?
这些新市民离开土地,取得城市户口,实现再就业。这个时候,他们应该列出几十万个选项吗?很明显,列出几个符合当地经济条件和社会发展、很多人会从事的职业作为主要选择(例如,一个社区目前在很多地方都在进行房地产建设,那么一定有相当多的人从事建筑相关职业的工作,那么可以把“建筑行业”作为主要选项),玩了七七八之后,放一个“其他”,哦,基本可以覆盖大多数情况。
正如标题所说,有些是两个,有些是多个。嗯,问题问的是“性别”的问题……多选呢@( ̄- ̄)@好,换一个,问一下“户籍类型”,选择的也是“城市” /农村/集体”。如何使用标准的四个选项...
其次,即使不是这类题,有些题的选项也不能设计成很标准的四,或者是固定的数字。
那么,社会学问卷与心理学问卷最大的区别在于,社会学主要询问社会成员的态度或社会成员的相关状况。因此,很难说选项不标准。
然后,好吧,我们社会学仍然可以使用 SPSS 软件进行编码和数据输入以及问题的最终数据分析。它也易于使用的软件进行交叉比较、参数检验(卡方检验、T 检验、GAMMA 检验),以及参数分析、回归分析...
我之前的回答中提到了相关的数据分析和数据检查的内容,那么,这第三个就是简单粗暴的说一下这方面的内容。我们首先要了解的是,数据分析和数据测试这两个方面可以简单归类为“社会统计”,所以我先给社会统计一个简单的定义:
Social Statistics(社会统计)是统计学的一个应用分支,它系统地收集、组织、分析和呈现人类在社会环境中的行为数据,揭示数据的本质,帮助个人、团体、企业或政府推断未来的情况。做出适当的决定。研究人员采用随机抽样的方法获得母体或样本数据后,可以发现数据的规律性并进行实证研究。由于社会统计的研究对象是人类社会,所以往往以个人为分析单位;因此,在测量尺度上,不仅是等距尺度的数据,更注重名义尺度和序数尺度的数据。此外,“人”具有主观意识,很容易影响问卷的回答和回收,甚至分析;信度和效度是社会统计最重要的问题。
——《社会统计》[美国]布莱洛克
能力有限,所以我会选择性的介绍几种我比较了解和比较常用的测试方法。
1.卡方检验
卡方检验是一种应用非常广泛的假设检验方法。其在分类数据统计推断中的应用包括: 方面:用于比较两个比率或两个构成比的卡方检验;多比率或多构成比比较的卡方检验,分类数据的相关性分析等。
例子:在分类数据的统计分析中,我们经常会遇到这样的数据。例如,两组大鼠在不同致癌物作用下的癌症发病率如下。询问两组之间的癌症发病率是否有任何差异。 ?
治疗的癌症总数和未患癌症的总数%
A组52 19 71 73.24
B组39 3 42 92.86
总计 91 22 113 80.53
——上表来自网络
那么,表中最基本的数据是52,1,39,3,所以上表中的数据也称为四表数据。
卡方检验的统计量是卡方值,它是每个网格的实际频率A与理论频率T之差的平方与理论频率之比的累积和。每个网格中的理论频率T是在假设两组癌症发病率相等(均等于两组癌症发病率总和)的情况下计算得出的,例如第一行和第一行的理论频率列为(71*91)/113=57.18,所以卡方值越大,实际频率与理论频率的差异越明显,可能性越大两组之间不同的癌症发病率。
现在常用的SPSS软件,可以直接用几个按钮来实现这个测试,不再赘述。
2.T 检验
T检验,又称学生t检验(Student's t test),主要用于小样本(例如nt检验利用t分布理论来推断差异发生的概率,从而比较是否两种方法之间的差异是显着的。它与 z 检验相同。卡方检验并列。t 检验是由 Gorst 发明的,用于观察酿酒的质量。Gorst,都柏林吉尼斯酒厂的统计学家,基于关于克劳德·吉尼斯 (Claude Guinness) 聘请了牛津大学和剑桥大学中最优秀的学生毕业时以创新政策将生物化学和统计学应用于吉尼斯工业流程。Gost 于 1908 年在 Biometrika 上发表了 t 检验,但由于他的老板被迫使用化名(学生)以为是商业机密,其实和他共事过的统计学家都知道,“学生”的真实身份是戈斯特。
——盛才学习网
t检验分为:单群体检验和双群体检验。
单总体t检验是检验样本均值与已知总体均值之间的差异是否显着。总体分布为正态分布,如总体标准如果差值未知且样本量小于30,则样本均值与总体均值的离散统计量呈现t分布。
单总体t检验统计量为:
Two-population t-test:检验两个样本均值是否与其各自的总体存在显着差异。
双总体t检验分为两种情况,一种是独立样本t检验,另一种是配对样本t检验。
独立样本t检验统计量为:
S1 和 S2 是两个样本的方差; n1 和 n2 是两个样本大小。
配对样本 t 检验统计量为:
适用条件
(1) 总体均值已知;
(2) 得到一个样本均值的个数和样本的标准差;
(3)样本来自正常或接近正常的人群。
3.回归分析
Regression Analysis(回归分析)是一种统计分析方法,用于确定两个或多个变量之间的定量关系。
它被广泛使用。根据涉及的自变量个数,回归分析可分为单回归分析和多元回归分析;根据因变量与自变量之间的关系类型,可分为线性回归分析和多元回归分析。非线性回归分析。如果在回归分析中只包括一个自变量和一个因变量,并且两者之间的关系可以用一条直线来近似,这种回归分析称为单变量线性回归分析。如果回归分析包含两个或多个自变量,且因变量与自变量之间存在线性关系,则称为多元线性回归分析。
这部分内容,我个人能力有限,感觉要解释一下,就得写一篇短文了……另外,目前的分析软件大多都会有很详细很简单的帮助您完成问卷调查的方法。内容和问卷数据进行有效分析。
关于使用SPSS软件对社会学问卷的答案进行编码输入
这个很简单,就两个字:assignment,多亏了类似SPSS的数据处理和分析软件,社会学问卷答案选项的不定项、多项选择、开放式选择终于可以出现在大家的调查和分析数据处理简单利落。让我们来看看“图书馆”是什么样子的
如何赋值?更简单,如图,选项为AB调查问卷封面信的主要作用有,赋值为0、1,两项为YES或NO,选项为ABCD,赋值为0、1、2、3;等等。
遇到开放式怎么办?简单!
例如一个问题有一个开放式答案,表示为“F.Others(请注明)----------然后赋值前面的所有ABCDEF,012345,然后设置格式化成如下代码中的文本,并写进去!
接下来调查问卷封面信的主要作用有,问题答案的所有数据输入完毕后,使用工具箱中的各种分析,像这样:
然后就可以得到各种数据表数据库数据分析的结果了……像这样:
能力值的极限……只是酱……