问卷收回来发现男的多女的少,可以继续做分析吗
你这个问题,,,其实是随机调查中,比较普遍存在的一个可能,既然是随机调查,就不能设定太多的前提假设或限制条件,这样才符合随机调查的初衷。但如果我们在做调查数据分析时,需要考虑到单个属性的差异,比如性别、年龄、收入等,那么一般在问卷发放时,要有所选择,即要保证在所需属性适用群体的投放问卷数量,但回收时,依然可能会偏离我们所需要的比例。这个问题要从两方面看,一是随机调查本身是要允许有这种超预期的偏差,不然就不是随机的了;二是这个偏差度受该属性在数据分析中的重要度限制,如果是核心属性偏离率太高就不行,就得重做调查了,一般这个比例不宜超过50%,比如男60:女40,男的超出女的50%,就是上限了。当然如果你这个属性非常重要,这个比例是要更接近才好。
这里面还有一个需要注意的是,问卷回收数量是否满足调查分析所需要的最低样本数量,比如你说的男多女少,但只要满足最低样本数量,比如最低样本数为1000,但实际发放1500,回收男600,女400,满足样本数的要求,就完全可以使用的,是有效的,但如果设定最低样本数为男500,女500,实际发放1500,回收男600,女400,就肯定不行,因为样本数量不足,数据不具备代表性,那就要么重做调查,要么补发调查问卷,把数量补足。
所以,随机调查有超预期,是客观因素造成的,至少说明调查是比较真实的,但如果样本不符合要求,就需要补足或重新调查,如果各方面都满足要求,或没有要求,而涉及的属性又不是核心,不是应用频率较高的,就不要紧,一般像性别,比例不超过50%,样本数量足够,依然可以说明问题的。
多重随机标签