说明: 1。本文阅读需要对概率论和数理统计有一定了解,本文不对概率论和数理统计的一些知识做过多解释。 2。本文并不针对任何东西,或者说,拿少天的这个分析做一个引子,只是想阐述关于抽样调查的一个知识。 3。欲对抽样调查有更多了解,可以阅读社会学中的经典著作--社会研究方法:第10版 【作者】 艾尔·巴比。 少天的那篇《栖息家人真相研究结果解读》http://www.21manager.com/dispbbs.asp?n=4,103865,0,0,0,541695,0,1自2007年3月1日发布以来,到今天(2007/01/12)累计点击量达到3137,“对我有用”达115。 少天在文章开篇写到“家园于07年1月18日发布“家人真相调查”帖子(http://www.21manager.com/dispbbs.asp?n=4,100202,1,0,0,0,0,0),截止到今日,已经有1259人次参加投票,总票数达到3418票,本次调查以此基数来看,得出的结论应比较符合真相。”。 从抽样调查来看,少天的这个真相解读只能是作为一个参考,在多大程度上解读可信,是值得怀疑的。下面是我的论述: 抽样数量的多少并不能够决定结果的可靠性: 例证【艾尔.巴比著:《社会研究方法》,华夏出版社2000年版,第244页。】: 1936年的美国总统大选,《文学文摘》杂志选了1000万人,收到200万以上的回应;结果显示,有57%的人支持共和党候选人阿尔夫。兰登,而当时在任的总体富兰克林。罗斯福的支持率为43%。 投票结果:罗斯福以历史上的最大优势,61%的得票率获得第二届任期。 抽样调查有一个重要的问题就是:抽样样本能够在多大程度上反应总体?决定因素不是样本量的多少,抽样方法才是决定抽样调查能够在多大程度上反映总体的关键因素。
一般地,样本越大,其代表性越好,但并不能绝对地说越大越好。数理统计中的抽样理论指出:遵循随机原则的概率抽样可以保证抽选出有一定代表性的样本,并能够通过计算估计样本与总体间误差的大小以及这种估计的可信程度。研究结果认为,样本大小与总体大小呈正相关,且具有一定的函数关系,但当样本增加至390左右时,即使总体继续增加,而样本大小也不会有太大的增多,也就是说继续增加样本大小不会对调查结果产生更有价值的影响[裴娣娜著:《教育研究方法导论》安徽教育出版社1995年版,第120-121页。]。 样本容量的确定方法: n=s^2*z^2/e^2 n:样本容量; z:所选置信区间相关的标准误差; s:由估计的标准误差表明的可变性; e:样本估计值相对于总体的精确度或可接受误差。 如:假定预期差异性很大(针对非A即B的选项,最大差异性为50%),而且我们希望在95%的置信区间下精确度是+-10%。确定所需要样本容量的计算如下: n=1.96^2*50*50/10^2=96 在看这个真相解读的结果之前,首先要考虑的问题就是:抽样的样本具有代表性吗? 由于投票,就存在有人投,有人不投。投票的结果不是遵循随机抽样而得出的结果。也没有任何证据表明,投票者和非投票者在投票内容的各方面会一致。 那么,该如何获得家人的真相呢?如何得到的抽样结果才是家人的真相呢? 随机抽样。 1。从现有注册的ID中,利用系统数据库,随机抽选500以上ID发出邀请,请求对调查各项给予回答。 2。检查回答率(即发出的调查邀请有多少答复),若回答率过低,则应向那些尚未答复的ID进行催促。当回收率达到80%以上时,可以认为基本符合邀请。那些未回答的ID,可能为长期未登陆家园,或者已经废弃。 3。由此而得出的结果,能够在较高的置信区间显示大多数登陆家园人的ID的情况。由于家园存在大量的访客,因此,对于此部分人的情况,是无法在高置信区间作出一个预测的。
[此贴子已经被作者于2007-3-12 10:25:11编辑过] |