市场调查中的抽样问题
市场调查中的抽样设计是一个技术问题,也是很多小公司做的不太好的。抽样设计的学习和掌握有一些方法。坊间的书有些过于简单,言不及义不知所云,没有说清楚前前后左左右右的关系,类似如市场调查概论类似的书籍。而过于太难的书籍又限于理论说理使读者偏离应用而陷入理论的泥沼,进行无谓的脑蛋白质消耗,比如统计大家KISH的抽样调查(翻译本)。
首先、推荐市场调查公司的抽样人员阅读倪加勋的《抽样调查》,倪加勋不仅是KISH著作的首译人员,而且长期从事抽样教学,他写的这本书在KISH的基础上基本能讲抽样统计的关联问题阐述的比较清晰。
第二、抽样调查之前要基本了解数理统计中的参数估计。数理统计中的参数估计就是告诉你通过抽样来推断总体的情况。数字上看就是在例如99%、95%或其他百分比的置信度下,通过样本计算出的总体的均值和方差的上下范围。
第三、抽样调查对于我们市场调查工作者而言解决两个问题,一个是刚才说的数理统计中的参数估计,就是在例如99%、95%或其他百分比的置信度下,通过样本计算出的总体的均值和方差的上下范围。第二个就是如果抽样的话需要在置信度99%、95%或其他百分比下,需要抽多少个样本。这两点是实际工作者务必明确的,其他花里胡哨的东西都是枝蔓。实际的工作者关注这两点就好了。
第四、抽样统计中的总体推断的公式和数理统计中的参数估计略有不同。原因主要是如倪老总结的,数理统计的参数估计是假设被研究的总体是无限总体,总体分布假设是正态的,样本是等概率的随机抽样。但是这个原因我认为从事实际操作的人不需要太深入的理解,尤其是针对非数理统计研究者而言。
第五、解答第一个问题。抽样调查中如何计算总体的均值和方差。实际和数理统计的参数估计一样,需要总体数,抽样数,抽样的均值和方差这几个变量就够了。但是抽样调查的公式比数理的参数估计要复杂一些,换句话说加入了一些限制性或者用语法做一个比喻,公式多了很多零碎的定语。这些定语使得抽样统计比数理参数估计更精确。具体公式参见书。
第六、解答第二个问题。抽样调查中如何计算抽样数量。条件需要知道总体数量,总体方差,允许误差和置信度这几个变量就可以根据公式计算数量。但是这里的难题是总体方差和允许误差的估计得需要靠专家才能估测或者靠长期的经验才能估测出来。所以这里我们看出统计学的哲学问题,就是我们希望能从已知推出未知,但是实际上在已知中有的时候也包含着估计和对未知的估测,也就是已知推未知并不准确。只能是近似的已知推近似的未知。这也就是置信度只能说明不犯错的可能性,正确性的肯定性实在是不敢断语。
第七、学抽样主要是学概率抽样,非概率抽样就是懒人懒办法。概率抽样学简单抽样统计,因为他是基础。而随后较复杂的抽样比如分层抽样可以这样理解,先分层后,每层仍然按照简单抽样统计进行计算。
第八、一些术语的掌握。抽样调查中的标准误差直接理解成数理统计中参数估计的标准差即可。也就是在术语中和数理参数估计的notation划等号,如果我们是实践者而不是研究者的话。