wudexin2 发表于 2010-2-23 12:39:26

[原创]《统计资料会撒谎》读书笔记

<font face="Verdana"><font size="4"><strong>1.内在有偏的样本</strong><br/>即获得统计数据的样本并不能代表总体,如统计每个人每天的刷牙次数、洗澡次数等私人问题时,被调查者可能不会把真实的数据告诉你;也可能的原因是样本并不是按照随机原则从总体中获得,如一位心理医生经观察后得到结论:每个人都有点神经质,但是他观察的样本是他的病人!显然他的“病人”并不能代表“每个人”。<br/><strong>2.精心挑选的平均数</strong><br/>平均数的类型有三种:均值、中位数、众数。其中均值是指总体标志总量与总体单位总量之比;中位数是指将现象总体中各单位的标志值按大小顺序排列,位于中间位置的那个标志值;众数是指总体中出现次数最多的标志值。当待处理的数据是按正态分布时,上述三个值是相同的,如人类的身高等基本特征,但是大多数情况,数据不是按正态分布的,如人们的收入等。其次还要看看这个“平均数”包含了那些人,如计算公司平均收入的增长时,被比较对象包含了兼职员工。<br/><strong>3.没有披露的数据</strong><br/>如利用统计角度的不充分(采样样本很小)获得的偶然结果作为结论,当采样样本很小时,一些偶然结果出现的概率就会大大增加,如向上抛硬币,正反两面出现的概率是50%,但是如果你只抛10次,则正面出现的次数可能是7次,这样你能得到正面出现的概率为70%的结论?其次是,对得到的数据没有说明误差、标准值等表示数据变化范围的值,如某地的平均温度为25°,单看这个数据你或许会认为此地非常适宜居住,但是你或许不知道这里冬天可以到零下40度,夏天可以到正40°!<br/><strong>4.毫无意义的工作</strong><br/>统计数据是否有意义,必须衡量样本以多大的精度代表总体。如调查某女性杂志中某篇文章的男性读者的阅读喜好,显然此次调查的对象似乎有点问题;其次,当我们比较某些数据的差别时,必须牢记这样的一句话:只有当差别有意义时才能称之为差别!<br/><strong>5.令人惊奇的图形</strong><br/>当在制作直线类图形,或者是柱状图时,只需改变原图的横轴和纵轴的比例关系,如将纵轴的刻度变为原来的10倍或1/10,你将得到一个非常完美的图形,同样的数据,同样的增长,你可以让他随你所愿的变得增长迅猛或平缓!<br/><strong>6.一维图形的滥用</strong><br/>如我们用一个钱袋表示收入,如果表示某个地区的收入是另外一个地区的两倍,将前一个钱袋的高度是后一个的两倍,宽度也是后一个两倍,虽然所有的数据都是后一个的两倍,但是面积却是后一个的4倍!这样引起的视觉效果将大大的不同!<br/><strong>7.不完全匹配的资料</strong><br/>即挂羊头卖狗肉,搜集这样的资料却把它说成是另一回事!如调查某军队打仗的死亡率,结果发现其死亡率比某地区人民的死亡率还低,这样就说当兵更安全么?实际上凡是符合当兵的身体条件肯定要求很高,而城市里还有包括了老人、病人和伤员!同时还应当注意投资回收率和销售收益率不是一回事!<br/><strong>8.相关关系的误解</strong><br/>相关关系是指两个或两个以上的事物存在着联系,但并不能说明其中一个将引起另一个的变化,也不能说明他们是因果关系和一一对应关系。如某调查发现某学校学习不好的学生,抽烟的概率更大,这能说是因为学生抽烟而导致学生成绩下降?那我也可以说是因为学生成绩不好,才导致了学生开始抽烟!<br/><strong>9.如何进行统计操纵</strong><br/>为了使统计资料看上去更有分量、更精确,则可使用小数和百分数!如统计某地区100人的收入,加总后求均值(无所谓何种类型的均值),保留小数点后两位,与精确到10元的效果完全不同!在进行比较时选择对自己有利的比较基数,即注意基数的变换,同时应该注意百分比与百分点之间的区别。<br/><strong>10.如何反驳统计资料</strong><br/>(1)谁说的?即弄清楚该数据的来源,特别是当某权威人士被引用时,应当注意到底内容是权威的,还是仅仅与权威人士扯上了点关系?其次还要看看该数据是否有人为或无意识的偏差。<br/>(2)他是如何知道的?要看看样本是否有偏,样本是否足够大,样本是否足以代表总体。<br/>(3)遗漏了什么?如当被告知百分数的时候,要看看原始的数据到底多大,当被告知变化的程度时,要看看引起变化的原因,如某调查显示,早上晚上的车祸是其他时间的3倍,但是你要明白早上晚上是路上车辆最多的时候,这并不代表早上和晚上更容易发生车祸。<br/>(4)是否有人偷换了概念?如疾病案例的增多并不能代表该病发病率的增高,也可能是医院记录发生了改变,调查年龄时,年龄是5的倍数的明显比其他的要多,这是因为个人的习惯造成的,而不是这个年龄的人特别多,<br/>(5)这个资料有意义么?特别是利用外推法进行预测时,请记住到目前为止的趋势都是事实,但是未来只是一种猜测,而且外推法的前提是“其他一切条件都是不变的”,但实际上一切都是在改变的!如在做某产品市场增长率的预测时,要考虑到市场的饱和量。</font></font>
页: [1]
查看完整版本: [原创]《统计资料会撒谎》读书笔记