栖息谷-管理人的网上家园

[原创]数据挖掘:从脚大的孩子拼音好说起

[复制链接] 7
回复
1650
查看
打印 上一主题 下一主题
楼主
跳转到指定楼层
分享到:
发表于 2010-5-9 13:37:16 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

 

>

曾经有关于数据挖掘应用的几个经典的比喻,其中有一个说:研究发现脚大的孩子拼音好,所以脚的大小就与拼音的好坏存在关联关系。结论是错的,原因在于忽视了因果关系的实,而只注重了“因果关系”飘忽的形。脚在的孩子拼音好,其中有一个重要的隐藏信息,那就是脚大的孩子一般年龄也大,而年龄大小对于正常的孩子来说会直接影响到拼音的好坏,其因果关系应该体现如下:脚大-年龄大-智商提升-拼音好。>>

所以数据挖掘经典存在的一个问题是,把表面的统计信息当成因果关系,或者关联关系进行应用。这正如你从街上随便找10个人,你用任何一个分析的维度都可以获得一定的分析结论,比如男女比例关系,比如身高分布,但是你却不能这些分析结果能够说明他们为什么会被你挑中。用户群本身的分析维度属性是天然存在的,而且对于分析是随机产生的,不存在稳定性,没有稳定性的东西又怎么可以去进行关联的分析呢?>>

当然,分析本身完全可以告诉你具有某一特征(如离网)的用户群具有什么样的分布特征(如资费、品牌、在网时长等)。理论上如果这种关系是较为稳定的,你去找离网倾向比例高的用户,通过这种分析得到的结论去反向应用本身比大撒网式的营销方式要好。至少可以让营销操作在更小的用户群范围内实现营销效率的提升。但这种分析方法与结论并不能等同于因果分析与关联分析。>>

数据挖掘并不是万能,当然没有数据挖掘很可能是万万不能。但任何技术的东西至少在目前看来,还无法形成象电影《鹰眼》里所说的计算机智能,千千万万个分析结果绝不能也不应该偏离业务应用的始终,这是数据挖掘的应用命门。

沙发
发表于 2010-5-10 18:56:49 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
板凳
发表于 2010-5-11 09:13:06 | 只看该作者

正在学习数据挖掘,期待有更多的内容出来

4
发表于 2010-5-13 20:12:09 | 只看该作者
 这方面一直没有涉猎,看来要学的还很多啊!
weijunjiewangho 该用户已被删除
5
发表于 2010-5-15 09:43:59 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
6
发表于 2010-5-16 17:46:28 | 只看该作者

逻辑性,因果性等多方面考虑,对于思路纠偏来说是有益的。

7
发表于 2010-5-16 21:47:01 | 只看该作者
QUOTE:
以下是引用hold在2010-5-9 13:37:16的发言:

其因果关系应该体现如下:脚大-年龄大-智商提升-拼音好

 

这个推理本身也一样的是胡扯

8
发表于 2010-5-17 16:07:40 | 只看该作者

有见地!数据是最骗人的,尤其是‘被分析’了以后!

 

使用高级回帖 (可批量传图、插入视频等)快速回复

您需要登录后才可以回帖 登录 | 加入

本版积分规则   Ctrl + Enter 快速发布  

发帖时请遵守我国法律,网站会将有关你发帖内容、时间以及发帖IP地址等记录保留,只要接到合法请求,即会将信息提供给有关政府机构。
快速回复 返回顶部 返回列表