栖息谷-管理人的网上家园

用EXCEL清洗电子邮件地址数据库

[复制链接] 1
回复
1875
查看
打印 上一主题 下一主题
楼主
跳转到指定楼层
分享到:
发表于 2009-5-20 23:04:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EXCEL清洗电子邮件地址数据库

我曾经用EXCEL为客户清洗过电子邮件地址数据库,今天把思路整理下来跟大家分享。EXCEL的缺点是一个工作表只能整理65535条记录,优点是比较直观。现在我已经学会用ACCESS清洗了,不过思路还是EXCEL的方法。哈哈。

电子邮件地址主要分成3个部分,第一部分@前内容,第二部分@,第三部分@后内容,这三段内容都有可能出现问题。首先需要把这3个部分从邮件地址列表中分离出来。

1)分离

选择find函数,可以返回邮件地址中的@的位置.

使用LEFTB函数,可以获得@前内容。

使用LEN函数,返回邮件地址字符个数。

使用RIGHTB函数,可以获得@后内容。

fficeffice" /> 

2@前内容清洗

选择数据/筛选或排序,清洗出含逗号,分号,句号,冒号,www,http, 空格,和不多于3个字符的地址

 

3@后内容清洗

选择数据/筛选或排序,寻找无效DNS/拼写错误域名/失效域名。比如把sina.com拼写成snia.com的就有很多。还有etang.com, fm365.com这些域名早就不使用的。

寻找包含www,分号等多于1个邮件地址,一律标记“错误”

@后内容进行排序和分类汇总,对一些数量使用非常少的域名筛选出来。

如上,供大家参考。谢谢。

沙发
发表于 2009-5-24 08:10:30 | 只看该作者
好东西啊!
多谢分享

使用高级回帖 (可批量传图、插入视频等)快速回复

您需要登录后才可以回帖 登录 | 加入

本版积分规则   Ctrl + Enter 快速发布  

发帖时请遵守我国法律,网站会将有关你发帖内容、时间以及发帖IP地址等记录保留,只要接到合法请求,即会将信息提供给有关政府机构。
快速回复 返回顶部 返回列表