我有一组已输入的名称和地址以及excel电子表格,但问题是输入地址的许多人以许多不同的非标准格式输入了它们.我想在将所有地址传输到我的数据库之前擦除地址.环顾四周,我真正发现的地址擦除器(解析器或格式化器)的方式是由Semaphore提供的.就我的目的而言,我并不真的需要所有这些,我不想支付软件的许可费用.那里有免费和/或开源的东西会为我擦洗吗?
因为我在邮寄业务工作......
可邮寄地址不是地理编码.一个允许USPS发送邮件,另一个允许你告诉你这个点到底在哪里.USPS没有对其可邮寄地址进行地理编码.它可用于标记人员的区域/区域以进行定位.
您没有购买该软件的许可证,而是购买数据.邮局有很多规则,特别是如果你在商业上这样做,并试图获得比头等更好的比率.有关完整的规则列表,请参阅USPS国内邮件手册.USPS一直在拉链和拉链之间移动拉链和住户.该公司(我为之工作)向USPS支付其更新的邮件列表,以便我们可以更新我们的数据库.每周.
回到你的问题.您想将数据更改为通用格式(街道 - > st)还是要查找重复项并且只想存储真正的可邮寄地址?
共同格式; 您可以将地址分成几部分,清理空白区域并应用术语/翻译词典.然后应用一些sql来查找重复项.请记住,家庭(1个主要的st)与人(john doe,1 main st)不同.
对于可邮寄的地址,你们中的一些人(读者)不会喜欢这个答案,但是你们想要的是信息,这不是免费的.有人花费时间或金钱来获取和维护这些列表.因此,找到一个商业模式来获取列表的资金,或者找一个为你做这件事的人.数据和邮件管理
实际上,信号量相当便宜,请记住,地址数据库必须每季度更新一次,每季度19美元便宜.
另一种地址擦洗产品.SAP PostalSoft.我不知道数据会花多少钱.