问题2. 淘宝地址库与国标的不同之处

淘宝行政区划使用已经有上十年的历史,日积月累人员更替,一直缺乏一个明确标准,导致现在的地址库很混乱,和国标有较大出入,成为对外交流的障碍。如果需要和合作伙伴交互,请务必熟悉这些特点,具体区划请参考“特殊区划列表”。

  1. 直辖市的特殊处理。国标直辖市是两级区划(市\区),例如“北京市-朝阳区”,淘宝地址库的直辖市都是3级行政区划(省\市\区),例如“北京-北京市-朝阳区”,其中“北京”为 省,“北京市”为市,“朝阳区”为区。

  2. 脏区。以前淘宝地址库维护不规范,导致数据库中存在大量脏区,由于历史数据(收货地址、订单)大量存在,脏区不能从地址库后台拿掉,地址库对脏区的措施是“前端消灭引导,订单强校验,后端兼容”,缩小脏区影响范围。现行地址库包含全部的国标区划,目前的脏区主要有:

    其它区。可能某个历史版本为了逃避区划维护的难度,在每个地级市下面都挂了一个“其它区”,例如“杭州市-其它区”,以便区划陈旧时,用户仍然能填写地址。现在“其它区”导致了大量的问题,其它区本质上为无区,实为害群之马。

    各类开发区。在规范树立之前,之前的管理员为了应对投诉,在地址库中加入了大量开发区,例如“成都市高新区”、“苏州市园区”,导致地址库混乱。

    废弃区。分好几种情况,一是行政区划被删除后,为了兼顾历史数据,老的区划只能留在地址库中,例如“北京市崇文区”;二是为了逃避维护困难,管理员不直接update名字,三是在地址库中插入了一个新区,导致新老并存,例如哈尔滨市阿城市和哈尔滨市阿城区,都挂在哈尔滨下面。

  3. 和国标ID不一致的情况。由于国家区划变更导致id变更,淘宝地址库大量的多余区划占用ID等原因,现在淘宝地址库有86个前三级区划的id和国标不同,例如“临桂区”,国标id为450312,淘宝id为450322,详细的不同列表参见xxx,在对外id交互的时候尤其注意这点。

  4. 地址库更新频率。地址库变动工程很大,同时变动太快也会导致合作伙伴跟不上,因此淘宝地址库约定每年更新一次(上半年4月),数据和上一年国统局发布的行政区划保存一致,变更周期之间的国家区划变动,不会反映到地址库,这可能导致极少数区划在地址库中找不到。例如,地址库2014年行政区划基于国标2013.8版本,则2013.10月诞生的浙江省绍兴市柯桥区不会出现在地址库中(2013年10月18日,国务院国函[2013]112号文件批复浙江省人民政府请示,同意撤销县级绍兴县,设立绍兴市柯桥区。)