新华网 正文
20亿商品“读图”鉴定 揭秘阿里图像识别背后的数据力量
2017-10-12 15:54:13 来源: 新华网
关注新华网
微博
Qzone
评论
图集

    新华网杭州10月11日电(周靖杰)18岁的阿里巴巴早已超越普通电商平台,成为一个突破线上线下界限和空间局限的经济体,同时,还肩负着艰巨的平台治理责任。10月11日,在云栖大会“数据力量•社会治理的共享与共治”分论坛上,阿里巴巴平台治理部首次集中向公众展示大数据带来的社会治理变革。

    “2016年淘宝新开店铺为1020万家,有成交的就超过300万家,这其中约35%卖家是24岁以下的年轻人,30岁以下的创业者超过60%。”阿里巴巴首席平台治理官郑俊芳(花名“灭绝师太”)表示,“在这个繁荣多样的生态中,我们既要考虑消费者保护,要保证市场活跃,营造健康的创新创业环境,也要为品牌权利人提供服务保障权益。”

    郑俊芳进行“数据力量•社会治理的共享与共治”主题演讲

    据郑俊芳介绍,如今的阿里巴巴正在充分利用数据力量,面向消费者端能做到假货快速退款;为创业者提供平等创业机会和健康有序的市场环境,发现那些“小而美”卖家;同时面向社会通过数据做到快速合规,成为行业标杆。

    阿里巴巴是全球最早一批使用现代OCR的互联网公司,技术能力走在世界前列。”论坛上,阿里巴巴集团资深技术专家贾梦雷首次向公众披露“雷音识字”技术。据其介绍,新广告法实施后海量的商品描述有了违规风险,而平台上90%的商品描述在图片里,比如说“顶级”、“最优质”、“极品”等。“‘雷音识字’技术就是一双智慧之眼,监控全网近20亿商品,并将违规商品揪出来。”贾梦雷说,“目前技术对宝贝详情图平识别均准确率为97.6%,已接近人眼识别能力。”

    阿里巴巴资深技术专家贾梦雷向公众披露“雷音识字”技术

    阿里的图像识别能力到底有多强?平台治理部公布的一组数据可以说明。据统计,2016年全年阿里超强的图片识别技术已累计计算1000亿张图片,每日为20亿在架宝贝的图像安全保驾护航。每日计算商品图片约6亿张,每年计算约图片面积4.26平方公里,相当于 48 个澳门特别行政区的土地面积。每秒扫描图片文字23,546,287个,相当于每秒可扫描识别501本《康熙字典》的汉字量。

    目前,该图像识别技术以审核包括身份证、发票、营业执照、专利证书在内的23种资质图。“像专利证书的识别率高达99.3%,这让快速合法合规成为了可能。” 贾梦雷说。

    资质图审核被运用在平台治理的各个场景中,依靠科技手段的运用,阿里食品安全管控已经成为行业标杆。为保障“舌尖上的安全”,阿里一直在提高平台食品准入机制,目前图像识别技术的快速覆盖更是让网络食品管控事半功倍,该技术不仅能审核卖家准入经营许可证,还能识别并拦截违规商品图片,大大净化了平台环境,提升社会治理能力。

    如今,社会共治已成为打击假冒伪劣的一把“利刃”。近些年来,阿里巴巴通过政企联手联动,充分运用大数据等手段,积极与全国各地执法部门开展平台治理合作,形成从资质审核、线下源头专案打击到质量共治扶优的共治闭环,构建多方参与的共治格局。

+1
【纠错】 责任编辑: 陈梦瑶
新闻评论
加载更多
红叶“闹”金秋
红叶“闹”金秋
泸沽湖秋色迷人
泸沽湖秋色迷人
重庆现五层“螺旋”停车库
重庆现五层“螺旋”停车库
金秋十月 甘肃戈壁胡杨林披“金装”
金秋十月 甘肃戈壁胡杨林披“金装”

010030090950000000000000011100001121793498