![]()
「这样的科技,教我如何不爱它?」
——胖头陀
可加微信 1126699 联系作者
◆ ◆ ◆
文 | 康翔
如果不是圈内人,恐怕很难对CVPR有所了解。
作为国际电气和电子工程师协会(著名的IEEE啦)举办的业界顶级计算机视觉与模式识别会议,CVPR 2017日前在美国夏威夷正式召开。
有意思的是,上个周日CVPR 2017的消息在微信朋友圈和网上被刷爆。究其原因并非是人工智能或是虚拟现实等领域出现某种革命性的突破,而是由于阿里巴巴的“刷脚购物”。
因为一只鞋,火了一座城;因为一次意想不到的“刷脚”,让一次小众科技专业会议成为全球诸多新闻媒体的头条,全民玩不停地喜刷刷。
感觉似乎有些玄而又玄,然而这却是不争的事实。
阿里巴巴的展台前人潮如织,各种新技术的分享引得人们不由赞叹连连,某位不速之客也被吸引而至。
这是一位来自Google的工程师,想必其初衷并不是来为阿里巴巴捧场的。淘宝的“拍立淘”功能似乎引起了他的兴趣,于是端起手机对着阿里工程师的身上一顿扫射。
Google vs 阿里巴巴,工程师vs工程师。
大战一触即发!
“拍立淘”是淘宝早在2014年就上线的功能,目的是帮助广大消费者寻找同款的神器。用户只要在手淘里点击相机图标,对着日常看到的商品拍照,淘宝就会自动定位到网上的购物链接,包括产品参数、属性等,一应俱全。
一番较量下来,Google工程师拍摄的图片均被“拍立淘”准确识别出来。
“真的这么神奇?”他一副心有不甘的样子。于是Google工程师又蹲下身来,照准阿里工程师的鞋子进行拍摄。
![]()
结果别无二致,拍摄的图片迅疾被“拍立淘”识别和定位。
最终,淘宝的“拍立淘”技术赢得了这位Google工程师的衷心叹服。前前后后玩了一个小时,扫完T恤扫鞋子,Google小哥大呼过瘾,欣然离去。
其实对阿里巴巴来说,“拍立淘”并不是什么新鲜物事,早在三年前就已上线付用,并在次年的双十一购物狂欢节上大显身手,吸引大批剁手族当天在淘宝上疯狂扫货达数千万元之多。
当然,技术从来不是静态的,更何况是阿里巴巴这种视技术迭代为核心竞争力的国际一流企业。三年来,随着产品库的日渐丰富,以及功能的不断扩展,“拍立淘”的“以图搜图”已经达到了一个全新的境界。
![]()
没有比较就没有伤害。呃,不对,应该是没有比较就没有足够的说服力。
假如你经常使用某款国内排名第一的搜索引擎,使用其标榜的“拖曳识图”功能,有几分不便不说,识图的结果也往往不尽如人意。
譬如刚才我就略微尝试了一下,结果被搜索引擎告知,“抱歉,Safari不支持拖拽识图。请保存图片到本地,通过本地上传或在搜索框粘贴图片url进行识图。”
按说,科技应该是具有普适性的。可是搜索引擎居然对浏览器也划分为三六九等,这到底是几个意思?
咳咳,说远了。
“拍立淘”是一种可视化的搜索方式,真正能够实现所见即所得、一键搜索的完美用户体验。
从当前来看,哪怕放眼全球,“拍立淘”技术都拥有无可匹敌的优势,远远走在了前列。
与我们日常使用的主要依靠字节进行搜索的方式不同,“拍立淘”采用的是图像搜索技术,技术水准更高,实现难度也更大。
![]()
“拍立淘”的“以图搜图”,主要分为识别和搜索两大步骤。
首先是识别。通过一个叫“类目预测”的技术,“拍立淘”会识别图像属于哪个类目。显然,类目越多越丰富,最终的识别结果也会越准确。
“拍立淘”现在覆盖的类目范畴有多大呢?居然多达一万多个,涵盖了女装、服装大类、鞋包、配饰、食品、数码、家具、日用百货、饮料等,可谓应有尽有。
类目扩展的同时,其精度和相似度也在不断提升——这对于识别结果同样意义重大。
在这个过程中,“主体检测”会抠出搜索目标,俗称“抠图”,提取该目标的图像特征。
这同样不是个轻松活儿。毕竟很多时候用户拍摄的图片背景杂乱,“拍立淘”必须去除其中的无用信息,准确判断出图片的主体。
接下来就是搜索。通过将以上步骤得到的图像特征在数据库中进行比对,从而完成商品的最终定位。
当前,阿里巴巴拥有至少29亿商品的图像数据。显然,这是以电商起家、瞄准新零售的阿里巴巴独一无二的强项,即便是全球互联网巨擘Google也难以企及。
随着近年来深度学习技术在图像分析和识别领域的广泛应用,阿里巴巴的图像描述(特征)有了非常大的进步,故而“拍立淘”搜索结果的准确性不断提升,也就难怪此次CVPR大会上在外界看来“当惊世界殊”了。
假如有人以为“拍立淘”只能用来扫货购物,那只能说是太naive了。
机智的广大网友们早就开发出了N种玩法。
有人在上昆虫实验课的时候,脑子临时短路,忘记某昆虫属于什么科,手机上的“拍立淘”一扫,嘿!结果出来了。
对了,考试的时候绝对不要这样做!
有人在客户那里看到很棒的盆栽,客户也说不清是什么,这时候“拍立淘”出手,立刻就能得到属种和购买链接。
有人扫描地上的碎花,结果搜索出与之相应的碎花窗帘。
棒棒哒!生活变得越来越有情调。
还有人用“拍立淘”识别花花草草。讲真,这个功能很吸引我。
我是个想当作家的人,经常出去散步,喜欢将看到的东西记录在文字里。
譬如,出门不久看到不认识的野花,大可以写做“一束不知名的小花悄悄探出了头”,是不是还挺有意境?
可是接下来再遇到另一种不认识的花呢,继续来个“一丛佚名的花儿在枝头绽放”?啥都不认识,岂不显得太没见识了么!
其实打开脑洞,“拍立淘”完全能在这个big big world,做更多big big things。
比如走失儿童和拐卖人口问题。
随着技术的进步,以及相应的数据库丰富,未来或许可以扫一扫照片,就能够在全国的天眼探头下识别出他们最近出现的地点,进行搜寻和解救。
或许距离真正意义上的实现还有一定距离,不过并非没有可能。
现在,“拍立淘”还在瞄准一些了不得的事情,致力于成为人们获取信息的一个快捷、有趣、有效的入口,而不仅仅是搜寻商品。
这意味着,以后使用“拍立淘”,我们不仅可以刷商品,还可以刷任何物品、任何场景,实现现代应用的无极缩放与扩展……
喜刷刷喜刷刷!one,two,three,four!
责任编辑:阿由
![]()