北京物流信息联盟

计算机视觉,打造现实版《疑犯追踪》

华为 2020-11-20 09:29:00


原文作者为依图科技CEO朱珑,文章来源:《 ICT新视界 | 平安城市特刊》


随着人工智能在语音识别、计算机视觉、语言理解和医疗健康等领域取得巨大进展,并在语音识别和人脸识别等领域超越人类,那些影视场景中看似遥远而科幻的镜头,正逐渐在人们的生活中成为现实。


机器视觉

让科幻照进现实


2016年5月刚刚回归屏幕的《疑犯追踪》,早在2011年就为观众描绘了一个个通过机器监测、分析和识别犯罪的科幻场景。神秘亿万富翁发明了一套拥有认知能力的人工智能系统,利用摄像头作为眼睛识别罪犯,并对罪犯行为进行预判。这套系统除了侦测犯罪活动,还帮助那些受到伤害的普通人——可以在机器的指引下提前解救受害者。


时隔5年,随着人工智能在语音识别、计算机视觉、语言理解和医疗健康等领域取得巨大进展,并在语音识别和人脸识别等领域超越人类,这些电视场景中看似遥远而科幻的镜头,正逐渐在人们的生活中成为现实。


计算机视觉正是将科幻带进现实的一个新领域。



当用户向Facebook网页上传一张新照片时,名为tag suggestion的面部识别软件会根据之前被标记的照片进行自动扫描,提示用户新上传照片中所有要标记的人物姓名;而Faceme,一个人脸互粉的移动应用,可以在不到1秒的时间里识别人脸,并将信息与此人在社交网络上的个人资料匹配起来,让用户在Facebook、twitter或Linkedin上关注他们。


以上所描述的通过摄像设备采集人脸图像,并基于人脸几何特征和相对位置等信息进行身份辨识的过程就是人们所熟知的人脸识别。在中国,早就开始了人脸识别在安防、金融和医疗等领域的实践,一个个更科幻的场景正因计算机视觉的广泛应用而成真。


比肩世界

中国计算机视觉技术快速发展


在世界范围内,有3家计算机视觉领域的顶级研究机构——MIT(麻省理工)、加州伯克利分校,以及欧洲的牛津大学实验室。这些机构中的工作人员不断被谷歌等巨头挖走,或独立创业,正成为整个技术发展环节中最关键的一环。


计算机视觉在中国的发展起步于上世纪90年代末,随着中国经济的快速发展、教育水平的不断提高,曾经走出去的行业精英越来越多地回流国内,使中国高素质人才迅速积累,在数量和质量上都具备了推动技术快速发展的人力基础。


同时,随着计算机时代的到来,高速发展的网络、大数据计算能力的提升,以及摄像头的无缝铺设,为中国计算机视觉的发展奠定了软硬件技术基础。10多年来,人们在众多科幻电影中看到的天眼应用场景,已经可以通过计算机视觉实现——“看到”人们的一举一动,并“预测”其未来的行为。



今天,当有了优秀的人才基础和优良的软硬件技术,幻想中的世界正逐一实现。在大批初创公司推动下,中国在机器视觉领域的发展水平已能和美国、以色列等世界最先进的国家比肩。


计算机视觉

被忽视的人工智能领域的珍珠


在计算机视觉领域,技术早已突破了肉眼精度的图像识别,并广泛应用于公安、金融和信息安全领域。但这些已经取得巨大社会价值的成绩并不为大众关注,人们更兴奋于AlphaGo的胜利,而非技术在生活中的实际应用。因为人们直觉上总认为识别图像是一件容易的任务,而战胜世界顶尖棋手则更具挑战。


其实,站在人工智能发展的角度,围棋是有可遵循的逻辑和可衡量的计算量的游戏,对于人类大脑的难度在于庞大的计算量和对棋盘宏观形势的判断;而图像识别则会在信息抓取和逻辑分析层面呈现出更广泛的随机性和不确定性。通过机器学习将图像中的信息进行分类解析、最终提取有价值的结构化数据是极其困难的科研课题,从学术界到工业界的转化耗费了几十年的时光。


相比于计算机视觉、语言语音理解等其它的进步,AlphaGo当然也有其划时代意义:它不仅缩短了机器与人的智能距离,更可怕的是,未来还将颠覆人与人的智商差异感知。未来智商的差距不再是不可弥补的先天差距,而成为通过工具后天可获得的能力。这将颠覆人类的自我价值评估。



而计算机视觉的技术进步,对于现实生活的变革则远远大于学术突破和哲学思考,技术正在帮助拓展人的能力边界。


从车到人,从安防到金融

技术拓展人的边界


计算机视觉领域的技术突破最先被应用在车辆识别方面,比如依图基于视频图像的车辆识别系统在苏州上线之初,就帮助警方破获了一起涉案金额超过10万元的入室抢劫案,当时嫌犯抢劫得手后驾车驶离小区,警方运用依图的“车辆识别系统”进行品牌过滤,快速识别出车辆,仅仅10分钟就神速破案。


与车辆等物体识别相比,人脸识别的应用范围和场景更加广泛,当前已经可以做到在上亿数量级的人像库中进行人脸静态比对识别,并在“青奥会”和珠海航展安保系统中已成功应用。


比如苏州公安部门应用依图的人脸识别系统,将全国在逃犯罪嫌疑人库内的图像与苏州1300万总人口的图像进行自动比对,系统仅用了不到1天的时间就对25人给出了预警,经过人工甄别,有17人被确定为嫌疑人,这一尝试让苏州公安部门对人脸识别技术的高效率大为惊叹。


再如厦门南北火车站,民警通过公交车上的视频监控将扒窃案嫌疑人头像提取出来,在依图的静态人像系统中进行比对,很快就确认了嫌犯的名字和身份证号码,同时通过已覆盖厦门所有BRT车站摄像头的动态人像系统,快速找到了嫌犯之前所有出现在摄像头下的时间和地点轨迹,从而在嫌犯经常出现的地点布控设卡,很快控制了嫌犯。




出现在厦门的这个场景,与《碟中谍4》中汉纳威在火车站利用人脸识别系统快速抓捕嫌犯的情节何其相似。而今天,其正在真实中上演。


此外,除了公安行业,车辆和人脸识别技术还被大量应用于金融等领域。比如招商银行率先在全国范围内1500个营业网点的VTM可视柜台机上部署了人脸识别技术,用于开户、激活等需要现场“验明正身”的业务,在测试阶段中人脸识别的准确率达到98%的通过率,误识率仅为十万分之一,而人眼的误差是百分之一。也就是说,机器的准确性已经远远超过了人眼。


邂逅华为

让依图走向世界


我在MIT人工智能实验室读博士后时,曾师从美国计算机视觉学科奠基人之一的艾伦·尤尔教授,他带领我进入了全球最顶尖的计算机视觉技术圈子。


带着对人工智能朴素的好奇心,回国后我与中学同学、时任阿里云飞天项目负责人的林晨曦创立了依图,开始了在机器视觉领域的技术开拓。我比较擅长计算机视觉,晨曦则擅长云计算和大数据技术,他曾带队研发当时国内最大的拥有自主知识产权的分布式云操作系统,这段经验使得我们在大数据技术上具有深厚的储备和优势。


正是由于在技术领域的积累和实践让依图有机会与华为走在一起,华为是非常令人尊敬的企业,是中国走向世界的一面旗帜。在平安城市的建设中,依图可以很好地将机器视觉技术与华为在ICT领域20多年的积累有机结合;同时,华为开放的ICT平台和生态系统也可以让依图依托华为的经验,快速形成可靠的解决方案服务于用户。


对于依图这样的创业企业,华为让我们能够站在巨人肩膀上看世界,未来,我们有机会借力华为的全球网络,服务更多国家的用户,建设更安全的平安城市。


点击“阅读原文”,来HUAWEI CONNECT 2016共论平安城市建设之道!