北京物流信息联盟

三墩IT人自主研发能力建设和人工智能试点工作扬帆起航

2021-10-10 13:43:37

点击上方蓝色字体关注我们


       汤人杰    大数据平台资深架构师

       杨俏        资深产品经理

       傅成彦    前端资深研发工程师

       周琪山    前端资深研发工程师

       陈韩玮    J2EE资深研发工程师

       严昱超    AI架构师


人工智能之人像识别技术的成功自研是三墩IT人在AI领域探索的一小步,却是三墩IT人不忘初心、自主研发的一大步!这也是云计算中心首次向生产环境提供人工智能PAAS服务,标志着传统的大数据平台正式走向了智能云时代。




一、背景

目前, 浙江移动全省用户数达到6500万,在全省范围内推广实名认证与人脸校验服务,对于实现电信反欺诈快速定位犯罪分子,保障消费者权益具有十分重要的意义。针对部分公民存在的暂时未持有有效身份证的特殊情况,三墩IT人自主研发团队开发并部署了智能人像留存功能,为实名制身份认证推广,提供有效的技术保障。


二、面临的困难

当下人像识别服务,主要目的是为了在人脸校验功能调整时或者客户未持有身份证件时,,实现保存客户的图像资料,其依赖的人像检测算法市面上也已经有成熟的方案,但是实际建设过程却并不像我们想象的那么简单……

人像识别服务需要在现有营业厅与渠道,不同版本终端浏览器和不同型号摄像头输出统一标准的人脸识别照片。是花费巨额成本统一替换成标准设备还是另辟蹊径适配不同设备,实现资产复用

人像检测的功能主要通过机器学习的算法实现,实际使用过程中由于渠道的拍摄场景、采光条件与初始算法的训练样本差异等问题会导致识别精度极低。是机械的使用传统的机器学习算法降低业务办理标准?还是大胆创新自主研究算法提升算法识别精度? 

集团公司要求各省于2017年1月1日前完成新入网人像留存改造,以满足国家六部委关于电话用户实名登记的要求。而且前期由于使用了某商用的人脸识别产品,但是适配本地需求效果不佳的情况下,是按部就班尽人事听天命?还是直面挑战想办法求突破?


三、选择自主研发、创新突破

“问题纵有万千,我有初心不变”,我们谨记“不忘核心能力掌控”这个初心,自主研发搭建了一套以“LBP算法与Haar分类器自主融合算法”为核心,可灵活适配多终端的综合性人像识别微组件解决方案。

1. 解决问题我们是用心的:统一拍照终端的接入适配,把拍照“微组件”接到全渠道

1

把拍照终端的适配做成响应式

针对一体机、高拍仪和摄像头等多类型终端,在高版本浏览器的PC和APP上使用H5 MediaDevices接入摄像头视频流,以获得更好的FPS和图片分辨率。在低端PC上使用FLASH MediaObject支持最低要求拍照,实现全终端拍照响应式适配。


图2多终端示例

2

把拍照分辨率做成自适应

由于人脸识别系统要求实拍照片的清晰度有一定要求(>=1.30M PX),同时在网络传输过程中也需要限制图片(<=200K)以提升响应效率。所以人脸识别组件加入图像预处理机制采集拍照图片分辨率,并在此基础上根据输出要求对图片进行压缩调整,以保证各终端输出统一质量的图片,以适应人脸识别照片的要求。

3

让人像识别变成“微组件”

人脸识别组件使用模块化开发方式进行封装,在PC版组件上加入一/二维码生成、H5/Flash视频流捕捉等子模块;在APP上应用H5和视频流捕等技术,在业务办理流程中无缝接入人像组件。实现人像微组件在全渠道系统的复用接入。


图3 PC端人像拍摄示例

2. 研究算法我们是认真的:融合Haar与LBP算法,形成为我所用,为我可用的人像识别算法

Haar算法:在统计算法AdaBoost的基础上,使用Haar-like小波特征和积分图方法进行人脸检测,并对AdaBoost训练出的强分类器进行级联,大幅提升了识别准确率


                                                    图4特征图

描述:上面的任意矩形放到人脸区域上,将白色区域的像素和减去黑色区域的像素和,得到的值称之为人脸特征值,如果把这个矩形放到一个非人脸区域,那么计算出的特征值应该和人脸特征值是不一样的,这些方块的目的就是把人脸特征量化,在统计学的基础上区分人像和非人像。

LBP算法:是局部二值模式,通过对比周围像素的灰度值来计算中心点的LBP值,并用该值来反应区域纹理信息,用于图像的预处理分析。


                                                           图5转换图

描述:以邻域中心像素为阈值,将相邻8个像素的值与其进行比较,若周围像素值大于中心像素值,则标记为1,否则为0。这样3x3邻域内的8个点产生8位二进制数,即得到该邻域中心像素点的LBP值,并用这个值来反映该区域的纹理信息。


1

应用Haar提升图像识别准确率:

针对明显的、稳定结构的特征的物体,只要结构相对固定即使发生扭曲等非线性形变依然可识别,识别准确率高;

2

应用Haar提升图像匹配效率:

算法中积分图的使用大大的提高了图像特征值计算的效率,让毫秒级实时人像检测成为可能;

3

应用LBP提升图像预处理效率:

由于灰度尺度不随任何单一变换而变化,因此不同光照条件下,LBP算法鲁棒性好、计算速度快,可以在复杂的实时条件下分析图像。

通过两种算法结合,人像留存方案的识别率已超过98%,效率在1秒内。

3. 完成任务我们是高效的:在传统行业瀑布模型的重重困难下,果断采用SCRUM敏捷开发,快速响应市场需求

自主研发6人队采用敏捷开发,快速迭代的模式来应对这一挑战。自主研发与地市一线营业厅、渠道经理、业务管理员建立百人交流群,快速收集上线后一线反馈的问题,挖掘优化点,并投入下一个迭代中。每一次迭代上线的完成代表着下一轮优化的开始。这样周而复始,在短短1.5个月中支撑了6轮人脸识别的迭代上线,平均每周1次,在用户体验和人像识别准确性和可用性上都有了显著提升,圆满完成全省应用推广。


四、展望

通过云计算中心与开发团队通力合作,目前浙江移动的全部合作渠道以及部分营业厅的无有效身份证用户的CRM用户开户,均通过人像保留业务来支撑;当前日均请求量已经达到6万次。为了进一步提高人像识别服务的准确性,目前云计算中心已经完成基于CNN深度学习神经网络的人像识别算法开发,未来计划部署到基于TensorFlow大数据平台集群之上,最终的目标架构如下图所示。


通过逐步将深度学习算法以及相关计算框架引入部署到大数据平台的过程,大力推进大数据平台朝智能云平台方向演进。本次案例的成功部署虽是人工智能的牛刀小试,却是三墩IT人自主研发能力建设和人工智能技术试点的星星之火,未来依托于我们大数据平台三期(智能云)我们将以燎原之势将浙江移动的大数据应用带向人工智能时代。


友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟