AI深度(上) 3D人脸识别和结构光
时间: 2024-08-09 06:21:39 |   作者: 爱游戏app入口

  一文看尽双目摄像、结构光、ToF和激光雷达技术;一文进一步探索奥比中光、华捷艾米、的卢深视、Pico和镭神智能;2大趋势、2大核心技术。

  开篇最近纽豪斯深感疲惫,主要是2个热点线”,前段时间引起了热烈的讨论,一周工作6天,每天工作12个小时,如果礼拜天做工一天,基本上就没什么休息时间了,当然我也听说个一个工作方式,叫做“5+2、白+黑、夜总会”,解释一下就是一周工作7天、白天和晚上都工作、晚上总是开会,总结一下就是又忙又累。另外一个热点就是贸易战,有人说“华为、海康必有一战”没想到的却是贸易战,AI智道并没有去蹭这个热点话题去写点文章吸引一下关注或访问量,不过天天要看这些相关的文章,实在是太多了花费了不少的时间去了解,不看也不行。故而耽误了码文字的时间,导致AI智道迟迟不能更新,毕竟我码文字有两个原则:

  说起贸易战纽豪斯就想起了一种植物,新疆有一总树名叫胡杨,胡杨有三个特点,我记得当地人给我介绍过“生而千年不死、死而千年不倒、倒而千年不朽”,希望我国的领头羊企业能够拥有胡杨的特质。

  前言当安防不再是安防,AI不再是AI的时候,二者的边界模糊了。纽豪斯陷入了深思,到底安防行业的发展的新趋势是什么?

  经过3个多月(自春节以来),纽豪斯拜访了大量的客户、合作伙伴、产品供应商,发现AI赋能安防的未来2大发展趋势:

  国内有4家AI独角兽企业(云从、依图、旷视、商汤),都以人脸识别技术起步并名扬天下,据纽豪斯的了解均是基于2D图像(RGB摄像机)的人脸识别,当人脸库是2D图像时用2D技术自然是没问题的,但是当需要金融级支付技术的时候,就需要唯一性和准确性并能防欺骗,2D技术没办法完美解决活体识别,故而人脸识别的发展逐步从2D走向3D识别,这是趋势之一。

  人脸识别技术存在着天然的适用场景,比如人证合一比对(身份证实名认证)、人脸门禁系统、人脸考勤系统等场景,这些都是基于人脸,故而存在市场刚需。除此之外,因为存在隐私保护和数据安全的双重要素,全球范围内对是否采用人脸识别技术用于视频监控尚存在比较大的争议和分歧,比如前段时间就发生了“经过三个多月的议会讨论,最终8:1投票通过,禁止旧金山的政府机构使用人脸识别技术”,而计算机视觉技术的发展足以达到商用的程度,若无法人脸识别,剩下的自然就是非人脸识别,可以是人体特征识别、车牌识别、物体识别、行为识别等其它形式。这也是一种趋势。

  大势所趋如果3D人脸识别和非人脸识别两大趋势成立,那么怎么来实现3D人脸识别和非人脸识别就是摆在AI企业面前的两个技术问题,这正是本篇文章纽豪斯要为大家介绍的“深度相机技术”。写文章要有深度,做AI同样需要有深度,深度可以全息刻画一个目标对象,透过现象看本质。

  目前市面上主流的人脸门禁系统活体检测采用的就是双目摄像机,结构光摄像机主要使用在手机(典型代表iPhone X)和人脸门禁系统(尚未普及),ToF还是一项新技术大多数都用在物体测距。接下来纽豪斯就带大家领略一下这4大技术。

  双目摄像技术(Stereo System)由两个单目相机组成(两个相机之间的距离叫“基线”是已知的),通过这一个基线来估计每个像素的空间位置来测量物体与我们之间的距离,克服单目相机无法知道距离的缺点。双目相机测量到的深度范围和基线有关,基线距离越大,能够测量到的就越远。

  配置与标定较为复杂,其深度和精度受双目的基线或者分辨率所限,并且视差的计算非常消耗计算机资源,在现有的条件下,计算量是双目的主体问题之一。

  平视双目立体成像原理图,两摄像机的投影中心连线的距离,即基线距离B。两摄像机在同一时刻观看时空物体的同一特征点P,分别在“左眼”和“右眼”上获取了点P的图像,他们的坐标分别为Pleft=(Xleft,Yleft);Pright=(Xright,Yright)。将定两摄像机的图像在同一平面上,则特征点P的图像坐标的Y坐标一定是相同的,即Yleft = Yright =Y。由三角几何关系能够获得如下关系式:

  因此,左摄像机像面上的任意一点只要能在右摄像机像面上找到对应的匹配点,就可完全确定该点的三维坐标。这种方法是点对点的运算,像平面上所有点只要存在相应的匹配点,就可以参与上述运算,从而获取对应的三维坐标。

  目前市面上主流的活体检测和防伪解决方案主要是采用双目摄像技术,相比较结构光和ToF方案,价格更加低廉,模块也比较成熟。

  低功耗USB CAM,支持高清摄像头功能,支撑WDR,强光抑制,暗光补偿,人像优化,场景优化。

  双目摄像机具备一定的深度探测功能,有一定的深度,但属于被动方式。线D成像当属于主动光源的3D结构光技术,采用的是结构光法。结构光法(Structured Light)通过向表面十分光滑无特征的物体发射具有特征点的光线,依据光源中的立体信息辅助提取物体的深度信息。具体的过程包括两个步骤,首先利用激光投影仪向目标物体投射可编码的光束,生成特征点;然后根据投射模式与投射光的几何图案,通过三角测量原理计算摄像机光心与特征点之间的距离,由此便可获取生成特征点的深度信息,实现模型重建。这种可编码的光束就是结构光,包括各种特定样式的点、线、面等图案。结构光法解决了物体表面平坦、纹理单一、灰度变化缓慢等问题。因为实现简单且精度较高,所以结构光法的应用十分普遍,目前已有多家公司生产了以结构光技术为基础的硬件设备,如Prime Sense公司的Prime Sensor、微软公司的Kinect和华硕公司的Xtion PRO LIVE等产品。

  下图左是普通双目立体视觉深度相机拍摄的图像和对应的深度图结果;下图右是结构光法的深度相机投射的图案及对应的深度图结果,明显可以观察到在同样的场景下结构光法得到的深度图更完整,细节更丰富,效果大大好于双目立体视觉法。

  结构光法投射的图案有必要进行精心设计和编码,结构光编码的方式有很多种,大体上分为如下几大类:

  该技术方案需要投影N个连续序列的不同编码光,接收端根据接收到N个连续的序列图像来每个识别每个编码点。投射的编码光有二进制码(最常用)、N进制码、灰度+相移等方案。

  该方案的优点:测量精度很高(最高可达微米级);可得到较高分辨率深度图(因为有大量的3D投影点);受物体本身颜色影响很小(采用二进制编码)。

  缺点:更适合静态场景,不适用于动态场景;计算量较大(因为识别一个编码点需要计算连续N次投影)。

  3.空分复用编码(Spatial multiplexing coding)

  由于结构光主动投射编码光源,因而很适合在光照不足(甚至无光,尤其是夜间)、缺乏纹理的场景使用。

  室外环境基本不可以使用。这是因为在室外容易受到强自然光(超过2000Lux)影响,导致投射的编码光被淹没。

  根据雷锋网早前报道:2019年4月17日,支付宝在北京发布了第二代刷脸支付设备——“蜻蜓2.0”,与1.0版本相比,“蜻蜓2.0”主要有两点提升:一是不用再输手机号,可以单纯靠刷脸完成支付;二是首次接入了刷脸即会员的数字化经营能力。

  纽豪斯在前文说过,3D人脸识别将会是未来的一个趋势,那么这个趋势中最佳的3D人脸识别模式将会是3D结构光,可有效的解决2D的人脸防伪问题,更能很好的解决人脸的唯一性。3D结构光的3D人脸应用中最大缺陷是相比较2D,系统缺乏3D人脸的底库,需要一个一个的采集后才能够形成3D人脸库,而不像2D人脸库标准的身份证大库中就有,不需要额外采集,不过这方面的卢深视已经走在最前面。

  深圳奥比中光于2013年1月份成立,是一家集研发、生产、销售为一体的3D传感技术高科技企业;作为国际领先的3D传感方案提供商,是继苹果、微软、英特尔之后,第四家(国内第一且唯一)能够量产消费级3D结构光传感器的公司。奥比中光3D结构光深度摄像头,是基于3D结构光技术所设计的一种高精度、低功耗的3D摄像头,可为智能终端加上了物体感知功能,从而引入多个“痛点型应用场景”,包括人脸识别、活体检测、人机交互、人流统计、三维建模、AR、安防和辅助驾驶等,让所有终端都能看懂世界。3D结构光深度摄像头可实现实时三维信息采集,为这些应用功能提供必要的且高质量的三维数据,从而大幅度的提升了应用功能的安全性、可靠性等各项性能。

  3D结构光产品可大范围的应用于3D人脸识别/3D表情识别,包括3D刷脸支付、3D人脸门禁、3D动画表情等;也能够适用于3D点云(彩色图/深度图),包括3D物体尺寸测量、机器人Slam、3D试衣服、距离测量等;还能够适用于人体骨骼识别和跟踪、行为分析,应用场景包括娱乐、安保、客流分析等。

  北京华捷艾米成立于 2014 年,专注于计算机 3D 视觉、人机智能交互及 3D MR 混合现实技术。拥有核心知识产权的 3D 视觉及 MR 解决方案的AI企业,打破苹果、微软的技术垄断。提供包含“3D 摄像头、3D摄像头模组、3D AI/MR 芯片、3D AI/MR 算法体系、开发工具包等”在内的一站式企业级解决方案。在人脸支付领域和腾讯达成战略合作。

  在新零售领域,华捷基于3D 机器视觉及MR人工智能技术达到顾客购物的全程身份识别、行为监控、记录、分析及智能支付,并提供客户消费行为全程云平台大数据。典型应用包括3D 刷脸支付、客流统计;在智能家居领域,华捷基于人体行为识别和 MR 人工智能技术达到精准、自然人机交互。典型应用包括人脸门禁系统;在智能安防领域,华捷艾米利用自有硬件和算法,利用当前先进的深度识别算法,通过 3D 检测技术,获取人流数据。当所监控的人流数量达到设定的阀值或出现异常行为时,自动启动预警方案。

  3D 摄像头。3D骨架识别、3D智能SLAM、3D手势识别、3D人脸识别等多种算法。

  华捷艾米A200+mini自主研发的高清智能 小型化超薄 3D 摄像头产品 ,基于散斑结构光原理设计,搭载华捷艾米最新ASIC芯片,能快速准确获取目标的深度信息可适用于近距离 (0.28 ~1m )人脸识别、深度数据采集,立体与平面判断等。应用于近距离物体识别场景 ,如新零售行业的人脸支付 、火车站的人证核验等。

  一般的人不大了解的卢深视,如果是长期从事公安人脸解决方案的同行可能就听说过,尤其是他们的产品已经在安检、边检方面取得大量应用成果,拥有大容量的3D人脸库建模和训练经验。的卢深视是一家专注三维机器视觉和AI领域的高新技术企业,成立于2015年8月,总部在北京,在杭州、合肥两地设有研发中心,在结构光深度感知、三维实时高精度重建、三维跟踪识别及感知等技术方向上处于领头羊。的卢深视以“真”三维人脸识别技术为依托,区别于常见的“二维识别+ 三维防作伪”产品,以技术迭代引领业界标准,其三维人脸识别技术水平远超其他识别手段。关键是拥有百万级三维人员库高准确度识别经验,千万级以上大库也有实操经验。

  据媒体公开报道:的卢深视在结构光深度感知、三维实时高精度重建、三维跟踪识别及感知等技术方向上,实现了技术领先。布局了自己的”云端芯“的产品战略,发布了哨兵、天眼、鹰眼、火眼、冰鉴五个产品系列。

  一款集成了三维高清摄像机、具备三维人像采集功能的人证通类产品。该类设备能够提取现场持证人的三维人像和身份证照片,进行1:1 比对,完成身份核验。基于深度学习算法,识别速度快、准确率高,基于三维人像的防作伪能力比二维相机更高,它能利用三维人脸特征的唯一性进行精准识别,解决人员忘带证件无法通行、冒用他人证件非法通行等问题。的卢深视三维人脸验证闸机终端采用基于自研的深度学习三维人脸识别智能算法,具有先进、高效、安全等优点,适用于闸机厂家、系统集成商和设备厂商。

  MN100/200 是在出入口通道用于动态采集二维视频及三维深度信息并利用互联网编码传输的高清三维网络摄像机。

  配合“天眼”高清三维网络摄相机,实现三维人脸检测、跟踪、抓拍、识别以及属性分析的软硬一体的计算模块。它采用了嵌入式操作系统和高性能硬件处理平台,具有较高的稳定性和可靠性。

  AI智道深度文章下篇文章将为大家深度揭秘ToF技术和激光雷达技术,敬请持续关注。参考文献:

  版权说明:本文核心素材来自人人智能,部分素材来源于互联网,凡能注明素材出处的尽可能都予以注明。本文内容禁止用于商业目的,如需转载事先和AI智道联系获取授权。

  致谢:感谢人人智能王海增提供了基础素材,感谢PICO小鸟看看、华捷艾米、奥比中光、的卢深视、镭神智能提供的内容素材。

  免责声明:本文来智客号作者,不代表千家网的观点和立场。若有侵权或异议请联系我们删除。

  更多猛料!欢迎扫描左方二维码关注千家智客官方微信(Qianjiacom)

  房叔,真名张新房,人称“房叔”,17年视频监控和安防行业经验,目前专注于视频监控、人工智能、计算机视觉技术。

粤ICP备05051730号-1 Copyright 2019 © MOLILOCK.(Guangzhou)Co. Ltd