人脸识别技术介绍和表情识别最新研究_编程技术网-程序员技术内容聚合平台

（在说正事之前，我要推荐一个福利：你还在原价购买阿里云、腾讯云、华为云服务器吗？那太亏啦！来这里，新购、升级、续费都打折，能够为您省60%的钱呢！2核4G企业级云服务器低至69元/年，点击进去看看吧>>>)

一、人脸识别技术介绍

人脸识别作为一种生物特征识别技术，具有非侵扰性、非接触性、友好性和便捷性等优点。早在二十世纪初期，人脸识别已经出现，于二十世纪中期，发展成为独立的学科。人脸识别真正进入应用阶段是在90年代后期。人脸识别属于人脸匹配的领域，人脸匹配的方法主要包括特征表示和相似性度量。

人脸识别通用的流程主要包括人脸检测、人脸裁剪、人脸校正、特征提取和人脸识别。人脸检测是从获取的图像中去除干扰，提取人脸信息，获取人脸图像位置，检测的成功率主要受图像质量，光线强弱和遮挡等因素影响。获取人脸后，人脸裁剪是根据实际需求，裁剪部分或整体的人脸，进一步精确化人脸图像。为提高人脸识别准确率，人脸校正可以尽可能的降低由于姿态和表情导致的人脸变化，获取正面或者平静状态下的人脸照片。特征提取利用不同的特征，对图片进行相似度的衡量和评价。人脸识别主要包括一对一或者一对多的应用场景，对目标人脸进行识别和验证。

人脸表达模型主要分为2D，2.5D，3D。2D人脸指的是RGB，灰度和红外图像，是确定视角下表征颜色或纹理的图像，不包括深度信息。2.5D是在某一视角下拍摄获取的人脸深度数据，但是曲面信息不连续，没有被遮挡部分的深度数据信息。3D人脸由多张不同角度的深度图像合成，具有完整连续的曲面信息，包含深度信息。2D图像人脸识别的研究时间较长，软硬件技术较为完备，得到了广泛的应用。但是由于2D图像反映二维平面信息，不包含深度数据，不能够完整的表达出真实人脸模型。相比于二维人脸图像，三维图像不受光照等影响，具有更强的描述能力，能够更为真实的反映人脸信息，在人脸合成、人脸迁移、三维人脸识别等场景中应用。3D人脸识别一般采用深度相机获取人脸深度信息，主要包括双目相机，基于结构光原理的RGB-D相机和基于光飞行时间原理的TOF相机。常见的三维人脸识别算法主要包括传统识别方法和深度学习识别方法。

1.传统识别方法

(1)基于点云数据的人脸识别

点云是3D人脸数据的一种表征方式，每一个点都对应一个三维坐标，扫描设备使用这种数据格式存储采集的三维人脸信息，甚至可以将稀疏坐标也拼接到形状信息上，更为完善的反映人脸信息。基于点云数据的3D人脸识别直接使用三维点云进行匹配，常见方法有ICP(Iterative Closest Point)和Hausdorff距离。前者可以修正点云信息中平移和旋转变换的误差，后者利用三维点云之间的距离最大值，匹配人脸，但是两者均存在鲁棒性不足的问题。

(2)基于面部特征的3D人脸识别

人脸的面部特征主要包括局部特征和全局特征，局部特征可以选择从深度图像上提取关于面部关键点的特征信息，全局特征是对整张人脸进行变换提取特征，例如球面谐波特征或者稀疏系数特征。

2.深度学习识别方法

(1)基于深度图的人脸识别

深度图像中三维数据的z值被投影至二维平面，形成平滑的三维曲面。可使用归一化网络和特征提取网络实现深度图人脸识别，归一化网络将输入的深度图像转化为HHA图像，再使用卷积神经网络回归用于获取归一化深度图的参数，特征提取网络用于获取表征深度图人脸的特征向量。

(2)基于RGB-3DMM的人脸识别

3DMM是指三维人脸变形统计模型，其最早是用于解决从二维人脸图像恢复三维形状的问题，现多被用于对深度图像或彩色图像进行人脸模型回归，实现识别任务。

(3)基于RGB-D的人脸识别

RGB-D图像是包含了彩色图像和深度图，前者是从红、绿、蓝颜色通道获取的图像，后者是指包含与视点的场景对象的表面的距离有关的图像通道，两者之间是相互配准。通过对彩色图像和多帧融合后的深度图像分别进行预训练和迁移学习，在特征层进行融合，提高人脸识别率。

二、表情识别最新研究

1) Facial Emotion Recognition with Noisy Multi-task Annotations

摘要

从面部表情可以推断出人类的情感。但是，在常见的情感编码模型中，包括分类和维度模型，面部表情的注释通常会非常嘈杂。为了减少人为标注多任务标签的工作量，文中引入了带有嘈杂的多任务注释的面部表情识别新问题。对于这个新问题，文中建议从联合分布匹配的角度进行计算，其目的是学习原始人脸图像和多任务标签之间更可靠的关联，从而减少噪声影响。采用一种新方法来在统一的对抗性学习游戏中启用情绪预测和联合分布学习。在广泛的实验中进行的评估研究了所提出的新问题的实际设置，以及所提出的方法在合成嘈杂的带标签CIFAR-10或实际嘈杂的多点干扰方法上优于最新竞争方法的明显优势标记为RAF和AffectNet的任务。

本文探讨的是嘈杂的多任务标签中面部表情识别的问题。实际应用中，两种最常用的面部情绪编码模型是分类和维数，但是通过从可用的情感标签中进行模型的学习容易产生不好的结果，因此，文中提出的公式是从联合分布匹配的角度解决此问题的，旨在利用数据和多任务标签之间的相关性来减少标签噪声的影响。

该文为解决人脸情感识别的实际案例提供了一些贡献，主要可概括为以下三点：(1)提出了一个带有嘈杂的多任务标签的面部表情识别新问题，该问题的目标是易于获得的廉价多任务注释；(2)提出了一种广义化的公式，在数据和异构多任务标签之间具有明确的联合和边际分布匹配；(3)引入了一种新的对抗学习模型，以基于联合和边际分布的约束条件来优化对情绪预测的训练，这被证明适合于新提出的问题。

带有噪音标签的面部情感识别仅在带有噪音标签的面部图像上训练鲁棒模型。传统的方法是直接用噪声标签分布对噪声建模，但是传统的条件概率建模具有几个明显的缺点，例如转换矩阵缺乏约束条件收敛到真值等。针对于此，本文利用匹配两个联合分布的关键思想，考虑在两对数据和标签上的以下两个联合概率分布：

本文转载自网络，原文链接：https://www.toutiao.com/a6891264165558780430/

人脸识别技术介绍和表情识别最新研究
无监督机器学习的重要指南
靠脑机接口“隔空探物”，大脑植入芯片
人工智能势必在不久的将来，取代一大批