自动人脸识别基本原理
这篇讲的是人脸识别近40年来的核心算法演进。作者开篇就点明,这个领域融合了计算机视觉、机器学习等多学科知识,算法难以统一分,通常根据输入数据分为基于静态图像和视频图像两大类。 文章重点对比了三类经典的静态图像识别算法。特征脸方法通过主成分分析将人脸投影到一个低维子空间进行匹配,思路直观,但得到的特征在区分不同类别时未必最优。弹性图匹配则更进一步,它用图结构表示人脸,节点编码局部纹理,边记录几何关系,这种方法对光照和姿态变化有一定鲁棒性,但计算代价过高影响了实用。3D形态模型则另辟蹊径,尝试用三维模型参数来描述人脸的形状和纹理,从而更好地处理姿势和光照变化。 针对视频人脸识别,文章梳理了三个发展阶段。早期方法本质是“跟踪后识别”,利用多帧投票来提高稳定性。随后发展出融合声音、步态等信息的多模态系统。最新的方向则是同时在空间和时间维度上建模,直接利用视频中连续的动态特征进行识别。文章也坦诚地指出了视频场景下面临的图像质量低、人脸尺寸小等严峻挑战,这为后续研究指明了方向。