人脸识别新工具:数据少也能认识“国际脸”( 二 )


“这就相当于研究人员把试卷出好 , 机器作答 。 ”邓伟洪说 。
实现并不简单 , 在具体操作层面 , 物体识别不同于人脸识别 。 物体识别的源域和目标域可以重叠 , 且信息获取相对便宜 , 充足的源域数据使识别工具能够区分和判别目标域信息 。
因此 , 研究人员提出了一种信息最大化自适应网络 。 王玫介绍 , 该方法一方面减小源域和目标域的全局分布差异 , 另一方面能够学习有区分性的目标域特征 。
“也就是说 , 卷积神经网络可以在无监督的情况下 , ‘自觉’地学习目标域人脸的特征 。 ”王玫说 。
为了解决两个域之间类别不重叠的问题 , 信息最大化自适应网络采用谱聚类算法生成“伪标签” , 并在监督下利用伪标签对网络进行预适应 , 初步提高目标域的性能 。
这种聚类方案与其他不适用于人脸识别的域自适应方法有着本质区别 。 王玫解释 , 新方法可以在全新的目标域上自主学习 , 不需要人工干预 , 避免了隐私泄露的风险 。
为了进一步提高网络输出的鉴别性 , 研究人员还提出了一种新的基于互信息的自适应方法 , 它以无监督的方式在目标域的特征之间产生更大的间距 。
与一般的有监督的损失和有监督的互信息不同 , 该方法具有无监督的特性 , 其可以利用所有无标签的目标域数据 , 无论这些数据是否被成功地分配了伪标签 。
基于公开数据进行验证
这套方案是否能在非监督的情况下 , 提高人脸识别工具对不同国家/地区居民脸部信息的识别率呢?
研究人员采用全球各地名人的公开数据进行验证 。 结果表明 , 信息最大化自适应网络可以成功地将识别能力从源域应用到其他国家/地区的目标域人群中 , 且识别性能优于其他域自适应方法 。 消融实验研究发现 , 互信息损失对减少识别偏差有重要作用 。
王玫补充 , 信息最大化自适应网络在跨姿态、跨场景的应用上也有很好的泛化性能 。
鉴于较好的实验结果 , 研究团队已经对外发布RFW数据集 , 以推进研究进一步深入 。
目前 , 已有哈佛大学、帝国理工学院、清华大学、思科、华为、NEC、IBM等20多个国家的科研院所、企业的科研团队申请使用RFW进行多人种人脸识别研究 。
值得一提的是 , 该方法在进行自适应学习的同时 , 仍然需要利用源域地区采集的标注数据对模型进行训练 。 这就意味源域数据具有隐私泄露风险 。 如何在源域数据不外传的情况下进行目标域的自适应学习 , 将是非常值得研究的问题 。
【人脸识别新工具:数据少也能认识“国际脸”】邓伟洪表示 , 下一步希望在完全不采集目标域数据的情况下 , 提出具有更强泛化能力的新算法 , 直接提高人脸识别工具在未知目标域的准确率 。

推荐阅读