博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Deep Learning 论文笔记 (3): Deep Learning Face Attributes in the Wild
阅读量:6230 次
发布时间:2019-06-21

本文共 1504 字,大约阅读时间需要 5 分钟。

 这是Xiaogang Wang和Xiaoou Tang组的一篇technical report,作者是优秀的学弟Ziwei Liu。

 

 通常人脸识别里面先要对人脸图像进行检测和对齐,然后在相应的地方提取特征,但是在自然场景中,由于背景混乱,人脸检测和对齐会受到影响,进而影响特征提取和最后的识别效果。

 这篇论文的主要思想是通过学习两个deep network来构建face attributes recognition的系统,其中第一个用来localization,第二个用来提取feature。

 主要流程:

 (a)(b)是corse to fine去localize人脸的位置,经过(a)的CNN得到脸和肩膀部分的图片,经过(b)的CNN进一步得到人脸部分的图片。

 (c)的CNN是用来学习人脸部分图片的特征,最后将fully connected layer的特征拼在一起,用(d)的SVM去得到分类结果。

 

 Learning algorithm:

 1. 用ImageNet里面的object categories去pre-train (a)和(b)中的两个CNN。使用判断图片里面是否含有object的task去pre-train一个希望能够自动定位人脸位置的CNN,有一定道理的,知道object,基本上也知道人脸在哪一块了。

 2. 用CelebFaces数据集的face identity的信息去pre-train (c)中用来提取人脸特征的CNN。从(c)中可以看出来,它和一般的CNN有一点不一样,在中间两层是局部的卷积,前后两层是全局卷积,局部卷积的效果在于能够保持图片的位置信息,具体细节参考。

 3. 最后再用attribute的label分别对(a)(b)(c)三个CNN进行fine-tune。

 

 实验结果:

 作者给出的实验结果平均来说比FaceTracker,PANDA-w, PANDA-l好8%,10%,3%。但是文章在pre-train (a)(b)中的CNN时用到了额外的ImageNet里面的dataset,在pre-train (c)中的CNN时用到了额外的CelebFaces dataset。作者提到PANDA-l有用到ground truth bounding box和landmark positions,但是由于本人不清楚FaceTracker,PANDA-w, PANDA-l这三种比较的方法是否有用到其他额外的dataset或者其他information,因此对于实验结果的比较是否公平不好给出意见。

 

 结果分析:

 文章里面有一些分析比较有意思。第一个是分析在(c)中的CNN最后的fully connected layer的每一个neuron的作用。如果把face images对每一个neuron的响应分成强,中,弱三类,对每一类算出一个平均脸,最后发现其实每一个neuron都有一个semantic concept。如下图所示:

 

 第二个分析是(c)的CNN的最后fully connected layer的weight matrix,每一个列向量(我觉得好像是行向量)都相当于对应着分开一个attribute的正负样本的hyperplane,那么所有的列向量就是分开所有attributes的hyperplanes。将这些向量用K-means聚类,最后得到下图,相似的attributes聚类在一起,表明相似的attributes的hyperplane也相似。

  

 

转载于:https://www.cnblogs.com/yyuanad/p/4345739.html

你可能感兴趣的文章
如何打造支撑百万用户的分布式代码托管平台
查看>>
《机器人操作系统ROS原理与应用》——第1章 智能机器人及其发展概述
查看>>
《Adobe Illustrator CC 2014中文版经典教程(彩色版)》—第2课2.5节对象的排列
查看>>
Android 数据库框架ormlite
查看>>
零基础学习贴:如何收取短信回复消息
查看>>
网鱼网咖-利用数加快速搭建大数据平台,极致洞察,为客户带来从所未有的体验。...
查看>>
保护App重要数据,防止Cycript/Runtime修改
查看>>
iperf 测试网络性能指标
查看>>
windows下安装mysql压缩包版[转]
查看>>
Emacs常用命令汇总
查看>>
从传统IT快速走向公共云计算
查看>>
小菜一步一步学数据结构之(一)基本概念和术语
查看>>
《Redis官方教程》Redis集群规范
查看>>
Mac下没有make命令解决办法
查看>>
DLL中传递STL参数
查看>>
postgresql 范围类型
查看>>
隐藏 tengine 和 tomcat 版本号
查看>>
非面试向跨域实践详解
查看>>
一个非常好看的图片选择框架LPhotoPicker,确定不来看看么
查看>>
线上压缩代码-定位错误
查看>>