文章链接:http://openaccess.thecvf.com/content_ECCV_2018/papers/Xuelin_Qian_Pose-Normalized_Image_Generation_ECCV_2018_paper.pdf

TL;DR

文章中提出了一种基于姿势标准化的图像生成方法来解决不同pose下的Re-id问题. 主要思路是使用一个PN-GAN将数据中的所有行人归一化到8个姿态中, 将从真实数据中提取到的行人特征和生成数据中提取到的行人特征融合之后做re-id匹配。

Dataset/Algorithm/Model

文中模型的pipeline如下所示:

文章的主要创新点在于提出了PN-GAN模型, 生成了标准pose下相同人的不同pose图片, 然后将生成的图片特征和初始图片特征进行融合作为Re-id的特征.其中PN-GAN模型如下所示:

对于标准的pose, 文章中提出了八种, 如下图所示:

Experiment Detail

Thoughts

文中通过将pose归一化来去除掉variant pose对Re-id模型提取特征的影响. 最后实验的效果比直接使用ResNet-50去做re-id的结果提升也不算特别大。我觉得可能是生成的图片没有能够很好的还原真实的信息,或者无法提供Re-id模型想要提取的特征。

联系作者