1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > 在开放环境的步态识别:一个基准(一)

在开放环境的步态识别:一个基准(一)

时间:2020-07-25 07:09:32

相关推荐

在开放环境的步态识别:一个基准(一)

文章目录

在开放环境的步态识别:一个基准AbstractIntroduction

在开放环境的步态识别:一个基准

论文题目:Gait Recognition in the Wild: A Benchmark

paper是清华大学发表在ICCV 的工作

论文地址:链接

Abstract

\quad \quad 步态基准使研究界能够训练和评估高性能的步态识别系统。尽管越来越多的人致力于跨视角的识别,但学术界目前受限于在受控环境下捕获的数据库。在本文中,作者为开放环境的步态识别(GREW)贡献了一个新的基准。GREW数据集是由自然视频构建的,其中包含了开放系统中的数百个摄像头和数千小时的数据流。通过大量的人工注释,GREW包括26K个身份和128K个序列,具有丰富的属性,可用于无约束的步态识别。此外,作者还增加了一个超过23.3万个序列的干扰物集,使其更适合于现实世界的应用。(我理解的适合于现实世界应用,算法要有健壮性,加入噪声,是为了抗干扰,增强算法健壮性)与流行的的预定义跨视角数据集相比,GREW具有多样性和实用性的视角变化,以及更自然的挑战因素。据作者所知,这是第一个在野外进行步态识别的大规模数据集。有了这个基准,作者剖析了无约束的步态识别问题。探讨了有代表性的基于外观和基于模型的方法,并建立了全面的基线。实验结果表明:(1)提出的GREW基准对于训练和评估野外的步态识别器是必要的。(2) 对于最先进的步态识别方法,还有很大的改进空间。(3) GREW基准可以作为受控步态识别的有效预训练。基准网站是链接。

Introduction

\quad \quad 步态识别的目的是根据视频中人的行走方式来识别一个人。与人脸、指纹、虹膜和掌纹相比,步态难以伪装,可以在很远的距离内工作,这使得它在犯罪预防、法医鉴定和社会安全方面具有独特的潜力。

\quad \quad 由于深度学习的蓬勃发展,在受控环境下识别步态已经取得了重大进展。最近步态识别的基本引擎包括网络架构的演变、损失函数的设计和不断增长的步态基准。尽管步态识别在过去几年中取得了令人印象深刻的进展,而且它具有长距离识别的独特优势,但这种技术尚未在现实世界的应用中得到广泛部署。一个值得注意的障碍是,几乎没有公共基准来训练和评估野外的步态识别器。

\quad \quad 据作者所知,大多数步态数据集都是在相对固定和受限的环境中采集的,如实验室或静态室外环境。如图1所示,CASIA-B和OU-MVLP是近期步态识别研究中最常用的数据集。CASIA-B包含124个对象和13,640个序列,它建于。OU-MVLP由10,307个身份ID和288,596个行走视频组成,就对象数量而言,它是一个大步态数据集。更多数据集的统计数据见表1,这些数据集主要是在受控环境下构建的,是为预定义的跨视角步态识别而设计的。然而,在真实场景中,步态识别会遇到完全不受约束的挑战,如不同的视角、遮挡、各种携带和穿戴条件、复杂和动态的背景干扰、照明、行走方式、表面影响等。现有的基准远远落后于实际步态识别的要求。考虑到人脸识别和行人重识别(ReID)的显著成功,现在是时候在野外进行基准步态识别了。

\quad \quad 在本文中,作者提出了 “野外步态识别”(GREW)基准。就作者所知,这是第一个深入研究这个开放性问题的工作。如图1所示,GREW数据集由具有多个摄像头的自然流构建而成。来自原始视频的身份信息被手动注释,从而产生 26K 个对象、128K 个序列和 14M个 框,用于无约束步态识别。此外,丰富的人类属性,包括性别、年龄组、携带和穿着风格都被标记出来,以便进行精细的性能分析。实际上,gallery规模是识别准确性的关键问题。为此,作者增加了一个超过23.3万个序列的干扰物集,使其更适合于现实世界的应用。由于有一系列使用不同输入数据类型的步态识别框架,GREW 通过自动处理提供轮廓、步态能量图像 (GEI)、光流图、2D 和 3D 姿势图。与CASIA-B和OU-MVLP等受控步态数据集相比,作者的GREW是完全不受约束的,并且有更多不同的、实用的视角变化,而不是预定义的。同时,如表1和图2所示,GREW中存在各种挑战因素,如干扰物集、复杂背景、遮挡、携带、穿戴等。

\quad \quad 利用所提出的GREW,对无约束的步态识别问题进行了深入研究。第一,在GREW上实验了代表性的基于外观和基于模型的基线,这表明有很大的改进空间。例如,表现最好的GaitSet在GREW测试集上获得了46.28%的Rank-1准确性,而它在CASIA-B和OUMVLP上的准确性超过了80%。有了干扰物集,野外的步态识别将变得更有挑战性,而最佳模型的得分只有41.97%的Rank-1。第二,探讨了数据规模的影响,包括训练身份的数量和gallery的大小。增加训练对象可以持续提高性能,而大规模的测试集和干扰物对基于CNN的识别器来说仍然非常困难。第三,报告了不同属性(性别、年龄组、携带和穿着)的表现,给出了深入的分析结果。最后,作者验证了GREW在预训练中的有效性。在GREW上预训练的微调模型在跨数据集的步态识别中显示出卓越的性能。

本文主要贡献可归纳为以下几点:

作者为研究界构建了一个大规模的基准,以便在野外进行步态识别。提出的GREW包括26K个受试者和128K个序列,具有来自灵活数据流的丰富属性,就作者所知,这使它成为第一个用于无约束步态识别的数据集。为了构成GREW基准,作者从开放系统的多个摄像机中收集了数千小时的数据流。通过自动预处理和大量的人工身份注释,有超过1400万个框同时提供轮廓和人体姿势。此外,作者用23.3万个序列的分心集来丰富GREW,使其更适合于现实世界的应用。在新基准的支持下,作者进行了广泛的步态识别实验,并建立了全面的基线,包括代表方法、尺度影响、属性分析和预训练。结果表明,GREW对于野外的步态识别是必要和有效的。此外,对于目前的SOTA方法来说,识别无约束的步态是一项非常具有挑战性的任务。最后,所提出的数据集可以作为有效的预训练数据用于受控步态识别,以达到更高的性能。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。