CVPR2020 | 深兰科技斩获4项竞赛冠军、总共12个奖项
2020-06-222020年6月19日,全球计算机视觉顶级会议CVPR2020圆满落幕,深兰科技北京AI研发中心的DeepBlueAI团队斩获了NightOwls Detetection Challenge 2020 (Track 1:Pedestrian Detection from a Single Frame, Track 2:Pedestrian Detection from a Multiple Frames两个赛道)、图片+ (Track 1 -- task 1赛题)、NTIRE 2020 :Perceptual Extreme Super-Resolution Challenge (PSNR 评价指标)共4个冠军,还在CVPR2020其他赛题中获得了4项亚军、4项季军,一共斩获12项冠亚季军。
其中,NightOwls夜间行人检测的测试成果可与白天行人检测结合,打造适用于不同天气条件的全天候的行人检测系统,可提升深兰目前的各类户外防疫监测产品的识别性能;图片+ 挑战赛的雾天条件下的物体检测成果可用于智能熊猫公交车、扫路机的安全监控、室外环境感知、辅助驾驶;NTIRE 2020 :Perceptual Extreme Super-Resolution Challenge图像恢复与增强挑战中的超分辨率感知测试成果可以应用于图像复原等领域。另外,还有多个竞赛的解决方案可以应用在服装行业、农业病虫害防护等领域。
国际计算机视觉和模式识别大会(CVPR)一直有计算机视觉领域的「奥斯卡」之称,凭借着严苛的竞赛标准,成为全球AI领域团队检验自身基础研究成果的试金石。今年,受全球疫情影响,该赛事于6月14日-19日在线上举办,以深兰科技等领军的中国AI企业在比赛中大放异彩,向全球展示了中国AI的雄厚实力。
深兰科技看重CVPR的比赛严谨和评比权威性,已连续多年出征CVPR,以此来检验自身的算法实力。今年,深兰科技共参与了10个竞赛项目,斩获4项冠军,总共12项冠亚季军,较去年取得了更为骄人的成绩。在全球经济跨入以AI为引领的第四次工业革命时代、中国聚焦AI「新基建」时,深兰科技已做好了充分准备,获得不俗成绩的同时,也将秉持开放共享的态度,为中国AI行业输出更多的新鲜血液,推动AI「新基建」发展。
下面,让我们看看深兰科技参加的10个赛道比拼,究竟有哪些挑战难点及应用场景。
1
NightOwls Detetection Challenge 2020
2个冠军、1个亚军
夜间行人检测,该比赛分为三个赛道:
赛道一:检测夜间场景下单帧图片中的行人
赛道二:借助当前帧及之前所有帧共同辅助检测当前帧的行人
赛道三:检测夜间场景下的行人、自行车、摩托车
难点:
1)所有数据集都是在车辆运动过程中采集的,当车速较快或者车辆与相机之间有相对运动时会产生运动模糊。同时又由于图片场景都是光线较弱的夜间场景,因此图片质量也相对较差。
2)夜间场景图片色彩信息少。
3)图片采集涵盖了不同的城市和天气条件,同以往用常用来训练预训练模型的数据集差异较大。
应用场景:24小时的行人监测系统
2
图片+ PRIZE CHALLENGE 第一赛道 任务1雾天条件下的物体检测
冠军
难点:
在特定条件,如恶劣的天气或者光照条件等,可见性较差的环境中的鲁棒性。即使是政府采用的商业化摄像机在恶劣的天气条件下也显得很脆弱。因此,迫切需要研究在何种程度上,在某种意义上可以应对这种具有挑战性的视觉条件。
应用场景:安全监控、室外环境感知、辅助驾驶
3
NTIRE 2020 :Perceptual Extreme Super-Resolution Challenge
PSNR冠军
图像超分辨率是一项关键的计算机视觉任务,其目的是恢复低分辨的图像内容,填充丢失的信息,以实现获得一张高清的大分辨率图像。团队主要关注PSNR指标,在PSNR指标上,团队取得第一名的成绩,并且超越了去年的冠军方案。
难点:
本次赛题对单张图像以及极端超分辨率提出了挑战,即基于一组的低分辨率和相应的高分辨率图像,以x16的放大因子对输入图像进行超分辨率(提高分辨率)。
应用场景:图像复原
4
Plant Pathology 2020 - FGVC7
亚军
本赛题旨在通过计算机视觉的方法,解决以下问题:
1)准确地判断叶片是否健康
2)对于不健康的叶片,判断其疾病的类别,有时一个叶片可能有多种疾病
难点:
1)数据集中涵盖了不同的叶片的角度、光照、形状、叶片年龄,数据相对复杂,对模型效果影响较大;
2)数据集中的疾病包含一些罕见的疾病,和一些新的症状,对模型提出新的挑战。
应用场景:农业病虫害分类
5
iMet Collection 2020 - FGVC7
亚军
本赛题需要将纽约大都会艺术博物馆中超过20万件藏品的数字化图像进行细粒度分类。
难点:
1)数据集总类别数比较多,超过3000个类别
2)图片尺度分布差异比较大
应用场景:博物馆、图书馆等馆藏分类及搜索
6
BDD100K Multiple Object Tracking Challenge
亚军
BDD100K是CVPR2020 Autonomous Driving WorkShop的一部分,是在最多样化的驾驶条件下的大规模跟踪挑战任务。
难点:
需要参赛者预测出视频中物体在时间维度上的关联,主办方提供了2000个40秒在一天中的不同天气条件下的完整注释序列,数据集提供了具有复杂遮挡和消失物体重新出现的多种驾驶场景,需要为开发的MOT算法在真实场景中的可靠性提供了一个很好的测试场景。
应用场景:自动驾驶,Domain Adaption方向
7
Pixel SkelNetOn
季军
像素骨架提取分析能对不同目标的二值化掩码进行细化,克服传统方法人工设置参数的不便。
难点:
如何从少量样本中准确提取不同形状的的骨架,存在一定的挑战性。
应用场景:图像细化
8
DeepFashion2 -- Track 2 Clothes Retrieval
季军
由于在产业中的巨大潜力,时尚图像检索成为了活跃的研究课题。
难点:
DeepFashion2数据集包含 49.1 万张图像,13 种流行的服饰类别,拥有最丰富的任务定义和最大数量的标签,由于巨大的变形、遮挡,以及消费者和商业图像之间存在的服装域的差异,如何进行准确的服装搜索是一个大的挑战。
应用场景:电商平台服饰检索功能
9
LIP--Track 3 Image-based Multi-pose Virtual Try-on Challenge
季军
此任务针对基于图像的多姿势虚拟试穿。要求给定输入的人图像,以及期望的服装图像和人体姿态,要求参与者设计算法以将期望的服装转移到人图像并操纵人的姿势。
难点:
1)多姿态虚拟试穿,以往会有相关算法要求固定输入图片的姿势,而此赛道姿势各异,不仅要考虑到服装因素,还需考虑姿态因素。
2)生成算法较难收敛,容易导致loss爆炸。
应用场景:服饰行业的虚拟试穿
10
iMaterialist (Fashion) 2020 at FGVC7
季军
本赛题通过时装界和计算机视觉界的联合,引入一个新的细粒度分割任务。提出的任务将服装属性的分类和服装部件分割统一起来,这是迈向实际应用的重要一步。
难点:
服装视觉分析需要能够从图片中识别服装产品及其相关属性,让设计师了解人们喜欢什么样的产品及服装搭配,提高时尚专业人士的工作效率,进一步可以增强消费者的购物体验。
应用场景:服装辅助设计领域