新加坡联合早报中文网即时报道亚洲和国际的评论、商业、体育、生活、科技与多媒体新闻,从世界各个维度报道世界经济新闻,时政新闻,突发新闻等。

当前位置:主页 > 新闻 > ImageNet挑战赛最后一届,中国团队又血拼了好多第一

ImageNet挑战赛最后一届,中国团队又血拼了好多第一

来源:联合早报中文网作者:邵湖心更新时间:2020-09-03 12:11:52阅读:

本篇文章1484字,读完约4分钟

雷锋。(公开号码:雷锋。自2010年成立以来,计算机视觉领域的权威评估机构imagenet就一直备受关注。2016年,在本次比赛的图像目标检测任务中,国内团队取得了很大的成绩,在本次任务中名列前五。在今年的ilsvrc 2017中,国内许多高校和企业也在各种比赛中取得了很好的成绩。

ImageNet挑战赛最后一届,中国团队又血拼了好多第一

雷锋。com了解到,今年的挑战分为三个部分,包括视频中的目标检测(识别)、目标定位和目标物体检测。昨天,大赛公布了算法排名结果,奇虎和南京信息科技大学团队分别在目标定位和目标检测方面取得了最好的成绩。国内自主驾驶公司momenta R&D团队的孙刚、胡洁与牛津大学的沈力合作提出se架构,以2.3%的识别错误率获得物体识别冠军。

ImageNet挑战赛最后一届,中国团队又血拼了好多第一

奇虎360团队

奇虎360与新加坡国立大学合作组建了新加坡国立大学-奇虎dpns (det)团队。

奇虎360成员:建东、阎水城。

新加坡国立大学成员:云、、张、、、陈、冯嘉时。

在基于快速r-cnn的目标检测任务中,他们采用了一种新的双路径网络(dpn/双路径网络)。dpn中的特征共享机制和探索新特征的灵活性已被证明在目标检测中是有效的。研究人员还采用了几种dpn模型,即dpn-92、dpn-107、dpn-131等。,作为快速r-cnn框架中的主干特征学习器和头部分类器。它们最多只使用131层网络,因为它易于在最常用的图形处理器中进行训练和调整,并且具有良好的性能。对于区域提案生成,通过使用低层细粒度特征来实现有效的提案召回。此外,通过在分割检测框架中使用扩展卷积,它们结合了有用的上下文信息。在测试中,他们设计了一个类别加权策略来探索不同类型的专家模型,并根据多任务推理对不同的专家应用权重。此外,在图像分类任务中,它们使用预先训练好的模型提取整个上下文信息,这可以为推理整个输入图像中的检测结果提供有用的线索。

ImageNet挑战赛最后一届,中国团队又血拼了好多第一

南京信息科技大学团队

南京信息科技大学与帝国理工学院合作组建了一个bdat团队,该团队利用第一轮提供的训练数据探测物体,前三名均由bdat团队获得。

南京信息科技大学成员:回帅、俞振波、刘青山、袁晓桐、张凯华、朱宜生、刘光灿、景洋

帝国理工学院成员:周玉祥、邓健康

该小组称,他们在锁定任务中使用了适应性注意机制和深层关节卷积模型。尺度、背景、采样和深度联合卷积网络已被有效地用于检测任务。同时,他们的得分排名也使用了对象概率估计。

自动驾驶技术momenta团队

国内自主驾驶技术公司穆明塔R&D团队的孙刚、胡洁与牛津大学的沈力合作组建了wmw团队。

wmw团队提出了一种新的机制,称为挤压和激励(se),以大大提高模型的准确性。它通过引入全局图像的信息来自动重新分配卷积特征的权重,增强对分类有用的特征,并抑制无效或没有什么益处的特征。只需少量的计算和参数,大多数现有有线电视网络的性能就可以大大提高。团队成员之一的孙刚说:“在这个框架下,与resnet50具有相同计算量的网络可以达到resnet101的性能。

ImageNet挑战赛最后一届,中国团队又血拼了好多第一

下一步是评估所有参赛队伍的目标检测(识别)、目标定位和视频目标检测技术。

目标检测(识别)答:使用提供的训练数据来执行目标检测性能

首先,根据检测到的目标数量

第二,根据平均检测精度进行排序

从培训数据来看,南京信息科技大学的bdat在这两项排名中都是第一的。因此,bdat在目标检测方面具有优势。

使用额外的训练数据来检测目标(图1列出了检测到的目标数量,图2列出了检测的平均准确度)

图一

图二

总结:bdat团队在基于额外训练数据的目标检测方面仍然是前两名。第三名是奇虎360团队,他们在目标探测任务中也表现出色。

目标定位A:使用提供的训练数据进行分类+定位:按定位误差率排序,误差率较低者优先

按分类错误率排序(较低的错误率优先)

奇虎360定位误差率排名第一,这意味着定位最准确,误差率只有0.062266。这是由于360和新加坡国立大学提出了一种新的双路径网络(dpn/双路径网络)。第二名和第三名来自三巨头苏申(公安部三名)。

从分类错误率的排名来看,穆明塔自主驾驶技术团队的分类错误率最低。他们的wmw团队提出了一种新的机制,称为挤压&兴奋(简称se),这大大提高了模型的准确性。

在下一个使用额外数据进行分类和定位的任务中,奇虎360团队在这两个排名中的错误率最低,其次是南京信息科技大学的bdat。

视频目标检测a:使用提供的训练数据进行视频目标检测(根据检测到的目标类型和平均精度进行排序)

在这次测试中,只有奇虎360团队表现相对较好,而南京信息科技大学团队和穆明塔团队没有进入前五名,第一名由帝国理工学院和悉尼大学组成的ic&usyd团队获得。奇虎360团队在视频目标检测任务中表现出色,因为他们的模型主要基于更快的r-cnn,以双路网络为骨干,采用三种dpn模型(即dpn-96、dpn-107和dpn-131)和更快的r-cnn框架下的顶级分类器作为特征学习器。

ImageNet挑战赛最后一届,中国团队又血拼了好多第一

使用额外的训练数据来检测视频目标

使用额外的训练数据进行视频目标检测和使用提供的训练数据进行视频目标检测,结果是相似的,帝国理工学院和悉尼大学的ic&usyd仍然取得了最好的结果,其次是奇虎360团队。

雷锋总结。ilsvrc 2017是imagenet竞争的最后一次。在上一次比赛中,中国代表队仍然保持着自己的水平,没有留下遗憾。webvision挑战赛将在未来取代ilsvrc。虽然webvision中的数据比手动标记的imagenet有更多的噪音,但它的数据更多地是从网络中获得的,因此成本要低得多。另外,从2016年开始,ilsvrc的图像识别错误率达到了2.9%左右,远远超过了人类的5.1%。这种竞争已经完成了它的历史使命,失去了它的意义。未来,计算机视觉的重点将是图像理解。最后,让我们记住中国队在这次比赛中取得的辉煌成就。同时,我也希望在新的舞台上保持同样的风格!

ImageNet挑战赛最后一届,中国团队又血拼了好多第一

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

标题:ImageNet挑战赛最后一届,中国团队又血拼了好多第一

地址:http://www.6st8.com/zbxw/5426.html

免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。

返回顶部