新加坡联合早报中文网即时报道亚洲和国际的评论、商业、体育、生活、科技与多媒体新闻,从世界各个维度报道世界经济新闻,时政新闻,突发新闻等。

当前位置:主页 > 新闻 > 腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

来源:联合早报中文网作者:邵湖心更新时间:2020-09-05 00:24:03阅读:

本篇文章3771字,读完约9分钟

Cvpr是近十年来在计算机视觉领域最具影响力和最全面的顶级学术会议,由世界上最大的非营利专业技术协会ieee(电气和电子工程师协会)主办。2017年,谷歌学者根据论文被引率排名,cvpr在计算机视觉领域排名第一。根据雷锋的人工智能科技评论。(公开号码:雷锋。cvpr今年共审查了2620篇文章,最终收录了783篇文章,接受率为29%,口头报告接受率仅为2.65%。

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

腾讯ai实验室计算机视觉总监刘伟博士说:“cvpr的口头报告通常是当年最前沿的研究课题,在学术界和工业界都有很大的影响。”每年,世界上最著名的大学和科技公司如斯坦福大学和谷歌都聚集在一起。

今年,腾讯人工智能实验室为cvpr选择了6篇论文,下面雷锋的人工智能技术评论将逐一介绍这些论文的摘要。

论文1:“视频的实时神经风格转换”最近的研究工作表明了使用前馈卷积神经网络实现图像快速风格转换的可行性。基于此,清华大学和腾讯人工智能实验室的研究在实践上更进一步。它们利用前馈网络变换视频的风格,同时保持风格化视频帧图像的时间一致性。在《实时视频风格变换的实现》一文中,作者介绍了他们使用的前馈网络是通过强制连续帧的输出保持原始风格并具有良好的连续性而获得的。更具体地说,作者提出了一种混合损失理论,它充分利用输入图像帧的图像信息、图像的风格信息和连续帧的时间信息来处理图像。为了计算训练阶段的时间损失,作者提出了一种新的两框架合作训练机制。与原有的直接将已有图片风格刚性地转移到视频的方法相比,该方法消除了原有方法对耗时优化的依赖,能够保持图片时间的连续性,消除图片闪烁的问题,保证了视频风格迁移的实时性、高质量、高效率和完整性,从而达到更好的视觉欣赏效果。

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

论文链接:视频的实时神经风格转换

论文2:“基于病理图像的预测方法-wsisa”-wsisa:从整张载玻片组织病理学图像进行存活预测。美国德克萨斯大学阿灵顿分校和腾讯人工智能实验室提出了一种基于病理图片的患者生存预测方法wsisa,有效支持大数据时代的精确个性化医学。众所周知,基于图像的精确医院技术已经进入人们的视野很长一段时间了,通过这项技术可以更好的治疗癌症患者。然而,wsi(全载玻片组织病理学图像)的千兆像素分辨率否定了传统生存模型在该领域的可行性。该模型通常需要手动标记,并在感兴趣区域(roi)中进行区分。因此,在千兆像素图像中,计算机不能通过区分块直接学习。此外,由于肿瘤的异质性,患者的生活状况不能完全用少量的瓦片来表示。同时,用于生存预测训练的患者样本通常是不够的。所有这些都给生存预测带来困难。在本文中,作者提出了一个有效的分析框架来克服上述困难,即wsisa,一种基于病理图像的大规模、无标记和有效的患者生存预测方法。首先,通过自适应采样方法提取每个传感器网络上的斑块,然后对斑块进行分组和聚类。作者建议基于深度卷积存活(deepconvsurv)的预测结果来训练累积模型,以在患者水平上记忆预测。与现有的基于图像的生存模型相比,该模型能够有效地提取和利用wsi上所有可区分的小瓦片进行预测。在目前的研究领域,这种方法还没有被提出。通过本文的方法,作者用三个数据集对胶质瘤和非小细胞肺癌的生存预测进行了研究,研究结果证明wsisa架构可以大大提高预测精度。

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

论文链接:wsisa:根据整张载玻片的组织病理学图像进行存活预测

论文3:“弱监督对象定位的深度自学习”(Deep Self-Learning for wear Supervised Object Location)——新加坡国立大学和腾讯ai Lab联合发表的论文《弱监督对象定位的深度自学习》(Deep Self-Learning for wear Supervised Object Location),用于研究所“监督对象定位的深度自学习”(Deep Self-Learning of Supervised Object Location),这是一种全新的深度自学习方法,它依靠检测器自身的细分来提高训练样本的质量,不断提高检测器的性能,解决了监督对象检测中训练样本质量低的瓶颈。大多数现有的弱监督定位(wsl)方法通过在图像级监督学习识别的特征块来学习检测器。然而,这些特征不包含空之间的位置的相关信息,并且由它们提供的样本数据的质量对于检测器学习来说相对较差。为了克服这一问题,本文提出了一种深度自学习方法,即检测器学习获取样本对象的可靠特征,并在此基础上重新训练自身。因此,随着检测器本身的检测能力和所提供的位置信息的质量的提高,可以进一步提高更好质量的数据。为了实现这种自学习,本文提出了一种种子样本采集方法,通过图像到对象的传输和密集子图采集来初始化检测器,从而获得可靠的正样本。作者进一步提供了一个在线支持样本收集计划,以动态选择最可信的阳性样本,并提供了一个成熟的训练方法来训练检测器。为了防止检测器在训练过程中陷入过度适应的困境,作者还介绍了一种引导自学习过程的方法。基于pascal 2007和2012的实验结果证实了该方法与现有方法相比具有显著的效率优势。

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

论文链接:用于弱监督对象定位的深度自学

论文4:“多样性图像标注”——沙特国王阿卜多科技大学和腾讯人工智能实验室联合发表的论文“多样性图像标注”提出了一种新的图像自动标注方法,即使用少量的多样性标签来表达尽可能多的图像信息,充分利用标签之间的语义关系,使自动标注结果更接近人类标注结果。dia的目标是使用有限数量的标签来描述图像,因此所使用的标签需要覆盖尽可能多的有用信息。与传统的图像标注任务相比,dia要求标注不仅要表示图像,还要相互关联,从而减少冗余。为了实现这个目标,作者将dia设置为一个子集选择问题,并基于条件dpp(决定性点过程)模型(既有代表性又有多样性)。通过进一步探索候选标签中的语义层次和同义词,我们可以选择合适的语义连接路径。也就是说,在标记选择中,当标记相同的图像时,那些相似的语义被丢弃以避免同时出现。这个限制嵌入在条件dpp模型算法中。在传统的标注方法中,标签选择只注重整个图像的代表性(包括准确性、召回率和f1评分),而忽略了标签的多样性。因此,本文提出的新方法是对传统方法的一大改进。通过对另一个衍生主题的研究,可以证实本文提出的方法更接近于人类标注模型。基于两个基准数据集的实验结果证明,该方法对不同图像的标注效果更令人满意。

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

纸张链接:多样的图像标注

论文5:利用对称性和/或曼哈顿特性进行单幅和多幅图像的3d对象结构设计或利用曼哈顿特性从单幅和多幅图像估计3d对象结构是由腾讯人工智能实验室、约翰霍普金斯大学和洛杉矶加利福尼亚大学联合发表的论文,该论文讨论了利用对称性和/或曼哈顿特性进行单幅和多幅图像的3D对象结构设计的方法。许多人工设计和制造的物体具有内在的对称性和曼哈顿结构特征。通过假设一个正交投影模型,当一幅或多幅图像来自一类物体,如不同的汽车,本文提出了一种利用对称性和曼哈顿特性估计三维空模型的方法。通过分析,单个图像中的曼哈顿特征足以恢复相应的摄像机投影,同时,对称性被用来恢复其三维结构。然而,由于其遮挡性,很难从单个图像中提取曼哈顿特征。延伸到多个图像的状态,可以使用对象的对称性,并且不再需要曼哈顿轴。因此,通过这一思想,作者提出了一种新的刚体结构,它利用运动方法、物体的对称性和多个相同分类的图像作为输入,从而设计出三维物体的结构。在pascal3d+数据集上的实验证明,与一般方法相比,该方法具有明显的优势。

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

论文链接:利用对称性和/或曼哈顿属性从单个和多个图像中估计三维对象结构

论文6:“sca-cnn:卷积神经网络中的注意模型”-SCA-CNN:卷积神经网络中用于图像捕获的空间和信道方向的注意,论文SCA-CNN:卷积神经网络中的注意模型,由山东大学、腾讯ai实验室和新加坡国立大学联合发表,针对图像描述生成任务,基于卷积网络的多层特征动态生成文本描述,然后提出空和信道感知的注意模型。目前,视觉注意已经成功应用于结构预测任务,如视觉字幕和问答功能。现有的视觉注意模型通常是基于空的,也就是说,编码输入图像的卷积神经网络(cnn)的最后转换层特征映射是通过对空.之间的视觉注意概率进行建模来重置的然而,人们认为这种空之间的注意不一定符合注意机制,即在固定时间内结合上下文进行动态特征提取,因为卷积神经网络的特征是自然空的、信道感知的和多层的。在这篇文章中,作者介绍了一种新的卷积神经网络,称为sca-cnn,它将空和信道感知注意力集成到卷积神经网络中。当实现向图像添加字幕的任务时,sca-cnn在多层特征映射中动态地调整句子生成的上下文,从而编译视觉注意力的两个特征:在哪里(即,在堆叠层中空之间的位置)和什么(即,吸引注意力的频道)。在本文中,sca-cnn架构由三个基准图像字幕数据集进行评估,包括flickr8k、flickr30和mscoco。通过评价,证明了基于sca-cnn架构的图像字幕标注相对于现有方法具有明显的优势。

腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

论文链接:美国有线电视新闻网:图像采集自愿网络中的空间和通道方向注意

雷锋。com编译

雷锋原创文章。严禁擅自转载。详情请参考转载说明。

标题:腾讯 AI Lab入选 CVPR 的六篇论文逐一看 | CVPR 2017

地址:http://www.6st8.com/zbxw/5891.html

免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。

返回顶部