让机器会说更生动的句子，阿里巴巴论文入选计算机视觉顶级会议

来源：联合早报中文网作者：邵湖心更新时间：2020-09-06 18:36:02阅读：

本篇文章837字，读完约2分钟

中新网7月28日电(cnet):今天，阿里巴巴的nasa Brain IDST(数据科学技术研究所)表示，“面向密集视觉语义嵌入的分层多模态LSTM”被选为2017年国际计算机视觉会议iccv中计算机视觉领域的顶级会议之一。

这也是一个好消息，阿里巴巴本月第三次发表论文，并赢得了最高国际学术会议。

据了解，本文是一项涉及计算机视觉和自然语言处理相结合的学术研究，提出了更详细、更准确的图像描述(或图像的突出区域)，展示了阿里巴巴在视觉和语言研究方向上的不断探索。

本文创新的多模态和层次递归神经网络(hierarchical multimodal lstm)方法可以将整句、句子中的短语、整张图像和图像中的重要区域同时嵌入到语义空中，并自动学习句子-图像和短语-图像区域之间的对应关系，生成语义密集/包含更多的形容词

让机器会说更生动的句子，阿里巴巴论文入选计算机视觉顶级会议

也就是说，在未来，计算机不仅可以说一只鸟站在树枝上，还可以说出更生动、更复杂的句子，比如一只羽翼未丰的鸟站在春天发芽的树枝上，一只乞求食物的鸟，一只站在发芽的树枝上，拍打着翅膀学习飞翔的鸟。

根据本文的作者，这项研究将用于图像字幕任务和其他有意义的应用场景。例如，当应用于自动盲人导航系统时，捕获的图像被转换成文字和声音，从而提示盲人避开障碍物。

此外，它还可以用于跨媒体检索任务。当用户在电子商务搜索引擎中输入一个描述性的文本，比如夏季宽松的波西米亚沙滩裙，系统可以为用户提供最相关的产品。

国际计算机视觉会议被称为IEEE国际计算机视觉会议，与计算机视觉模式识别会议(cvpr)和欧洲计算机视觉会议(eccv)一起被称为计算机视觉方向的前三名会议。

本月早些时候，阿里巴巴发布消息称，三篇论文入选了国际多媒体会议acm mm，四篇论文入选了国际计算机视觉和模式识别会议cvpr。

今年3月，阿里巴巴宣布启动美国宇航局未来20年发展核心技术的计划。在这个计划的号召下，阿里正在人工智能领域全力以赴，不断赶上机器学习和视觉识别领域的世界顶尖学术水平。

标题：让机器会说更生动的句子，阿里巴巴论文入选计算机视觉顶级会议

地址：http://www.6st8.com/zbxw/6397.html

免责声明：联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等，本篇的部分内容来自于网络，不为其真实性负责，只为传播网络信息为目的，非商业用途，如有异议请及时联系btr2018@163.com，联合早报中文网的小编将予以删除。

上一篇：搭载16核32线程处理器外星人最强主机登场！售价非常感人

下一篇：文芳阁为您讲解网站目录提交不通过的原因？

相关推荐

英雄联盟S7八强赛首日上座率至少9成本地人居多

新加坡专家:无症状感染可能成为超级传播者

东南亚最小的旅游国家只相当于世界上的一个中等城市。汉语是官方语言。

关于互联网金融对商业的革命这有三个关键

今日头条将涉足保险中介业务？回应称“暂未听说”

圆桌讨论：当前区块链应用基本只是「旁边系统」，尝试太早也许是坏事 | CC

肖特赢得世界最大光学天文望远镜反射镜基板竞标

新增病例611例，共计33860例。

安徽六安金寨遭遇极端暴雨积水最深超2米民警官兵紧急转移群众

金山毒霸报告：2017年电脑病毒、钓鱼网站连续下降

让机器会说更生动的句子，阿里巴巴论文入选计算机视觉顶级会议

联合早报中文网热文榜

联合早报中文网最新资讯