让机器会说更生动的句子,阿里巴巴论文入选计算机视觉顶级会议
本篇文章837字,读完约2分钟
中新网7月28日电(cnet):今天,阿里巴巴的nasa Brain IDST(数据科学技术研究所)表示,“面向密集视觉语义嵌入的分层多模态LSTM”被选为2017年国际计算机视觉会议iccv中计算机视觉领域的顶级会议之一。
这也是一个好消息,阿里巴巴本月第三次发表论文,并赢得了最高国际学术会议。
据了解,本文是一项涉及计算机视觉和自然语言处理相结合的学术研究,提出了更详细、更准确的图像描述(或图像的突出区域),展示了阿里巴巴在视觉和语言研究方向上的不断探索。
本文创新的多模态和层次递归神经网络(hierarchical multimodal lstm)方法可以将整句、句子中的短语、整张图像和图像中的重要区域同时嵌入到语义空中,并自动学习句子-图像和短语-图像区域之间的对应关系,生成语义密集/包含更多的形容词
也就是说,在未来,计算机不仅可以说一只鸟站在树枝上,还可以说出更生动、更复杂的句子,比如一只羽翼未丰的鸟站在春天发芽的树枝上,一只乞求食物的鸟,一只站在发芽的树枝上,拍打着翅膀学习飞翔的鸟。
根据本文的作者,这项研究将用于图像字幕任务和其他有意义的应用场景。例如,当应用于自动盲人导航系统时,捕获的图像被转换成文字和声音,从而提示盲人避开障碍物。
此外,它还可以用于跨媒体检索任务。当用户在电子商务搜索引擎中输入一个描述性的文本,比如夏季宽松的波西米亚沙滩裙,系统可以为用户提供最相关的产品。
国际计算机视觉会议被称为IEEE国际计算机视觉会议,与计算机视觉模式识别会议(cvpr)和欧洲计算机视觉会议(eccv)一起被称为计算机视觉方向的前三名会议。
本月早些时候,阿里巴巴发布消息称,三篇论文入选了国际多媒体会议acm mm,四篇论文入选了国际计算机视觉和模式识别会议cvpr。
今年3月,阿里巴巴宣布启动美国宇航局未来20年发展核心技术的计划。在这个计划的号召下,阿里正在人工智能领域全力以赴,不断赶上机器学习和视觉识别领域的世界顶尖学术水平。
标题:让机器会说更生动的句子,阿里巴巴论文入选计算机视觉顶级会议
地址:http://www.6st8.com/zbxw/6397.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。