CVPR专访阿里iDST华先胜:电商搜索与城市大脑,本质上都是视觉系统问题|CVP
本篇文章2505字,读完约6分钟
雷科技评论:在2017年的cvpr中,雷科技评论看到很多工业人士来到现场。这次计算机视觉领域的学术会议吸引了许多来自企业研究机构的企业家。他们如何看待工业和学术的融合?你如何理解自己的企业在视野中的地位和创新?为此,科技评论的雷与华宪生,阿里idst视觉计算集团的负责人,在cvpr进行了交流。
华宪生,北京大学应用数学博士,ieee院士,2015年acm杰出科学家,麻省理工学院35岁以下杰出青年创新人物,曾任ACM多媒体及其他会议程序委员会主席,是视觉识别与搜索领域的国际权威学者。2016年7月,他加入了阿里人工智能研究所的idst科学家团队,并领导了视觉计算团队的研发。
华宪生认为,cvpr大会整体上是非常成功的。计算机视觉领域的大多数研究倾向于实用性,并且与行业有着密切的联系。企业实际上可以通过参加学术会议了解学术研究的整体发展。就像siggraph一样,当行业的参与度很高时,这个会议就变得越来越繁荣。“此类会议成功的一个重要标准是它是否能影响行业。如果只是学术界本身在进步,这个领域可能会变得越来越封闭。ゥ
雷锋的《人工智能科技评论》还发现,无论是赞助商越来越多的aaai 2017,还是新兴应用研究的acm计算经济学会议,与行业的融合和交流越来越频繁。特别是在计算机视觉领域,学术界和工业界的界限已经变得模糊,许多文章可能是大学和企业研究所合作的主题。
第一作者是西南交通大学博士生程志起,以cvpr的论文《Video 2 Shop:将视频中的服装与网上购物图像精确匹配》为例。在阿里实习期间,与视觉计算组组长华宪生、高级算法专家刘洋及其导师西南交通大学吴晓教授进行了合作。本文提出了一种深度神经网络asymnet,通过学习服装序列的特征并对其进行编码,实现对服装的检测和跟踪。用户在观看视频时可以很容易地买到和明星一样的衣服。
这项研究自然集中在阿里的老业务——电子商务,而华宪生的最初工作一直集中在产品系统上,如“派利淘”。目前,华宪生作为阿里idst视觉计算集团的负责人,还负责城市大脑项目,该项目也有视觉需求。
在本次研讨会上,华宪生作为目标再识别和多目标多摄像机跟踪的特邀演讲者之一,发表了题为《大规模目标再识别的实践》的演讲。
华宪生告诉雷锋。com ai Technology Review认为这个话题与电子商务的商品搜索和城市人才工程密切相关,因此他对阿里的整个团队和目标再识别业务做了全面的介绍。搜索范围相对较广,您只需要找到满足要求的内容,甚至是相似的内容。例如,如果你搜索图片,可能会有许多类似的结果;重新识别需要精确匹配。例如,如果在整个城市发现一辆汽车,目标非常明确(只有一辆)。然而,商品搜索类似于城市大脑项目中的几个关键步骤,城市大脑项目本质上是一个视觉搜索系统。“这与帕特·利托的系统非常相似,只是关键点在于功能。对于电子商务,你所寻找的是相同的产品或相似的产品;至于城市大脑,我们主要在寻找三种物体:汽车、人和骑自行车的人。ゥ
阿里从淘宝起家,后来加入支付宝和菜鸟业务,但实际上并没有逃脱电子商务的本质。目前,随着城市大脑项目团队的实施,许多人已经看到了阿里的另一个雄心:云计算。“阿里城市大脑项目的关键点在于,他希望通过大计算探索大数据背后的价值。华宪生告诉雷锋。《com ai技术评论》认为,无论是交通还是安全,城市都是一个非常大的数据载体,或者说是一个聚合体。各种类型的数据,包括视频信号、全球定位系统信号、微波信号等。,但它们的价值远未得到充分利用。”阿里城大脑中的一个关键任务是解决视觉信号问题,这实际上是对城市的一种感知。ゥ
当城市里没有摄像头时,可以说一开始是处于“没有无知感”的状态;后来,城市里有了照相机,但是缺乏对这些数据的分析和研究。这种状态被称为“感而不知”;然而,以Hikvision和大华为代表的公司在摄像头端算法方面已经做出了努力,并逐渐向“感觉和知道一点点”发展;如今,由阿里等企业牵头的城市人才工程,希望实现“凭感觉认识一切”。
华宪生用这三个字概括了城市大脑的主要特征:“全方位知识、全球知识和全日制知识。”综合知识意味着除了汽车和车牌,我们还可以了解城市中的一些情况,包括人和非机动车;全局知识意味着整个系统具有强大的计算能力,能够从多个方面宏观地了解城市的情况;专职知识是实时掌握城市的交通、安全等方面。
此前,华宪生在接受雷锋采访时也提到过。他没有认识到企业只注重算法的商业模式。“城市人才工程的推广得益于强大的计算能力和人工智能技术的发展。阿里所做的实际上是一个平台和一个生态。欢迎所有企业加入,这样数据的价值才能得到更好的体现。ゥ
在cvpr 2017年的交流中,华宪生还了解到,与学术界相比,业界能够获得的数据量存在质的差距。“我昨天看了一张海报,里面用了大约20个摄像头和数百人的数据,可以说是一个大规模的研究。然而,阿里在算法研发中的自测数据集基本上是几千个摄像头和几万人,这在学术界可能是不可想象的。然而,华宪生也指出了行业的网上压力和快速发展的特点,这也导致许多研究无法做得更深入,需要学术自由和远见来弥补。
华宪生也告诉了雷锋。(公开号码:雷锋。《人工智能技术评论》认为,他在参加会议时感到一个明显的需求,那就是提高深层学习影响的计算效率。无论是嵌入式设备的需求还是云计算的大规模场景,如何降低计算成本已经成为一个热点。“以阿里idst的城市大脑项目为例,需要处理的数据量非常大,从成本的角度对效率提出了更高的要求。阿里idst也在做相关的优化工作,希望能从这次cvpr中得到一些提高效率的研究启示。
另外,阿里这次来cvpr,他也有很大的招聘需求。正如雷锋的《人工智能技术评论》在之前的报道中提到的,赞助商的数量达到了127家,赞助费用总额超过了85.9万美元。和其他工业展商一样,阿里的目标是一方面介绍自己的研究成果,另一方面吸引优秀的教师和学生加入阿里idst。我们也期待阿里智能科技在未来带给我们更多的城市大脑应用,充分体现数据的价值。
雷锋原创文章。严禁擅自转载。详情请参考转载说明。
标题:CVPR专访阿里iDST华先胜:电商搜索与城市大脑,本质上都是视觉系统问题|CVP
地址:http://www.6st8.com/zbxw/6378.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。