AI芯片独角兽寒武纪首场发布会 目标3年覆盖10亿终端
本篇文章7079字,读完约18分钟
今天下午,国内知名的人工智能独角兽公司——寒武纪科技在北京召开了首届“智能时代的领导者”会议,发布了新一代智能处理器ip产品,并阐述了公司未来芯片产品研发路线图,包括华为、海力士、阿里巴巴集团、联想集团、iFlytek、中科曙光、arm、视觉科技、地平线等重商合作伙伴。
“寒武纪公司是中国科学院计算技术研究所处理器与人工智能交叉领域先进布局的结晶。”中国科学院计算技术研究所所长孙宁辉出席了会议。在新闻发布会上,寒武系公司创始人兼首席执行官陈发表了题为《走向人工智能的寒武系》的主旨演讲,回顾了寒武系建立前后的历史,揭示了下一代人工智能芯片和寒武系软件平台的细节和相关数据。
寒武系公司创始人兼首席执行官陈
在新闻发布会上,陈还重点介绍了终端应用和面向云的智能解决方案。在终端部分,他展示了三款新的智能处理器IPs:第一款,寒武纪1h8用于低功耗场景视觉应用,寒武纪1h16具有更广泛的通用性和更高的性能,寒武纪1m用于智能驾驶。
寒武纪1h16具有更广泛的通用性和更高的性能
图1低功耗场景视觉应用的寒武纪1h8
图1寒武纪1m智能驾驶
在云中,高性能机器学习处理器芯片“寒武纪mlu100”和“寒武纪mlu200”也已经出版。这两个芯片主要针对服务器的智能处理需求,分别用于推理和训练。与“神经网络处理器”(npu)的通用名称不同,这款全新的服务器芯片产品以“机器学习处理器”(mlu)命名。未来的寒武纪产品也将完全支持更多样化的机器学习应用,而不仅仅是普通的深度学习。
高性能机器学习处理器芯片“寒武纪mlu100”和“寒武纪mlu200”
在新闻发布会上,寒武纪还发布了面向终端和云的处理器ip,针对训练和推理等不同应用场景进行了优化,并为开发者设计了一套人工智能软件平台“cambricon neuware”。该平台由三部分组成:开发、调试和调优,创建一个集成终端和云的高质量开发环境。开发平台建立在寒武纪发明的人工智能的特殊指令基础上。有了这个平台,开发人员可以非常快速地迁移跨平台应用,同时为不同云和终端平台的应用开发打下坚实的基础。
人工智能软件平台“cambricon neuware”
陈还描述了寒武纪智能芯片的未来路线图。寒武纪将力争在三年内占据中国高性能智能芯片市场的30%,并将寒武纪终端智能处理器与全球10亿多台智能终端设备集成。如果这两个目标得以实现,寒武纪将初步支持中国领先的国际智能产业生态。
陈表示,未来人工智能方法将在视觉、语音、自然语言、数据分析、经济金融等各种应用中显示其才能,这就要求未来的超级计算机数据中心、智能手机和嵌入式设备进一步智能化,而寒武纪机器学习处理器有望成为这些设备的标准。
“寒武纪是生物物种爆炸的时代。如今,这也是一个智能技术爆炸的时代,智能技术衍生出不同的深度学习算法,并支持不同的技术和应用。”寒武纪首席执行官陈如是说。
过去十年人工智能复兴的引擎是摩尔定律。芯片规模和效率的扩大推动了人工智能深度学习的进程。然而,随着摩尔定律的放缓和可持续发展的动力不足,有必要找到另一种更有效的方法。未来,人工智能需要支持从终端到云的大规模人工智能应用,而一个特殊的深度学习处理器是必不可少的,因此有必要寻找一个特殊的处理器解决方案,这也是寒武纪发展的初衷。
在今天的新闻发布会上,寒武纪强调了与arm架构相匹配的ai生态,并重点介绍了基于寒武纪ai方案的mate 10在产品性能和应用方面的优势。同时,它还透露了10月底在中科曙光峰会上发布的phaneron人工智能服务器的细节。该服务器采用基于寒武纪架构的ai芯片,主要面向推理业务。可以说这是服务器趋势中的一个特立独行者,大多数行业都专注于学习。有了这个推理服务器,可以提高终端ai应用的推理反应速度,这对解决云服务提供商的在线服务质量问题有很大帮助。
图片Phaneron-世界上第一个基于寒武纪芯片的人工智能推理专用服务器
此外,为了给行业提供一个合理的方法来评估人工智能计算硬件的性能,寒武纪还与行业伙伴合作开发了一个人工智能计算性能评估软件。该软件就像一只Ann Bunny,不仅可以分析人工智能硬件与执行环境的兼容性,还可以合理地评估学习或推理的性能,为行业选择合适的方案提供参考。
寒武纪发展的起源
寒武纪的前身是中国科学院计算技术研究所的一个研究小组,由陈、陈领导。
图陈(右)和陈(左)
早在2008年,研究小组就开始研究神经网络算法和芯片设计。寒武纪第一代计划于2012年启动。在65纳米工艺下,功耗为0.485瓦,面积为3.02毫米。平均性能是主流cpu内核的100倍,但面积和功耗只有1/10,这相当惊人。
然而,寒武纪有一个非常直截了当的命名代码,叫做点脑,中文发音为“计算机”。起初,这种命名不是中国人的想法,而是研究小组中法国人的意见。当时的神经网络芯片不是用腐烂的街道来命名的,而是用中文来命名的。外国人觉得它很高很有趣。
在diannao的基础上,中国科学院开发了扩展规范,如dadiannao(第二代、大计算机、增强功能)、pudiannao(第三代、通用计算机、通用机器学习芯片)、shidiannao(视频计算机、图像识别处理器)、diannaoyu(计算机语言、神经网络指令集),专门用于不同的应用或目的。还可以看出,研究小组坚持命名规则。
寒武纪是一个基于整体软硬件优化的平台,具有成熟的软硬件接口设计,优秀的生态支持能力,并且由于自身的知识产权,它不怕受制于他人。
寒武纪新云和终端人工智能解决方案,突破更深层次的机器学习应用
在新闻发布会上,陈还重点介绍了终端应用和面向云的智能解决方案。在终端部分,他展示了三个新的智能处理器IPs:第一,寒武纪1h8用于低功耗场景视觉计算,包括计算器视觉、照片处理和安全监控应用;寒武纪1h16具有更广泛的通用性、更高的性能和更低的能耗;寒武纪1m用于智能驾驶。
在云中,高性能机器学习处理器芯片“寒武纪mlu100”和“寒武纪mlu200”也已经出版。这两个芯片主要针对服务器的智能处理需求,用于推理和训练。目前,中科曙光已经使用试制的芯片来搭建显像管服务器。在推理应用领域,效率达到了120次,相当惊人。
与“神经网络处理器”(npu)的通用名称不同,这款全新的服务器芯片产品以“机器学习处理器”(mlu)命名。未来的寒武纪产品也将完全支持更多样化的机器学习应用,而不仅仅是普通的深度学习。
与arm和华为合作,打造集成高级人工智能计算能力的麒麟970
当华为发布业界首款手机人工智能处理芯片麒麟970时,寒武纪发出了一封贺信。内容提到,由坎布里克技术公司开发的具有自主知识产权的寒武纪on-1a处理器是世界上第一款商用深度学习处理器产品,其性能是四核处理器的25倍以上,在人工智能应用中的能效是其50倍以上。
此次,麒麟970芯片集成了以寒武纪1a处理器为核心的人工智能处理单元(即新闻发布会上于成东总经理所描述的npu),实现了手机上的本地、实时、高效的智能处理。
麒麟970作为世界上第一款集成人工智能专用处理器的手机芯片,将为全世界广大手机用户带来智能时代的颠覆性用户体验,引领全球智能手机发展的新趋势。"
据dt Jun分析,华为在麒麟970中整合npu有两个目的:一是效率问题:云有很强的性能和快速的学习能力,但是学习的模型是一个通用模型,很难针对利基做出定制调整,满足消费者的使用情况。如果本地硬件有很强的人工智能学习能力,就不需要把数据扔到云中,可以直接在本地处理,这样效率更高。
另一个是隐私安全。在过去,机器学习必须收集数据并把它们扔到云中。如果这些数据与个人生活的私人领域密切相关,将它们抛入云端将导致隐私纠纷。如果手机的本地端具有一定的机器学习能力,私有领域的数据收集和学习就不需要放在云上,而是可以放在本地端。就隐私保护而言,它比云计算好得多。
npu的性能可以说是业内一流的。就机器学习中常见的图像学习而言,传统的高端桌面处理器一分钟只能识别97幅图像,但如果通过npu,每分钟可以处理的图像数量可高达2000幅,相当于每秒30幅左右,达到了实时处理的效果。无论是增强现实所要求的场景识别,还是人和物体的识别,几乎所有的人和物体都能毫不延迟地实现你所看到的。
当然,在过去,当计算架构必须具有强大的性能时,它通常需要高功耗。然而,npu的满负荷功耗仅为cpu的一半左右,就计算效率/功耗而言,约为0.8t lops/w。与英伟达推出的v100方案相比,v100约为0.4 TFLOPS/W..npu的能耗效率甚至大大超过了业界顶尖的人工智能计算硬件,展示了其出色的架构设计。
业界首款基于推理并结合快速应用部署的云服务器phaneron
除了终端产品的布局外,寒武系还与中科曙光合作,利用寒武系架构构建了一个优化推理应用的phaneron服务器。与专注于学习的普通云人工智能服务器不同,phaneron为服务提供商提供低延迟的实时人工智能服务,旨在推理超低延迟的计算服务,包括安全监控、网络、广播媒体娱乐、制造和自动化、金融、医疗保健、物流和运输、零售和新兴领域的相关产品应用。
此外,phaneron在硬件神经元虚拟化、寒武纪深度学习指令集、caffe、mxnet、tensorflow等方面拥有全面的支持。,能够更加灵活地满足各种人工智能计算环境的需求,其性能在行业中是一流的。
另一方面,寒武系还协助中科曙光建立了一个快速开发和应用的智能平台——“索思赛”。索思赛专注于异构集成、易用性、灵活性和快速部署等。通过ai统一异构编程模型、ai计算能力动态实时分配算法、ai基本性能函数等。,它可以快速响应并释放人工智能所需的计算能力。从战略上讲,苏富比将作为一个平台来支持其通用人工智能服务和行业人工智能服务。
关注一般计算能力并支持主要标准
尽管寒武纪是中国自己的人工智能计算芯片,但就支持国际通用人工智能计算标准而言,它与中国半导体制造商过去的自产自用理念相悖,而是积极支持,意在将寒武纪推向世界舞台,使中国企业成为引领世界人工智能产业发展的重要领导者之一。
尽管目前寒武纪有物理芯片产品,但知识产权许可也是亮点之一。如果我们想扩大市场,进而主宰行业未来的发展方向,这绝对是赢得国际客户的必要条件之一。
根据寒武纪目前的标准支持范围,主流张量流、caffe和mxnet在终端和云产品布局中都可用。当然,寒武纪也提出了自己的深度学习指令集和开发环境,这在理论上更有利于发掘寒武纪的计算潜力。
支持国际计算标准的重要性不言而喻。例如,拥有最长人工智能计算经验的英伟达,已经推出了自己的cuda计算环境,但不敢忽视其对国际标准的支持。毕竟,对于计算解决方案,开发环境的友好性和支持范围决定了未来的市场增长潜力。
至于tensorflow,每个人都会下意识地认为谷歌为tensorflow优化提出的tpu计算架构肯定会优于第三方芯片,但关键是tpu采用的脉动阵列机架构是一种传统架构,今天很多深度学习的DSp都采用了这种架构。寒武纪对此也相当熟悉,他们已经在isca2015与olivier temam教授和paolo ienne教授共同发表的学术论文中讨论了这个建筑。
陈说,“谷歌的采用的是老式的脉冲阵列机架构,这种架构大多用于通用dsp,但我们选择了寒武纪的通用架构。虽然道路不同,但我仍然期待在同一个行业的舞台上竞争。”
此外,dt Jun还认为,谷歌引入tpu并不是真的想与业界竞争。毕竟,tpu目前的架构仍然非常庞大,很难打入像麒麟970这样更加多样化的手机应用芯片,谷歌也不打算实际销售基于这种架构的解决方案。相反,它更像是一个演示,向行业展示计算应用张量流的强大,相关的核心结构和算法设计也是由论文发表的,所以英伟达甚至制作了与tpu非常相似的张量核心结构。
因此,支持tensorflow将有助于寒武纪拓展相关市场,甚至成为寒武纪和英伟达未来相互竞争的武器。
主要竞争对手是知识产权授权厂商和人工智能计算硬件供应商,如英伟达和英特尔
目前,除了销售物理芯片产品,寒武纪目前的收入方法还包括向集成电路设计者提供嵌入式ip块设计。因此,就市场竞争布局而言,寒武纪实际上比市场上的竞争对手更全面。
为什么寒武纪应该考虑知识产权许可和物理芯片销售?这有两个主要原因。
首先,ip授权可以有效地扩大产品的应用范围。通过在行业内为客户提供灵活的规模调整ip块,供其在芯片产品中使用,可以大大提高寒武纪对人工智能计算生态的掌握,降低行业将人工智能计算核心引入到单个产品中的难度,从而迅速扩大其影响力。毕竟,如果它成为市场上的主流计算硬件,应用端必须配合对这个平台的优化,这也将有效地增加其竞争力。
第二,如果你在物理芯片的设计和销售上完全独立,就像英伟达和英特尔一样,你将需要一个庞大的芯片管理和销售系统,第二,产品的设计广度将受到主要市场的限制,因此缺乏灵活性。就像英伟达一样,它的人工智能计算环境主要用于服务器和自动驾驶系统,还有更多的应用程序不能考虑在内。
当然,有些人认为以这种方式授权知识产权的客户有可能直接成为寒武纪的竞争对手。这种可能性并非不可能,但目前,寒武纪知识产权授权是基于小规模布局的嵌入式芯片产品,而自主芯片方案则是针对高性能的深度学习计算应用,或者是有所不同。
当然,如果客户想要创建一个类似于寒武纪的计划,这意味着客户可能在设计微调或软件设计方面有额外的优化。只要存在差异,对寒武纪的市场布局仍有积极的帮助。
然而,由于寒武纪包含了知识产权许可和芯片销售的营销策略,主要的知识产权供应商和像英伟达这样的人工智能芯片制造商将不可避免地成为竞争对手。至于ip授权,目前它专门从事ai计算的ip块设计,主要包括想象和一些dsp架构提供商。arm也有人工智能计算的布局,但是它的人工智能计算的ip还没有公布,它仍然是gpu兼容的。
但在计算硬件方面,寒武纪将直接与fpga制造商、gpu制造商甚至cpu制造商竞争,包括英特尔、amd、nvidia和xilinx。包括地平线和沈剑科技在内的中国本土运营商既是敌人又是朋友。地平线目前与寒武纪有合作项目。虽然Horizon提出了自己的芯片方案,但Horizon主要关注算法,因此与寒武纪有一定的合作。沈剑也是一家专门研究算法的新公司。虽然主要的开发平台仍然基于fpga,但是它自己的芯片将很快推出。然而,沈剑的业务核心也强调算法的应用。尽管芯片产品的布局会有所重叠,但在算法上也有合作的可能。
此外,还有一家名为Bitland的公司,它自己的芯片bm1680专门用于深度学习计算,如cnn/rnn。因为算法和芯片设计都属于自己的平台,所以它也处于与寒武纪竞争的局面。然而,Bitland不提供ip授权,因此在服务完整性方面,它比寒武纪稍差。巧合的是,最近一次Bitland的新闻发布会是在本月8日举行的,时间间隔如此之近,以至于人们都忍不住去想它。
寒武纪已经成为推动中国人工智能产业布局的关键一步
根据腾讯研究院发布的数据,中国人工智能企业数量已达592家,占全球人工智能企业总数的23%。然而,各种程序或产品公司命名为人工智能可以说有一个接一个,但目前的核心技术数量有限。然而,就像寒武纪一样,一个从生态、芯片和软件环境甚至知识产权授权进行优化的全方位人工智能解决方案提供商在中国可以说是独一无二的,甚至是无处不在的,而且是找不到的。
一些业内人士认为,顶尖企业之间的战略合作和完善的知识产权保护也是构建人工智能生态的关键因素。在这方面,寒武纪已经领先于许多国内芯片制造商。寒武系首席执行官陈曾说:“除了自身的效率,生态是芯片成败的关键环节。没有应用程序和软件的支持,很难在市场上取得成功。这就是为什么我们提出了第一个国际人工智能指令集。只要国内的人工智能指令集建立起来,中国主宰世界人工智能产业的机会就可能到来。”
由于中国高度重视人工智能产业,并将其视为仅次于智能手机产业和半导体产业的政府重点支持产业,政府已提出1500亿美元支持此类产业的发展。
然而,值得注意的是,过去中国智能手机行业过于关注本土市场,未能在第一时间进入国际市场,导致大多数手机企业遭遇增长瓶颈。此外,由于产品利润微薄,相关产业链在增长后迅速崩溃,影响社会稳定。在半导体工艺技术方面,过于依赖国外技术,自主研发比例过低。目前,dram和与非门等几个关键器件尚未自主生产,芯片代工业务也受到了阻碍。
在人工智能产业的发展方面,中国政府这次吸取了教训,不仅从最基本的算法和芯片技术的核心开始,而且理解支持通用标准的重要性,将市场目标定位在全球,对建筑生态有更清晰的认识。许多人工智能独角兽仅在中国出生。
因此,就连谷歌母公司alphabet的董事长施密特也表示,中国的人工智能技术有可能超越美国,成为引领全球人工智能发展的核心城市。
字母表主席施密特的照片
可以说,寒武纪产品布局在整个中国人工智能规划蓝图中占据核心地位。凭借这份未来产品路线图展示和商业战略布局,并设定短期目标,它将在3年内占据中国高性能智能芯片的30%。同时,世界上有10亿台集成了寒武纪处理器的智能终端,这表明在寒武纪的指导下,中国的人工智能产业不仅要抓住机遇,而且要成为终端和云生态的重要组成部分。
-结束-
标题:AI芯片独角兽寒武纪首场发布会 目标3年覆盖10亿终端
地址:http://www.6st8.com/zbxw/12896.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。
下一篇:没有了