察势者智,驭势者赢。
由CSIA-ICCAD、《中国集成电路》主办,摩尔精英协办的首场“人工智能与半导体技术国际论坛”受到了广大业界人士的高度关注和支持,于3月15日在上海隆重召开。
中国半导体行业协会集成电路设计分会理事长魏少军教授
中国半导体行业协会集成电路设计分会理事长魏少军教授在开幕致辞上表示,很多企业成为独角兽,都与AI技术有着密不可分的关系。同时AI也在推动着半导体产业的发展,这是不容怀疑的。
但是魏少军教授指出,问题在于我们应该如何认识人工智能,而中国半导体行业协会希望借助此次机会,让行业更清醒的认识人工智能行业。
世界各地对于人工智能未来的发展抱有不同的看法,有的看好,有的并不乐观。而魏少军教授自己也对未来人工智能能否成为半导体行业发展的主要驱动力持谨慎态度。
不可否认,很多人工智能芯片公司有成为行业翘楚的潜质,但是应当警惕的是,如果不能够找到一个人工智能单独存活的领域的话,不过是为其他公司作嫁衣裳,摆脱不了被集成的命运。
在此基础之上,魏少军教授提出了两方面的思考:
一方面,什么样的人工智能应用才能成为必不可少的应用,成为刚需。找到这种应用,就是人工智能成功的第一步。
另一方面,如何用芯片覆盖更多的人工智能应用。
“我们需要通过冷静的思考,看清未来人工智能发展的机遇。希望芯片企业能够通过人工智能的发展,找寻到未来发展的强大动力。从而在今后的产业发展中做出自己的贡献。”魏少军教授最后预祝此次论坛取得圆满成功。
《中国集成电路》2018年理事单位颁奖典礼
新思科技人工智能实验室总监廖仁亿在《未来已来》的演讲中表示,在做人工智能产业的时候保持好奇心非常重要,只有如此才能够保持继续前进的动力。同时,也应当时刻注意人工智能多方面的潜在风险。
新思科技人工智能实验室总监廖仁亿
一方面,人工智能可能会被用到一些数字或者是实体攻击上;另一方面,在处理不同状况的时候,如何将人类的价值观赋予人工智能以及潜在的风险,都需要考虑到;最后,实现人工智能,如今的运算能力以及芯片的处理能力都面临着很大的挑战。
“我们需要在人工智能的每一个环节都有深刻的认识,才能够将其做到更好。虽然现在在人工智能领域已经出现了很多应用,但依然有很多值得探索的新应用。”廖仁亿强调,“新的机会在等待着我们去探索,我们应当关注的不是我们过去做了些什么,而是我们未来能够做些什么。”
英伟达NVDLA项目负责人周焱介绍了NVDLA项目,开源项目的背景与流程以及开源项目对业界的影响。
英伟达NVDLA项目负责人周焱
据了解,NVDLA 架构不仅结合了可扩展性和可高度配置性,并且模块的设计始终保持灵活性与简单的集成性。
NVDLA 架构通过与主要的深度学习网络保持互通而标准化了深度学习的加速提升,因此它有助于规模化地统一机器学习的增长。
“英伟达正在不遗余力的推动人工智能在各个领域往前走。”周焱认为,只有不遗余力的推进,当这个领域成熟的时候,企业在这个领域的地位才会真正稳固。
在《赋能开发者,开启端侧AI时代大幕》的演讲中,华为技术有限公司麒麟芯片市场总监周晨表示,端侧AI的广泛应用,是AI技术真正普及的标志。以硬件化端侧AI计算能力为代表的AI移动计算平台,将端侧AI的性能和能效提升了数十倍之巨,给端侧AI的应用带来了前所未有的想象空间。
华为技术有限公司麒麟芯片市场总监周晨
而半导体厂商除了快速提升端侧AI算力以外,还需要将这个能力赋予广大的开发者,才能够真正推动AI技术在手机侧的广泛应用。
华为在端侧AI这一领域的优势是,在对于未知流行应用的支持。以华为的麒麟麒麟970为例,其中NPU就为移动端带来了客观的AI性能提升。
最后,周晨表示,做好黑土地,百花齐放才是MobileAI该有的样子。
Arm人工智能生态联盟秘书长,Arm战略联盟业务发展总监金勇斌在演讲中强调,早在 2016 年就已经把触手伸进多个 AI 应用领域同时发展,包含号称针对机器学习优化的 Bifrost GPU 架构,以及针对高端服务器芯片的 SVE 延伸指令集。
Arm人工智能生态联盟秘书长,Arm战略联盟业务发展总监金勇斌
随着相关方案陆续成熟,采用者也逐渐增加,Arm结合开发环境、算法与各大主流机器学习框架,要布局从终端到云端所有 AI 应用开发生态。
2018年初,ARM正式公开Project Trillium,该项目包含一组高度可扩展处理器的ARM IP组合:ARM机器学习处理器和ARM目标检测处理器。这两项产品均为移动设备设计,并提供增强的机器学习和神经网络功能。
作为上海安路信息科技有限公司联合创始人,黄志军博士表示,人工智能的热潮吸引了一批优秀中国本土AI芯片公司的诞生和壮大,而中国的FPGA公司也已经开始提供中低端FPGA芯片。
上海安路信息科技有限公司联合创始人黄志军
在各种人工智能芯片解决方案选择中,FPGA具有高并行性、高能效比和可编程定制化的优势。FPGA已经在云端数据中心得到大规模的应用,但是在智能终端计算里还只是原型验证的平台。
在演讲中,黄志军探讨了现有FPGA架构在人工智能应用中的优势和局限性,中国FPGA公司在AI领域的机会和挑战,和安路公司在定制化人工智能FPGA芯片和IP核方向的布局。
黄志军认为当前主流FPGA的硬件结构并不是为人工智能定制的,与Google的TPU等ASIC架构比较,FPGA硬件资源配置了在人工智能应用中利用率较低的大量可编程逻辑门单元,而人工智能需求的高数据带宽、乘加单元和内存单元比例偏低。另外,FPGA软件系统还没有打通从算法工程师熟悉的C++/Python到最后FPGA位流下载的高度自动化全流程。这些硬件和软件的问题限制了FPGA被人工智能的算法设计人员更大范围内的使用。
芯原控股有限公司视觉图像产品开发副总裁林尙宏在演讲中讨论了一款可扩展的处理器架构(VIP8000),它可在超低功耗下实现高密度计算。还介绍了几个案例以说明这款处理器如何使人工智能技术在广泛应用中实现无处不在。
芯原控股有限公司视觉图像产品开发副总裁林尙宏
VIP8000的最新升级主要针对神经网络模型推理加速,相比DSP、GPU和CPU混合处理器方案,更新后的VIP8000处理器在提高效率与推理速度的同时降低了内存带宽需求。完全可编程的VIP8000处理器达到了专用固定功能逻辑模块的性能和内存效率,并具有可定制性,且后续可在OpenCL、OpenVX和各种神经网络框架(TensorFlow、Caffe、AndroidNN、ONNX、NNEF等)上进行编程。
什么是人工智能,为什么要警惕它?
无锡华大国奇科技有限公司总裁谷建余表示,集成电路产业的发展带来了人工智能实现的可能性。
无锡华大国奇科技有限公司总裁谷建余
从芯片设计的角度来看,采用了很多种方式,诸如CPU,GPU,FPGA等多种方式来进行人工智能应用的处理。
但是人工智能算法的差异,也会对芯片产生非常大的影响,甚至在业内有这样一种说法,影响人工智能芯片的最大因素就是算法。因此,我们能够看到全球前十大人工智能芯片公司中,除了采用不同的芯片来进行人工智能研究之外,算法,架构都存在着很大差异。
最后,谷建余强调,虽然算法很重要,但是算法并不是人工智能的唯一。没有算法是不能,但是只关注算法也是错误的,架构,物理结构同样重要。
是德科技(中国)有限公司大中华区AI及云计算项目技术负责人李凯表示,云计算(Cloud Computing)已经成为现代互联网时代的基础设施,由此催生的大数据(Big Data)及人工智能(AI)应用成为资本追逐的热点,并上升到国家战略层面。
是德科技(中国)有限公司大中华区AI及云计算项目技术负责人李凯
为了应对大数据、人工智能对于传统技术的颠覆性革新,以Amazon、Google为代表的新一代Web2.0公司成为新时代的数据运营商并重新定义了现代数据中心的架构和技术方向。
李凯从云计算、大数据、人工智能的背景讲起,深入探讨新时代下计算、存储、网络、芯片技术的革新,以及现代超大规模数据中心建设在标准化、能效比提升、运营效率方面的方向及进展。
Imagination中国区市场和业务拓展总监柯川表示,Imagination的专用处理器所表现出来的性能明显优于DSP、DSP + MAC处理器、GPU、CPU等。去年,Imagination首先将自己设计CPU的MIPS部门分拆,以5600万美元卖给硅谷投资集团Tallwood。
Imagination中国区市场和业务拓展总监柯川
“我们相信,在经过此次改变之后,Imagination能够在芯片领域,在人工智能市场帮助企业去做一些与以往完全不同的事情。”柯川强调。
北京兆易创新科技股份有限公司战略市场部总监苏志强
北京兆易创新科技股份有限公司战略市场部总监苏志强表示,随着人工智能对于运算性能和数据量需求的急剧增加,传统冯诺依曼架构在功耗和数据带宽遇到了“功耗墙”“存储墙”瓶颈,而存储技术创新和以Memory-centric和Neuromorphic为代表的系统架构的革新将会为人工智能带来质的提升。
北京博达微科技有限公司创始人、CEO李严峰则从EDA何测试仪器的角度发表了自己对人工智能的看法。
北京博达微科技有限公司创始人、CEO李严峰
李严峰认为,“软件定义测试,算法突破硬件限制”,基于模块化硬件平台,应用人工智能算法,拓展硬件固有的测试能力,大幅提高测试精度和速度,博达微科技可以说是现今利用人工智能驱动半导体测试测量的领导者。
博达微算法团队全部来自清华大学电子系,优化算法出身,十年前就利用算法处理集成电路工艺浮动仿真难题,积累了“行为预测”、“噪声去除”等一系列技术算法原型,从2015年开始团队把算法应用转移至半导体测试领域。为半导体领域的客户提供更快速、更稳定、更智能的参数化测试方案。
日月光集团李长祺研发中心处长李长祺
日月光集团李长祺研发中心处长李长祺目前担任日月光集团研发中心处长,負責3D IC系统级封装技术团队与封装特性分析部门,专注2.5D IC新产品导入(NPI)与3D IC 封装技术开发。李先生拥有超过15年的特性分析验室经验。
地平线机器人芯片规划部部长谭洪贺表示,“嵌入式人工智能”是地平线整理自身业务之后,找到的一个定位。这个概念与当前联网状态下的人工智能相对。目前大部分人通过联网和数据中心的大规模计算,来实现人工智能。“嵌入式人工智能” 要做的,是在本地进行实时环境感知、人机交互与决策控制。
地平线机器人芯片规划部部长谭洪贺
人工智能与计算资源高度相关。深度学习算法对硬件的计算性能、功耗、以及成本把控都会提出更高要求。除了开发出一款低功耗平台,算法本身的优化也很关键,软硬件结合才能最好提升性能。一个典型的例子是以前的苹果手机,配置总是比安卓低,但是在性能上依旧出色,最主要的原因就是软硬件深度绑定。
紧跟硬件做软件,地平线在嵌入式人工智能上的终极目标是:提供“处理器+算法”的嵌入式人工智能解决方案,包含算法、软件、芯片在一起的整体打包。
寒武纪执行董事罗韬表示,芯片技术是人工智能发展的重要推动力量。
寒武纪执行董事罗韬
因为,人工智能很多关键性技术在上世纪八九十年代就已经出现,而在过去的十年中,摩尔定律的延续成为了人工智能复兴的发动机,最后,未来十年,摩尔定律的放缓,使得设计专用处理器成为一种必然趋势。
寒武纪之所以想要开发一款专用的深度学习处理器,因为有必要有专门的深度学习处理处,来提升效能与克服降低功耗。通用芯片与专用芯片相比,就像是一把万能的瑞士军刀与菜刀之比,想要切菜得好,必须有专用的菜刀堪用。而深度学习是处理智能应用迄今最好的方法。
在产品形态方面,寒武纪主要集中在智能终端和云端两个端侧。前者主要授权给华为,小米等智能手机厂商。云端主要集中在服务器端,主要采用的厂商用科大讯飞等。
与此同时,罗韬认为,人工智能芯片还面临着多方面的挑战,诸如模型特征多样化,学习算法多样化,神经网络缺乏认知能力等等,都需要未来想方设法去解决。
众所周知,新的AI时代将由数据,算法和算力共同驱动,深鉴科技ASIC VP陈忠民,算法和算力作为新兴的领域,通过软硬件的结合能够带来更好的用户体验。
深鉴科技ASIC VP陈忠民
在此基础上,数据推动的专用AI硬件的发展,在推动整个行业从通用的计算平台向定制计算平台快速转变。微软等厂商的产品都说明了这一趋势,也表明,低功耗,低延迟,低成本也是整个行业在不断追求的。
那么如何提升计算效率,降低功耗呢?
深鉴科技有三方面的考虑,首先,优化计算引擎;其次,优化访存系统;第三,软硬件协同设计。这样的产品规划路线能走得通的一个关键因素就在于他们的未来的ASIC和之前的FPGA模组使用的是同样的编程和软件开发,能实现客户在应用上的无缝切换。
NetSpeed Systems大中华区总监黄 啟弘表示,半导体发展到今天,已经进入了人工智能时代。NetSpeed Systems创立于2011年,由半导体和网络行业经验丰富的高管领导。主要针对从移动到高性能计算和网络等广泛市场中的SoC设计者提供可扩展的缓存一致性片上网络IP。NetSpeed的片上网络平台通过系统级方法、高水平的用户驱动自动化和先进的算法提供显著的上市时间优势。
NetSpeed Systems大中华区总监黄啟弘
“利用缓存一致性片上互连Fabric架构可带来绝佳的优势。它是为当前复杂、高集成度的 SoC 设计实现最佳性能的理想方式。“
深圳云天励飞技术有限公司联合创始人兼首席技术官田第鸿表示,云天励飞是一家注重实际落地的智能安防解决方案商。
深圳云天励飞技术有限公司联合创始人兼首席技术官田第鸿
目前云天励飞在深圳龙岗区架设了3000多路智能摄像头,在全国有6500+多路部署,这些摄像头都需要大量的视频处理能力,如果未来当规模达到数万甚至几十万路级时,更需要强大的前端强大的分析能力,快速反馈结果,并降低服务器端的压力。
“过去大家都在拼性能,但算法的壁垒会越来越低,到那个时候相差百分之几的数字比拼本质上并没多大差别,真正的差别在于谁的算法能在嵌入式端和大规模数据中实时运行。”
而据田第鸿介绍,云天励飞在很早就实现了终端和云端的打通。
目前云天励飞已聚集了一个团队研发AI芯片,为客户提供“芯片+算法+数据+应用+服务”端到端的整体解决方案,全面进入备战状态。
在最后的圆桌讨论中,主持人摩尔精英CEO张竞扬和寒武纪执行董事罗韬、北京博达微科技有限公司创始人、CEO李严峰、地平线机器人芯片规划部部长谭洪贺、深圳云天励飞技术有限公司联合创始人兼首席技术官田第鸿、NetSpeed Systems大中华区总监黄啟弘、深鉴科技ASIC VP陈忠民、Imagination中国区市场和业务拓展总监柯川展开了关于AI芯片机遇与挑战的激烈讨论。