作为智能社会的底座、数字经济的引擎,算力的重要性已经被提到一个前所未有的高度。当下,算力的提升仍然面临着多个维度的挑战,算力发展亟需变革。
先进计算技术指代一切从计算理论、计算架构、计算系统等层面有效提升现有算力规模、降低算力成本、提高算力利用效率的创新性技术。
为了解决算力挑战,打破后摩尔时代的算力危机,先进计算技术将从单点计算性能的提升与算力系统的高效利用两个方向着手突破。以量子计算、光计算为代表的先进计算技术将为人工智能等工具搭载全新的引擎,加速人类科学复兴。
在近期刚顺利举办完的“DeepTech 创新周 2022”系列论坛上,围绕“先进计算和智能计算”主题进行的讨论受到了行业极大的关注。本次活动,我们也邀请到了顶尖的科学家、商业领袖等共同参与,探讨从硬件到架构、理论到系统层面,先进计算的下一步。
突破摩尔定律的“芯”机遇
随着越来越多大学成立了研究脑科学、认知科学的研究团队,脑科学、认知科学和神经科学紧密结合形成的交叉学科,被期待能带来革命性的突破。基于对生物脑的理解,类脑计算也被视为下一代人工智能。
类脑技术的主要出发点,在于打破当前 AI 底层网络框架层面的限制。
生物体的大脑是非常高效的,人脑的功耗只有约 20 瓦,但所能完成的事情非常复杂。蜜蜂大脑容积只有一毫克,功耗约为 0.1 个毫瓦,相当于 1 个纽扣电池就可以驱动运转 6 个月的时间,并且用接近于零的算力,完成觅食、飞行、导航、社交一系列活动。
一个小小的“处理器”完成复杂的活动,让无数芯片科学家想要从底层理解生物是如何感知、以及如何基于感知获得的数据进行复杂计算的。
SynSense 时识科技的创始人兼CEO 乔宁表示,以动态视觉感知计算为例,我们的眼睛并不是像传统相机一样来成像,而是靠二维排布在视网膜上的视锥神经感知光强的变化,并生成携带“时空信息”的脉冲数据流,送到大脑皮层做运算。
我们的眼睛到大脑之间也不像“冯诺依曼”系统一样具有缓存,而是基于眼睛产生的连续数据流,在大脑里做实时的连续“时空计算”。所以,我们的大脑完成的是基于脉冲神经网络的连续时空计算,且通常这种计算比传统的深度学习网络多一个时间域的计算维度。
仿生的类脑芯片与生物大脑一样,其算力与网络规模相关,在实际运转中,不太会出现峰值算力的问题。作为第三代人工智能,仿生的类脑计算更胜任有时间相关性的实时传感信息处理,比如复杂的行为分析、决策判断、复杂场景理解等是很高效的。这得益于类脑感知及计算的系统优势:类脑计算在感知的层面,数据量通常比传统要少几个量级;而在运算层面,类脑计算通常基于事件触发稀松、连续的时空计算。
目前类脑芯片还是一个比较新的赛道,这个领域的公司也相对较少。乔宁博士于 2017 年在瑞士苏黎世创立了 SynSense 时识科技,并带领公司走在世界类脑芯片产业化的前列。他表示,类脑计算更关注多模态传感信息的实时处理能力,强调精准度更高、延时更短、成本更低以及灵活性更高,类脑芯片能够带来的是低成本、低功耗、低延时,并且针对端侧的传感信息处理解决方案,可以赋能诸多边端 AI 场景。
电子芯片技术目前已经越来越接近物理极限,未来我们无法期待通过把系统做得更密集来大幅提升算力。但人类社会对算力的需求增长没有任何放缓。
金贤敏是上海交通大学的教授、长江学者,一年前,他成立了图灵量子,是我国率先开展光量子芯片和光量子计算机的产业化公司。
金贤敏表示,图灵量子的愿景就是依托芯片底层技术、量子计算和光子计算研究,将光子芯片推向产业化阶段。
让量子计算、光子计算和 AI 光子处理器成为商品,将是一个具有极高上限的事业。
他认为,光子芯片作为一个底层技术在产业化方面有巨大的发展机会,甚至可能是降维打击。因为量子计算、光子计算对芯片有极高的要求,比如损耗、速度等等,这会推动光芯片在传统的芯片基础之上继续发展。
虽然我们现在感觉到算力还在高速提升,但如果能把量子计算和光子计算带入产业,人类算力爆发还只是一个开始。
以往大部分的数据中心都以 CPU 为中心,因为数据中心的业务具有不确定性,因此数据处理需要通用和灵活的计算平台。
但当数据量爆发式增长,CPU 已经无法有效处理所有数据,因此产生了对异构计算的需求。随着人工智能的兴起,GPU 成为了数据中心的一部分,为了支撑 AI 的训练和推理,未来还会有更多的异构平台。
当数据进入到数据中心,如何合理地把数据分配到不同的平台,成为异构计算的一个挑战。
云豹智能硬件工程副总裁莫志城认为,DPU 的出现就会逐步解决这一难题。
DPU 作为一个数据处理和运维的中枢,负责把不同的数据调度给最合适 xPU,甚至 DPU 本身也可以进行数据处理,这将是一个巨大的变革。未来数据中心所有的管理和运维都可以通过 DPU 实现。
目前业界也可以看到这方面的探索,从公开数据信息可以查到,亚马逊从 2016 年起每年都会消耗几百万片 DPU 芯片,每一台 AWS 的服务器里都至少有一个定制化的 DPU 芯片。
从运营商的角度考虑,未来 DPU 承担了数据中心管理者角色后,算力损耗可以降到 0,全部或者大部分 CPU 都可以售卖、租赁,达到优化成本的目的。由于 DPU 芯片复杂,现阶段 DPU 的发展还有赖业界长期的投入。不管是软件还是硬件层面,都需要长期的投入才能取得更长远的发展,生产出高质量的 DPU 芯片,最终获得客户的长期认可。
让计算变得更聪明
数据、算力增长的背后,涉及的端侧设备、协同平台、数据存储、处理等碳排也与日俱增,不可忽视。在碳达峰、碳中和的战略背景下,如何提高整个数智设备与计算的效率、降低能耗,是行业最为关注的重要问题。绿色计算在这个背景下,成为低碳算力发展的最新趋势。
目前,国家颁布了“3060”双碳目标,工信部和发改委分别印发了新型数据中心发展三年行动计划,明确的提出了数据中心绿色可持续发展,加快节能低碳技术的研发应用。
目前数据中心的耗电量已经占了全国发电量的 2.7%,而且每年还在以 10% 的趋势在增长,数据中心的绿色化是一个必然的趋势。
蚂蚁集团 AI 预测与博弈平台资深总监 James Zhang 在分享中表示,截止 2021 年,蚂蚁集团已经借助 AI 决策,帮助上万个复杂的业务场景能够定制化地使用计算资源。首先,绿色项目组首创了强隔离技术,把两种业务(例如在线业务和离线业务)部署在同一种服务器上,实现同时运行且不互相干扰,提高了使用效率。
实现绿色计算的第二个措施是分时调度,就像城市里的潮汐车道,不同业务都有各自的业务高峰,服务器资源也可以分时支持三种业务。
最后就是核心的技术:AI 弹性容量,让 AI 进行全局资源调度和分配优化,帮助各条业务线在利用算力方面达到千人千面的定制效果,获得更高的计算能力,同时让全局计算耗能降到最低。
他表示,蚂蚁集团全年减排工作组的温室气体总排放节约量近 3 万吨,其中绿色计算项目贡献了 78%。
“数据与算力就是生产力”已经成为行业的重要共识。
对数据的使用及数据安全愈发被关注,由姚期智发轫的 MPC 理论(多方安全计算),经过演变和融合逐渐形成了“隐私计算”的技术赛道。
隐私计算融合了密码学、计算机硬件、AI 等多学科,逐渐形成了以多方安全计算、联邦学习、可信执行环境为代表,混淆电路、秘密分享、不经意传输等作为底层密码学技术,同态加密、零知识证明、差分隐私等作为辅助技术的相对成熟的技术体系。隐私计算技术当前主要成熟应用在金融、政务、联合营销、医疗等对隐私计算有刚性需求的行业。
目前隐私计算可以大致分为几种方案,第一种是在传统的数据生产链路上进行隐私加固。一方面遵循最小化采集的原则,同时对数据做去标识化、脱敏处理,或进行噪音处理。另外,还要保证数据计算之后的结果不会侵犯到个人隐私。
蚂蚁集团隐私计算算法总监王力表示,随着隐私保护技术的发展,一个新的模式被提出来:联邦学习模式。简单来说就是使用数据但不采集,数据始终留在用户端而不上云端。但目前由于端的计算能力、存储能力不够等原因,这项技术还没被大规模铺开。
在分析图像方面,王力所在团队采取的一种方式是先分析图像包含的能量里,有多少是对可视化有帮助而对识别任务帮助不大,并将这部分信息去除。
第二步就是引入随机性,在频率上进行随机打乱和组合,效果就是无法反推图像原始的频率;第三个就是引入一些不可逆的操作,丢失一些图像的原始信息。在经过一系列处理之后,实际证明训练出来模型的效果同样很好。
在语音识别方面,整体的思路和图像类似,区别在于图像方面是处理频率,而语音则是处理超频率。此外,语音具有时间上的连贯性,所以在做隐私保护时,需要切断连贯性,进一步保证用户的隐私。
王力所在的团队已经提出了一套脱敏技术的衡量标准,希望建立一套全面的多媒体隐私数据保护标准在行业进行推广。未来也会把联邦学习和多媒体隐私保护进行结合,探索更多场景下的隐私保护技术。
图计算与图形计算
图计算,是研究人类世界的事物和事物之间的关系,对其进行描述、刻划、分析和计算的一门技术,是前沿理论界的研究热点。
Gartner 在《2021 年十大数据和分析技术趋势》报告中预测,到 2025 年图技术将应用于 80% 的数据和分析创新。图计算技术在金融、制造、能源等领域有着广阔的应用价值和前景,甚至在前沿的生物计算和 AI 造药中,也能看到它的身影。
关于图计算技术的进展和现状,蚂蚁集团图数据库负责人洪春涛在分享中表示,蚂蚁集团从 2015 年开始研发图数据库,内部也使用了很多图计算技术,且获得了很好的效果。
比如双 11 购物时,每一笔支付涉及到的风控电路都要经过图计算,实现非常高吞吐的同时保证毫秒级的低延迟。目前蚂蚁集团内部已经有 100 多不同业务线使用到了该图计算平台。
但整体来说,目前业界大部分图数据库都还在发展中,图数据库离已经发展了很久的关系数据库在成熟度上还有较大差距,同时成本也较高。
另外,图数据库在生态上也存在标准不统一的问题,目前业界在图查询的语言标准上并不确定,在评判标准上也有所欠缺。因此外界对图数据库的应用主要是作为第二存储。
洪春涛认为,图数据库未来有希望能取代关系代数成为新的计算模式,就像编程语言从低级向高级转化。目前蚂蚁也正在积极参与建立图数据库的标准,进一步推动这项技术的发展和应用。
图计算和图形计算仅一字之差,但二者的研究范畴和应用方向有的极大的区别。
泽森科工创始人张心欣专注图形学算法研究多年,于 2020 年成立泽森科工,致力于用技术打造出便捷高效、集中作业的“全流程”三维内容生成软件。公司目前已获得数千万元天使轮融资。
作为国内首款主打“全流程” 的 3D 内容生成软件,泽森自研的「ZENO」系统集物理仿真、生物仿真、程序化几何、程序化材质、实时渲染等多功能于一体,为创作者带来了“一个平台,操作到底“的全新制作体验。
「ZENO」打通了所有传统 3D 内容制作流程,并将每一制作流程的性能提升到极致,用户仅使用一款工具即可实现创意从萌芽到可视化呈现的全过程。相比传统的跨平台制作方式,「ZENO」为用户带来了全局 4-5 倍制作效率提升的新体验。
张心欣表示,随着「ZENO」功能丰富性及性能优越性的不断完善,我们能洞见「ZENO」未来在图形计算处理方向的广阔应用空间。
以算力为基础,在大规模实际应用层面,隐私计算、图计算和绿色计算受到行业的关注呈指数级增长。更多智慧化、智能化的应用将涌现;绿色低碳、开放开源的算力也将会成为数字经济时代生态共建的趋势。