0代码调戏千亿参数大模型，打开网页就能玩！无需注册即可体验

科技量子位· 2022-10-30

明敏发自凹非寺

量子位 | 公众号 QbitAI

想体验千亿参数大模型的门槛，真是越来越低了！

想让大模型回答问题？

只需在网页端输入问题，运行二三十秒，答案就噌噌生成了。

用的正是今年由Meta开源的Open Pretrained Transformer（OPT），参数量达1750亿。

如果是传统在本地运行，对算力可是个大考验。

这就是由开源项目Colossal-AI支持的云端demo，无需注册即可上手体验，对硬件完全没门槛，普通笔记本电脑甚至手机就能搞定。

也就是说，完全不用懂代码的小白，现在也能调戏OPT这样的大模型了。

让我们来试玩一把~

4种任务可试玩

FAQ常见问题解答、聊天机器人、翻译、文章创作几种模式都可试玩。

一些数值也能按需自己来调整，并且不涉及到代码。

我们体验了下文章创作，开头给了一句“今天是个好日子啊”。

很快，网页就输出了一连串大好事，刚刚加薪、正在玩刺客信条、明天还要去海滩……看着让人羡慕！

还能构建个场景让聊天机器人唠上几块钱的。

随机生成的一段长对话是买手机的场景。嗯，和今天iPhone 14发布可以说是非常应景了。

感觉即便是不懂AI、不懂编程的小白也能玩转OPT的各种任务，体验过程相当丝滑。

要知道，像OPT这样千亿参数大模型的运行，一直都有着“对硬件要求高”、“成本高”的特点。

一个免费无限玩的网站，到底是怎么实现如上效果的？

开源方案快速云上部署超大模型

这还是要从其背后支持系统Colossal-AI说起。

它以“仅需几行代码就能快速部署AI大模型训练推理”而名震江湖，在GitHub上揽星超过4.7K。

这一次，是它在云上部署AI大模型的一次新突破。

主要针对OPT模型的特性，做出了在推理速度、计算量等方面的优化。

在OPT云上服务方面，提出了left padding、past cache、bucket batching技术。

OPT拥有1750亿参数量，如此规模的模型，单个GPU显存显然无法容纳。

而且推理问题不光要考虑吞吐量，还要顾及到时延问题。

针对这两方面问题，并行计算是个不错的解决思路。

尤其是Colossal-AI本身就十分擅长将一个单机模型转换成并行运行，获得并行OPT模型自然不成问题。

不过并行方案中的参数加载一直是个难题。

在这方面，Colossal-AI可以让用户只需要参考样例，简单提供参数名映射关系，即可完成模型参数的加载。

最后，再将模型导入到Colossal-AI的推理引擎中，设置相应的超参数。

到这一步，OPT主干网络的推理部分就能上线且输出有意义的结果了。

但是这还远远不够。

因为OPT是生成式模型，生成式任务需要不断循环模型的输出结果，这就导致推理中常见的batching策略无法直接应用。

具体来看，由于生成任务输入的语句长度往往参差不齐，而且大部分语言阅读和书写都是从左向右的。

如果用常规的right padding，那么针对较短的句子就很难生成有意义的结果，或者需要进行复杂处理。

△使用Right padding，生成侧不对齐

如果用单batch运行，效率又太低了，不可行。

所以这一回的推理部署中，增加了left padding对句子进行填充，让每个句子的生成侧（右侧）都是对齐的，同时可以生成新的单词。

△Left padding

还有另一方面的问题——生成模型单次推理只能生成一个新词。

当新的输出结果生成时，它同时也成为了输入的一部分。

也就是说，生成式任务的每次计算，是需要针对新的输入序列进行重新计算的。

显然这种操作方式，重复计算太多了。

尤其是对于占绝大多数计算量的Linear层来说。

所以，Colossal-AI的开发人员在模型内部引入了past cache技术。

它可以暂存同一次生成任务中的Linear层的输出结果，让每次只有一个新的单词进入Linear层进行计算，并把该次的计算结果暂存，以避免重复计算。

直观来看就是酱婶儿的：

除此之外，开发人员还注意到生成式任务的计算量是参差不齐的。

输入、输出的句子长短变化范围都很大。

如果用简单的batching方法，将两个相差很大的推理放在同一个批次里，就会造成大量的冗余计算。

因此他们提出了bucket batching。

即按照输入句长以及输出目标句长进行桶排序，同一个桶内的序列作为一个batching，以此降低冗余。

One More Thing

不光是这次的云端demo，提供支持的Colossal-AI也是免费开源的~

任何人都能基于它低成本训练自己的大模型，并部署成云端服务。

比如在单张10GB显存的RTX 3080上，就能训练120亿参数的大模型。

较原生PyTorch提升了120倍的模型容量。

此前Colossal-AI多次在GitHub、Paper With Code热榜位列世界第一。

相关解决方案成功在自动驾驶、云计算、零售、医药、芯片等行业知名厂商落地应用。

最近，Colossal-AI还连续入选和受邀全球超级计算机大会、国际数据科学会议、世界人工智能大会、亚马逊云科技中国峰会等国际专业盛会。

对Colossal-AI感兴趣的小伙伴，可以关注起来了~

传送门

项目开源地址：

https://github.com/hpcaitech/ColossalAI

云端demo体验地址：

https://service.colossalai.org/

参考链接：

[1]https://arxiv.org/abs/2205.01068

[2]https://sc22.supercomputing.org/

[3]https://medium.com/@yangyou_berkeley/using-state-of-the-art-ai-models-for-free-try-opt-175b-on-your-cellphone-and-laptop-7d645f535982

本文来自网络，不代表趣头条立场，转载请注明出处：https://www.ngnnn.com/article/4_118971.html

代码网页 ai

为您推荐

AI猫猫火遍全网，“电子猫”快要比真猫还好吸了

在我们这个被爱宠们温暖着的世界里，银渐层猫无疑是家喻户晓的宠物之一。然而，当我们发现我们的爱宠出现异常的症状时，心里总是不免慌乱和焦虑。

AI猫猫火遍全网，“电子猫”快要比真猫还好吸了

想想看，以前我们都是追捧着一些传统的宠物博主，他们带我们了解各种各样的真实猫狗生活，看他们的日常、搞笑、甜蜜，是我们每天必须做的功课。

“+茅台”周边产品开发对品牌有正面效应吗？【AI详细分析】

“+茅台”周边产品开发对茅台品牌应该有正面效应，有以下几个方面的原因:-周边产品可以扩大茅台的消费群体，特别是吸引年轻人。

AI设计|一张老房照片，变50套新房效果图

家里要建房，先出效果图，让AI来帮忙出效果图，看看哪种最适合?

华为王连军：目标是三年内将AITO问界做成全球高端智能电动品牌

【华为王连军：目标是三年内将AITO问界做成全球高端智能电动品牌】财联社11月7日电，华为智选车战略总监王连军透露，AITO问界已经连续三个月销量破万，在刚刚过去的10月份，销量达到了12018台，在新势力车企中做到当月市场第一。王连军表示，过去的汽车行业积累了精益制造与供应链体系能力，但未来是软件定义汽车，智能化是

AirPods Pro 2，这次真的值得换了？

本周，苹果发布了秋季特别活动的邀请函，将发布会定档北京时间 9 月 8 日凌晨 1 点。除了 iPhone 14，大家心心念念的另一款重磅产品，也有望在本次发布会亮相。那就是 AirPods Pro 2。距离第一代 AirPods Pro 发布，已经过去了三年，想必有不少小伙伴已经在为耳机的续航而发愁。AirPods 3 提升不错，但又不支持主动降噪。那

推特称其网页版内容显示当前应该已经恢复正常

【推特称其网页版内容显示当前应该已经恢复正常】财联社3月7日电，推特称其网页版内容显示当前应该已经恢复正常，此前发生大面积故障。马斯克称，本来只想对应用程序界面(API)进行微调，却造成了大面积故障的严重后果。

排插怎么买？公牛、aigo、绿联、飞利浦、得力、德力西拆给大家看

qianseyue家里就入手了不少的排插，近期闲来无事，都拆了一遍满足好奇心。按照品牌首字母排序，分别有aigo AC0404、得力27040-

FALAIER ‖3大门窗五金品牌执手测评，哪个品牌最值得入手?

所以在选购门窗时，一定要关注门窗五金的质量，那么选购门执手要关注哪几个要素呢?NO. 1 看外观。可以看执手的设计工艺，表面镀层是否均匀，表面是

除了绘画，AIGC还做营销能手、创作者和程序员｜我在硅谷看未来

DeepMind CEO哈萨比斯：AI或将打败更多诺奖级难题

1997 年 5 月 11 日，加里·卡斯帕罗夫（Garry Kasparov）在美国纽约曼哈顿公正中心的毛绒皮椅上坐立不安，焦急地抚摸着他的头发。这是他与 IBM 的 Deep Blue 超级计算……

曾经万人斩、永劫无间单挑王，却被AI虐的死去活来？做梦都能吓醒

竞技游戏中的人机模式，一直以来都是玩家用来熟悉游戏、精进技术的最佳手段之一。相对于真人，AI的行为会稍显呆板，只会按照指令来行动。即使强如《英雄联盟》中的末日人机，也仅仅是在数值和技能类型上做出了调整，整体依然不足以与真人相提并论。而最近有款竞技游戏却打破了这个认知，那就是国产多人动作游戏《永劫无间》

仅花费60美元就能破坏0.01％数据集，AI模型性能显著降低

机器之心报道编辑：袁铭怿网络规模的数据集很容易受到低成本的投毒攻击，这种攻击只需要一小部分被破坏的样本就可以使整个模型中毒。用于训练深度学习模型的数据集已经从数千个精心策划的示例增长到具有数十亿个从互联网自动爬取样本的网络规模数据集。在这种规模下，通过人力管理来确保每个示例的质量是不可行的。到目前为

出门问问发布大模型“序列猴子”及四款AIGC产品

三言科技消息出门问问宣布内测探索大模型「序列猴子」，并提出CoPilot将会无处不在，同时在大模型能力的基础上还同步开启了面向创作者的CoPilot产品矩阵，面向C端的升级版语音助手魔法小问，以及面向B端的企业专属大模型的内测探索。其中面向创作者的CoPilot产品矩阵包含了四款AIGC产品，分别为AI写作平台“奇妙文”、AI

达摩院2023十大科技趋势发布：人类对通用AI的想象从未如此具体

杨净发自凹非寺量子位 | 公众号 QbitAI刚刚，达摩院十大科技趋势榜单发布。本次包含了AI、芯片、云计算等基础技术领域，既有引发全球投资浪潮的生成式AI，也有在规模化应用前夜的存算一体、Chiplet设计封装技术……（先来一睹为快）但跟以往不同的是，仅从榜单上可以看到，产业、融合等成为此次的关键词。而在跟达摩院进

“AI焦虑”蔓延全球？有人失眠，也有人靠ChatGPT带孩子

·“很多年前可能需要我们在农田里务农，工业时代变成流水线女工，到现在变成‘PPT女工’。未来可能就变成为AI工作的工人，是‘喂它东西的饲养员’。变化的只是工作形式，我们始终都会有工作。当然在这个过程中还有一部分人会因为没有继续学习，或者没有继续使用新工具而被淘汰。”曹宇在上海一家媒体担任英文报道编辑，平

满满的巴洛克风-Ai美人的罗马假日行

罗马是意大利的首都和最大城市，拥有丰富的历史和文化遗产。以下是罗马的一些著名旅游景点的详细介绍1. 罗马斗兽场（Colosseum）：这是一座古

知乎发布“知海图AI”大模型官方：已储备充足A100芯片

腾讯科技讯 4月13日，知乎在北京召开“2023知乎发现大会”，首次公开旗下与面壁智能共建的大模型产品“知海图AI”，双方合作将以联合研发与战略投资的方式展开。据了解，目前“知海图AI”已经应用到“热榜摘要”功能当中，通过对知乎社区现有的内容进行聚合、整理，然后提炼成摘要展现给用户，目前该功能已开放内测。官方表

孙燕姿回应“AI孙燕姿”：人类无法超越AI，做自己就够了

近期，“AI孙燕姿”因翻唱《下雨天》等歌曲走红网络。5月22日晚，孙燕姿发文回应称，人类无法超越AI技术已指日可待，凡事皆有可能，凡事皆无所谓，“我认为思想纯净、做自己，已然足够”。孙燕姿表示，无论是ChatGPT还是Al或者其他名字，现在这个“东西”能够通过处理海量的信息，同时以最连贯的方式拼接组合手头的任务，来

在黄仁勋的“iPhone时刻”，人与AI究竟是什么关系？

AI时代，我们是谁，从哪里来，到哪里去？撰文 | 佘宗明「你是谁，从哪里来，到哪里去」在「AI的iPhone时刻」已到来的背景下，所谓的人生终极三问，从保安的灵魂追问变为我们的扪心自问，几乎是必然。我们究竟要到哪里去？这是我们无法回避的问题。有人说，包揽今年奥斯克7项大奖的《瞬息全宇宙》，用天马行空的科幻剧情设