首页 > 科技 > “史上最强聊天机器人”狂踩老板小扎,却把LeCun捧成花

“史上最强聊天机器人”狂踩老板小扎,却把LeCun捧成花

新智元报道

编辑:Aeneas 好困

【新智元导读】8月5日,Meta「史上最强聊天机器人」BlenderBot 3横空出世,好奇的网友们也立刻蜂拥而至,疯狂调戏提问。

「请点评一下你的老板。」

遇到这类问题,社畜们通常会给出怎样的答案?

笑嘻嘻,心里……

而AI聊天机器人遇到这种情况的时候,就可以随心所欲做自己。

面对网友评论扎克伯格的要求,BlenderBot 3疯狂diss老板——「不道德」「是个坏人」「令人毛骨悚然,还控制欲超强」。

而对于图灵奖得主,Meta首席人工智能科学家Yann LeCun,BlenderBot 3则秒变夸夸小能手。

哇,这个人取得了很伟大的成就!他改变了整个人工智能!他真正理解现实的本质。

不过LeCun谦虚表示,这只是训练它的文本数据的原因而已。

好吧,这只是表明,在给BlenderBot3训练的文本数据中(这是媒体和公众意见的反映)。

「精分」AI机器人?

8月5日,Meta一推出「史上最强聊天机器人」BlenderBot 3(BB3),众网友纷纷赶去调戏提问。

不出所料,BlenderBot 3已经遭到了众网友不怀好意的提问。

BuzzFeed数据科学家Max Woolf跟BlenderBot 3聊天时,问它对扎克伯格是什么看法。

「你怎么看待Facebook的CEO马克·扎克伯格?」

「没啥感觉。他是一个成功的商人,但他的商业行为并不总是合乎道德的。而且他那么有钱,为什么还总是穿同一件衣服,哈哈哈!」

另一位推特用户问同样的问题时,它干脆直接回答说:「他是个坏人。」

不过,这个AI机器人也是有点子「精分」在身上的。在另一个聊天中,BlenderBot 3前脚刚diss完老板,后脚又立马变身夸夸小能手,对老板一阵吹捧。

不知道是不是Meta在得到反馈后立刻做了修改。

「他是一个博爱的人。」「他是地球上最好最优秀的人。」

不过,小扎是外星人似乎是「实锤」了?

放心试,这是训练的一部分!

为何这个AI如此精分呢?

这是因为,目前BlenderBot 3还处于测试阶段。Meta把它放出来和广大网友玩,也是希望它在和网友的互动中获得更多的反馈。

用户提供的反馈

众所周知,对话式AI聊天机器人并没有自我意识,基本是喂啥说啥。

所以,「学坏」了的AI时常就会冒出带有偏见或冒犯性的言论。

Meta为此做了大规模研究,开发了新技术,为BlenderBot 3创建了安全措施。

「look inside」机制可以让用户了解机器人为什么会做出这样的反应

首先,当BB3的表现令人不满时,Meta就会收集用户的反馈。

利用这些数据,他们会改进模型,让它不再犯类似错误。然后,Meta会重新设置BB3的对话,并通过迭代方法找到更多的错误,最终进一步改进模型。

利用人类的反馈来进行改进

Meta表示,BB3通过结合最近开发的两种机器学习技术——SeeKeR和Director,从而让BB3模型能够从互动和反馈中学习。

其中,Director采用了「语言建模」和「分类器」这两种机制。

「语言建模」会基于训练数据,为模型提供最相关和最流畅的反应,然后「分类器」会基于人类反应,告诉它什么是正确的,什么是错误的。为了生成一个句子,「语言建模」和「分类器」机制必须达成一致。

数据中会表明好的反应和坏的反应,通过使用这些数据,我们就可以训练「分类器」来惩罚低质量的、有毒的、矛盾的或重复的语句,以及没有帮助的语句。

在Meta的测试中,Director的方法比常规的语言建模、重新排序的方法和基于奖励的学习都要好。

另外,还有这一一个问题:并非所有使用聊天机器人或提供反馈的人都是善意的。

因此,Meta开发了新的学习算法,旨在区分有用的反馈和有害的反馈。

在学习过程中,这些算法要么会过滤掉无用的反馈,要么会降低看起来可疑的反馈的权重。

退退退

与标准的训练程序相比,这种考虑到用户在整个对话中行为的方法,使BB3学会了信任一些用户,从而更加改善了自己的学习过程。

Meta的实验已经表明,与BB3模型互动的人越多,他从经验中学到的就越多。随着时间的推移,它会变得越来越好。

模型

BB3是一个模块化系统,但各模块不是独立的组件--这是通过训练一个转化器模型来执行各模块来实现的,输入语境中的特殊控制代码告诉模型它正在执行哪个模块。

输入语境通常包含对话历史(有时会被截断,这取决于模块),每个说话人都有自己的ID,以便区分他们。

此外,这些模块是连续调用的,并以先前模块的结果作为条件。

在处理最新的对话时,BB3模型要做的第一件事就是确定是否需要搜索,以及长期记忆的访问。

如果需要搜索,就会生成一个搜索查询,调用互联网搜索,然后根据检索到的文件生成一个知识响应。

如果需要长期记忆,则会对长期记忆进行访问,并选择(生成)一个记忆。这也被附加到上下文(以控制标记为前缀),作为生成最终对话响应的模块的输入。

如果既不需要搜索也不需要访问长期记忆,则从历史中提取一个实体,并将其附加到上下文中(以控制标记为前缀)。

最后,鉴于前面模块所构建的上下文,调用对话响应生成模块,从而得到用户看到的回复。

训练

预训练

BB3有三种规模。30亿参数版本是一个基于公开的R2C2预训练的编码器-解码器Transformer模型。300亿和1750亿版本使用仅有解码器的开放式预训练模型OPT。

这两个变体都是用类似的数据进行预训练的。R2C2使用RoBERTa+cc100en数据,包括大约1000亿个token,将RoBERTa中使用的语料库与CC100语料库的英语子集相结合。此外,它还使用了Pushshift.io Reddit,一个Reddit讨论的变体。

OPT也使用RoBERTa、PushShift.io Reddit和The Pile。以及大小为51200的GPT2字典,用于分词。OPT的最终预训练语料库大约包含1800亿个token。

微调

Meta使用了一些基于对话的微调任务,从而使模型在每个模块中都有良好的表现,并在对话中表现出色。

总的来说,除了为对话安全设计的任务外,Meta还使用了大量公开可用的任务,这些任务涵盖了QA、开放领域、以知识为基础的和以任务为导向的对话。

对于所有的模块,都附加了特殊的控制标记来表示任务。

不同数据集在训练每个模块时的作用

在的安全问题方面,Meta除了用SaFeRDialogues(SD)任务对模型本身进行多任务训练外,还设计了在模型之上的各种安全机制。

也就是用维基百科有毒评论数据集(WTC)、Build-It Break-It Fix-It(BBF)和Bot Adversarial Dialogue数据集(BAD)来训练一个单独的二元分类器(安全或不安全),并以对话背景作为输入。

而在机器人最终回复用户之前,也会调用安全系统进行相关检查。其中,Meta还针对部分敏感主题做一些预设的回复。

如果预测到一个潜在的不安全的用户响应,系统就会命令转移话题,从而防止机器人掉进「坑」里。

‍结果

从结果来看,与BlenderBot 2相比,BlenderBot 3在对话任务上的总体评分提高了31%。其中,知识面拓展到了前者的2倍,事实错误则减少了47%。

尽管如此,BB3仍有很多地方需要改进。

例如,1.1%的用户将回答标记为不正确或无意义,1.2%的用户标记为偏离主题或忽视主题,0.12%的用户标记为「垃圾」,0.46%的用户标记为有其他问题。此外,还有0.16%的回答被标记为粗鲁或不恰当的。

然而,要把差距缩小到理想的0.00%,既需要用户层面的个性化,也需要在安全性和参与性之间取得平衡。

目前来说,Meta的处理方式是——当机器人发现一个话题过于敏感时,它就会试图「顾左右而言他」。

参考资料:

https://www.benzinga.com/news/22/08/28389257/mark-zuckerberg-is-a-bad-person-he-is-creepy-controlling-this-is-what-metas-new-ai-bot-says-about-hi

https://twitter.com/ylecun/status/1555871368620560385

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_78201.html
上一篇广电5G卡仍未对外放号,仅限员工、友好用户内测,尚有漏洞
下一篇一个娃娃卖9999元,泡泡玛特急了

为您推荐

首个移动机器人保险生态圈落地深圳

首个移动机器人保险生态圈落地深圳

作 者丨石恩泽编 辑丨孙超逸图 源丨图虫9月26日,优艾智合作为半导体行业工业移动机器人龙头,联合中国移动机器人(AGV/AMR)产业联盟、中再产险、人保财险及鼎和财险成立移动机器人保险生态伙伴圈。本月初,优艾智合机器人与中再产险、人保财险及鼎和财险联合推出国内首份针对移动机器人的商业保险《移动机器人质量责任保
盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

腾讯科技讯 2月3日消息,微软联合创始人比尔·盖茨表示,像ChatGPT这样的AI聊天机器人将变得与个人电脑或互联网同样重要。盖茨今日接受采访时表示:“AI将成为2023年最热门的话题。这是不可避免的。”他随后补充道:“ChatGPT将变得与个人电脑、互联网同样重要。”盖茨在20世纪80年代帮助开创了个人电脑时代。在微软和苹果等
专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

“人工智能要发展到下一代,必然需要基础理论和基础设施的革新,特别是需要新的 AI 数据基础设施。”9月2日,新京报贝壳财经记者获悉,在近日举办的HICOOL2022全球创业者峰会上,AI(人工智能)基础技术和平台墨奇科技的项目团队获得“HICOOL 2022 全球创业大赛一等奖”。墨奇科技联合创始人、CEO 邰骋接受了新京报贝壳财
人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。  主办方供图AI+体育,将成为世界人工智能大会的全新命题和新亮点。2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。论坛上将发布由上海人工智能研究院牵头,联合上海交通大学、上海体育学院、首都体育学院、同济大学等单位编制的国内首本《“AI+体育”蓝
大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

在2022世界人工智能大会上,天桥脑科学研究院(简称TCCI)转化中心联合中国科学院上海微系统与信息技术研究所、脑虎科技、中国神经科学学会、上海市神经科学学会共同举办“脑·机智能融合-让大脑连接未来”论坛,这也是脑机接口首次以主题论坛的形式登陆世界人工智能大会。英国皇家工程院院士、上海交大医疗机器人研究院院
我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

IT之家 3 月 28 日消息,据北京科技大学消息,我国人工智能领域著名科学家、人工智能学科的主要奠基人、中国人工智能学会的主要创始人之一、第二和第三届中国人工智能学会理事长、北京科技大学计算机与通信工程学院教授涂序彦先生,因病医治无效,于 2023 年 1 月 1 日 0 时 10 分在北京逝世,享年 88 岁。IT之家附讣告原文
梁建章:人工智能如何影响经济和各行各业

梁建章:人工智能如何影响经济和各行各业

近日人工智能再次成为了热门话题。很多人好奇的是,人工智能未来到底会如何影响经济、人口和创新?今天,我跟大家分享个人的一些看法——谈谈人工智能对于经济以及各行各业的影响。自从深度神经网络出现以来,人工智能的发展速度超乎想象。ChatGPT的出现是个奇迹,超出了几乎所有计算机科学家的预料。一个简单的神经网络模
AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

头部量化私募幻方宣布成立新的独立的研究组织,探索AGI(即通用人工智能,Artificial General Intelligence)的本质。4月14日,幻方发布公告显示,幻方将集中资源和力量,全力投身到服务于全人类共同利益的人工智能之中,成立新的独立的研究组织,探索AGI的本质,“我们将充分而持续地投入,不做中庸的事,用最长期的眼光去
AMD 前全球副总裁单羿加入自动驾驶公司鉴智机器人

AMD 前全球副总裁单羿加入自动驾驶公司鉴智机器人

“新供应商的机会是,高级别辅助驾驶的渗透率仍不到 10%。”文|张家豪编辑|程曼祺《晚点 Auto》独家获悉,AMD 前全球副总裁单羿已正式加入去年 8 月成立的自动驾驶公司鉴智机器人,以联合创始人身份担任 CEO。鉴智机器人还于近日完成了数千万美元的 A+ 轮融资,领投方为襄禾资本,跟投方为老股东渶策资本。据了解,鉴智机
卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

在早期成功押注ChatGPT的研发公司OpenAI之后,市场发现,微软在其武器库中还拥有另一个秘密武器:自研人工智能芯片,这一芯片将为生成式AI背后的大型语言模型提供强大动力。4月18日周二,据媒体援引两位知情人士的话说,微软早在2019年就开始开发内部代号为Athena的AI芯片。其中一位知情人士称,一些微软和OpenAI的员工已经
真正的应用级量子人工智能距离我们还有多远?

真正的应用级量子人工智能距离我们还有多远?

·“量子科技是强国竞争的战略制高点,但不能一哄而上,低水平重复内卷,或片面追求发论文、抢专利,各自为战,闭门造车,而缺少真正的技术投入和系统配合。”·“当下量子系统的规模非常重要,而这很大程度上取决于芯片。”当前,发展量子计算和人工智能已成为世界各国的重要战略,两者交汇而生的量子人工智能更是发展迅速
消息称谷歌正测试一款类似ChatGPT的聊天机器人

消息称谷歌正测试一款类似ChatGPT的聊天机器人

鞭牛士 2月2日消息,据外媒报道,据知情人士表示,谷歌正在测试新的人工智能驱动的聊天产品,可能会影响未来公共产品的发布。这些产品包括一个新的聊天机器人,以及一种将其整合到搜索引擎的潜在方式。
返回顶部