首页 > 科技 > 未来的人机交互如何落地?NVIDIA 研究团队给出了答案

未来的人机交互如何落地?NVIDIA 研究团队给出了答案

作者 | 程茜

编辑 | 漠影

对话式人工智能(AI)这个词听起来可能有些陌生,但它其实已经渗透到了我们生活的方方面面。语音助手、智能客服、聊天机器人等都是它的应用载体,涵盖金融、交通、通信、购物等多个领域。

随着技术发展和人们生活习惯的变化,对话式 AI 也在不断改变着众多行业,随之而来,企业对于对话式 AI 部署的需求激增。然而,对话式 AI 服务在开发、部署过程中,企业往往会面临很多难题。

如何拥有数据庞大且高度精确的训练模型?如何快速部署复用?如何保障用户的数据隐私和安全?都是横亘在企业落地对话式 AI 服务面前的大山。

因此,对话式 AI 这一浪潮正在席卷各行各业的背景下,NVIDIA 研究团队通过研发、实践,不断寻找助力企业落地对话式 AI 服务的新解法。

一、对话式 AI 正在拓宽人机交互的边界

NVIDIA 创始人兼首席执行官黄仁勋曾说:“对话式 AI 是终极 AI。”可以看到,对话式 AI 的出现与普及正在彻底改变越来越多的行业,如金融、电信等以对话为主要形式的通信即服务行业(UCaaS)。再加上新冠疫情暴发以来,灵活多变的混合办公模式兴起,线上场景下的对话需求越来越多,使得对话式 AI 的重要性逐渐凸显,但在人机交互的部署和实际效果上,企业仍面临许多难题。

首先,企业想要对话式 AI 的效果能够更加自然,就需要高度精确、经过预训练的模型和迁移学习,并且,“实时性”也是用户体验自然的一个关键因素,大多数人会在 100~120 毫秒左右感知到明显的通信滞后,因此实时交互需要精确到 100 毫秒以内。

其次,对于需要广泛部署对话式 AI 服务的企业来说,它们需要混合使用云、内部部署和边缘部署,并且将系统支持扩展到数十万并发用户中,这对于企业而言仍是一大难题。举例而言,平安科技原有的传统模式是单个服务器部署模型,但在实际场景下,每个智能客服的通话数量会发生变化,无法与业务需求量同步并进行资源调配,就使得部分业务空闲导致 GPU 资源浪费。

最后,备受用户的数据隐私和安全问题也是对话式 AI 开发的难点之一,例如在本地或可信任的云中进行安全数据处理。

即便有这些难题,但对话式 AI 正在席卷各行各业的浪潮不可阻挡。

二、端到端模型工具,GPU 加速运行

应用而生的NVIDIA 对话式 AI 架构 Riva,在解决上述难题时,就能为开发者提供经过预先训练的先进深度学习模型和软件工具,快速、高效地将算法模型应用到更多业务场景中,帮助企业创建面向不同行业的对话式 AI 服务。

Riva 采用了语音的端到端工作流,与传统语音识别系统不同,其只分为输入端的语音特征和输出端文本信息。

在语音和文字转化方面,Riva 包含自动语音识别(Automatic Speech Recognition,ASR)和文字转语音(Text to Speech,TTS)。

首先,Riva 提供的自动语音识别软件工具,可以针对不同领域或部署平台进行定制。

其次,Riva 拥有使用频谱图生成和声码器模型的类人文本转语音神经语音,并且其管道可以进行定制和优化,在 GPU 上实时高效运行。利用文字转语音工具,用户将原始文本输入,在流模式下生成音频块后立即返回,也可以在批处理模式下在整个序列结束时返回。

Riva 从模型到软件再到硬件全堆栈持续优化提供的增益是上一代产品的 12 倍,基于此,企业可以进一步提高自己对话式 AI 系统的准确性以及快速部署能力。

三、快速部署+优质效果,下载量已超25万次

作为企业满足对话式 AI 服务的有力武器,Riva 在帮助企业提高部署效率和服务效果中拥有以下几大优势:

1、预训练模型:十亿文本+六万小时语音数据

对话式 AI 往往需要高度精确、准确的训练文本,帮助 AI 理解文字和语音的意思。

Riva 提供的预训练模型,经过十亿多页的文本、六万小时的语音数据训练,并且还接受了不同的语言、口音、专业术语和环境上数百万个小时的 GPU 训练,这保证了其预训练模型的准确性。

2、实时交互:100 毫秒内轻松响应

在对话中,想要更加自然真实,低延时、实时交互是其中的关键。Riva 借助 GPU 加速,使得端到端语音流程运行时间可达到 100 毫秒内,也就是包括听、理解和生成响应在内的全流程速度,而正常人眨眼时间为 0.2~0.4 秒左右。

此外,Riva 还借助了适用于低延迟和高吞吐量通信的 gRPC 的微服务器,能够进一步减少识别时间。

3、拿来即用:几行代码就可成功部署

开发者在部署 Riva 时可使用 NVIDIA TAO 工具包,对不同行业、任务、系统的模型训练、适配和优化,并且还能使用自己的数据对模型进行微调,使其在实际场景中提供实时语音服务时能达到更稳定的效果。

值得一提的是,在部署 Riva 时,开发者不需要深度 AI 专业知识,只需要几行代码就可以成功部署模型。与此同时,Riva 还整合了 ASR、TTS、NLP(自然语言处理)三个智能算法引擎,使得企业的对话式 AI 服务能在技术底层上实现统一。

4、定制服务:不同专业+个性声音均可实现

不同于我们日常交流中常用的词语、句子,专业性较强的对话式 AI 就需要特定训练,才能与相关专业进行适配。Riva 自动语音识别管道就针对不同行业、领域的数据进行了训练,帮助企业进行个性化定制,并快速复用到实际应用场景中。

为了提高对话式 AI 服务的表现力,2021 年 9 月,Riva 还推出了定制语音功能,可以帮助企业在一天之内打造类似真人的定制语音,该功能支持微调口音、音高、声音细粒度等,Riva 2.0 也已于 2022 年 3 月已上线。

Riva 从 2020 年 5 月发布以来,截至 2021 年 9 月,已实现 25 万次以上的下载量,并广泛应用于视频会议、聊天机器人等场景。现在点击文末“阅读原文”就可以试用Riva的互动式Demo。

四、结语:掀起企业对话式 AI 应用落地潮

人工智能技术发展正在改变很多行业,对话式 AI 正在一些场景下取代人工客服,并且随着语音识别、语义理解等技术的发展,语音 AI 已经从“傻瓜式”、“机器人式”变得更加智能化,未来,更自然的人机对话可能会很快实现。

作为 NVIDIA 研究团队的重要成果之一,Riva 帮助企业构建可定制的对话式 AI 应用程序,将掀起对话式 AI 应用落地的浪潮。不仅如此,NVIDIA 的研究团队也在不断探索 AI 等前沿科技的新应用场景,在加快前沿技术落地的同时,为更多场景应用提供底层技术支持。

之后,我们还将陆续介绍 NVIDIA 研究团队推出的计算机视觉、深度学习模型以及有意思的交互式Demo,如 NVIDIA Audio2Face:仅需一个音频来源即可快速生成表情丰富的面部动画;NVIDIA Canvas:使用 AI 将简单的笔触变成逼真的风景图等。体验更多人工智能和深度学习互动 Demo,请复制https://t.cn/A6aDExGB到浏览器打开“NVIDIA AI 广场”。

声明:本文与 NVIDIA 产品相关的图片,版权均归 NVIDIA Corporation 所有。

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_70086.html
上一篇财富500强上的大佬变迁
下一篇相亲记|交友“流水线上”的都市男女

为您推荐

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

腾讯科技讯 2月3日消息,微软联合创始人比尔·盖茨表示,像ChatGPT这样的AI聊天机器人将变得与个人电脑或互联网同样重要。盖茨今日接受采访时表示:“AI将成为2023年最热门的话题。这是不可避免的。”他随后补充道:“ChatGPT将变得与个人电脑、互联网同样重要。”盖茨在20世纪80年代帮助开创了个人电脑时代。在微软和苹果等
英伟达:采用 RTX 技术的游戏和应用超 280 款

英伟达:采用 RTX 技术的游戏和应用超 280 款

IT之家 8 月 26 日消息,英伟达最新数据显示,二季度新增 30 款 RTX ON 游戏和应用,包括《瘟疫传说:安魂曲》、《鬼玩人:游戏版》以及《F1 22》,采用 RTX 技术的游戏和应用超过 280 款。英伟达表示,GeForce RTX 和 NVIDIA Studio 笔记本电脑的数量增加到创纪录的 180 多款,包括推出配备 GeForce RTX 3080 Ti 的笔记本
专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

“人工智能要发展到下一代,必然需要基础理论和基础设施的革新,特别是需要新的 AI 数据基础设施。”9月2日,新京报贝壳财经记者获悉,在近日举办的HICOOL2022全球创业者峰会上,AI(人工智能)基础技术和平台墨奇科技的项目团队获得“HICOOL 2022 全球创业大赛一等奖”。墨奇科技联合创始人、CEO 邰骋接受了新京报贝壳财
人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。  主办方供图AI+体育,将成为世界人工智能大会的全新命题和新亮点。2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。论坛上将发布由上海人工智能研究院牵头,联合上海交通大学、上海体育学院、首都体育学院、同济大学等单位编制的国内首本《“AI+体育”蓝
大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

在2022世界人工智能大会上,天桥脑科学研究院(简称TCCI)转化中心联合中国科学院上海微系统与信息技术研究所、脑虎科技、中国神经科学学会、上海市神经科学学会共同举办“脑·机智能融合-让大脑连接未来”论坛,这也是脑机接口首次以主题论坛的形式登陆世界人工智能大会。英国皇家工程院院士、上海交大医疗机器人研究院院
我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

IT之家 3 月 28 日消息,据北京科技大学消息,我国人工智能领域著名科学家、人工智能学科的主要奠基人、中国人工智能学会的主要创始人之一、第二和第三届中国人工智能学会理事长、北京科技大学计算机与通信工程学院教授涂序彦先生,因病医治无效,于 2023 年 1 月 1 日 0 时 10 分在北京逝世,享年 88 岁。IT之家附讣告原文
梁建章:人工智能如何影响经济和各行各业

梁建章:人工智能如何影响经济和各行各业

近日人工智能再次成为了热门话题。很多人好奇的是,人工智能未来到底会如何影响经济、人口和创新?今天,我跟大家分享个人的一些看法——谈谈人工智能对于经济以及各行各业的影响。自从深度神经网络出现以来,人工智能的发展速度超乎想象。ChatGPT的出现是个奇迹,超出了几乎所有计算机科学家的预料。一个简单的神经网络模
AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

头部量化私募幻方宣布成立新的独立的研究组织,探索AGI(即通用人工智能,Artificial General Intelligence)的本质。4月14日,幻方发布公告显示,幻方将集中资源和力量,全力投身到服务于全人类共同利益的人工智能之中,成立新的独立的研究组织,探索AGI的本质,“我们将充分而持续地投入,不做中庸的事,用最长期的眼光去
挑战英伟达?微软拟推AI芯片雅典娜:训练大语言模型,成本省三分之一

挑战英伟达?微软拟推AI芯片雅典娜:训练大语言模型,成本省三分之一

为突围芯片短缺困境,微软拟推出自研人工智能芯片。当地时间4月18日,据美国科技媒体The Information报道,微软(Microsoft)准备推出人工智能芯片,为负责理解和生成类人语言的大型语言模型(LLM)提供动力。两位直接了解相关项目的人士透露,微软自2019年开始开发内部代号为“雅典娜”(Athena)的芯片。据悉,微软已向一
卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

在早期成功押注ChatGPT的研发公司OpenAI之后,市场发现,微软在其武器库中还拥有另一个秘密武器:自研人工智能芯片,这一芯片将为生成式AI背后的大型语言模型提供强大动力。4月18日周二,据媒体援引两位知情人士的话说,微软早在2019年就开始开发内部代号为Athena的AI芯片。其中一位知情人士称,一些微软和OpenAI的员工已经
英伟达芯片一周涨了7万元!GPT带动涨价潮,主力芯片缺口达30万

英伟达芯片一周涨了7万元!GPT带动涨价潮,主力芯片缺口达30万

本文来源:时代财经  作者:谢斯临    图片来源:Pixabay ChatGPT爆火带动AI芯片需求飙升。截至上周五,英伟达最新发布的旗舰AI芯片H100在ebay上的售价超过4万美元一枚。相比此前零售商3.6万美元的报价,已提价明显。这一价格仍在持续上涨。4月19日,时代财经搜索eBay时发现,目前共有5家店铺挂牌销售H100芯片,售价普遍达
真正的应用级量子人工智能距离我们还有多远?

真正的应用级量子人工智能距离我们还有多远?

·“量子科技是强国竞争的战略制高点,但不能一哄而上,低水平重复内卷,或片面追求发论文、抢专利,各自为战,闭门造车,而缺少真正的技术投入和系统配合。”·“当下量子系统的规模非常重要,而这很大程度上取决于芯片。”当前,发展量子计算和人工智能已成为世界各国的重要战略,两者交汇而生的量子人工智能更是发展迅速
《刺客信条:起源》出现画面错误,英伟达和育碧互相甩锅

《刺客信条:起源》出现画面错误,英伟达和育碧互相甩锅

IT之家 9 月 13 日消息,育碧《刺客信条:起源》似乎遇到了一些画面问题,在部分英伟达硬件的设备上会有纹理闪烁、伪影等情况。此外,该问题似乎是由英伟达 WHQL 驱动 465.89 引起的,影响 RTX 显卡用户。然而,英伟达表示这个锅要育碧来背,而育碧反向指责英伟达没有做好适配。育碧在 Steam 社区论坛上首先做出了回应,主
英伟达正在“垄断”AI产业,国内厂商准备好了吗?

英伟达正在“垄断”AI产业,国内厂商准备好了吗?

“为了计算和人类的未来,我捐出世界上第一台 DGX-1 。 ”2016 年 8 月,英伟达创始人黄仁勋,带着一台装载了 8 块 P100 芯片的超级计算机 DGX-1 ,来到了 OpenAI 的办公大楼。在现场人员到齐后,老黄拿出记号笔,在 DGX-1 的机箱上写下这句话。与其一同前往的还有特斯拉和 OpenAI 的创始人,埃隆马斯克。这次 OpenAI 之行
返回顶部