首页 > 科技 > 新职业 新未来|人工智能训练师:我教AI如何“更懂”人类

新职业 新未来|人工智能训练师:我教AI如何“更懂”人类

智慧安防、智慧物流、智能交通……人工智能技术正让我们的生活更便利。而让人工智能(AI)“更懂”人类的新职业——人工智能训练师在当中起到十分重要的作用,相当于人工智能的教练。

人工智能训练师在2020年正式成为新职业并纳入国家职业分类目录。随着去年底该职业的国家职业技能标准颁布,业内开展职业培训和人才技能评价有了基本依据。人社部发布的报告显示,经测算我国人工智能人才缺口超过500万。近日记者采访了解到,在广东,人工智能训练师的需求旺盛,“现在有做AI的公司基本都有自己的人工智能训练师,随着人工智能在各个应用领域的不断拓展,数据标注员等工种存在较大的人才缺口。”业内人士说道。

新职业档案:人工智能训练师

使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。

主要工作任务:

1.标注和加工图片、文字、语音等业务的原始数据;

2.分析提炼专业领域特征,训练和评测人工智能产品相关算法、功能和性能;

3.设计人工智能产品的交互流程和应用解决方案;

4.监控、分析、管理人工智能产品应用数据;

5.调整、优化人工智能产品参数和配置。

训练:“喂数据”图片数以万计 还要避免AI“背题”

给人工智能“喂数据”,让其“长智慧”是人工智能训练师的主要工作。日前,记者在天翼数字生活科技有限公司见到了正在给人工智能“喂数据”的张力文,研究生毕业后他便进入公司从事机器视觉相关的算法研发工作,至今已有七年时间。

“我的日常工作主要包括人工智能需求分析、数据标注、算法开发以及算法调优等,其中数据标注和算法开发是最主要的工作。”电脑前,张力文向记者演示了一个火情识别算法模型的数据标注及模型训练的过程。只见他在电脑用标注工具将图片中的火焰逐一圈出来,并标注为“fire”,标注一定数量后将这些图片数据“喂”给人工智能学习,学习后进行测试,再逐张查看人工智能识别火焰的结果是否正确。张力文发现,人工智能将图片里的黄色盒子误判成“火焰”了,于是他把该黄色盒子重新标注为“非火焰”,对算法进行调优,再对人工智能进行迭代训练,如此往复……

每训练一次,系统会自动生成一次测试结果,在训练两三百次之后形成有多个指标结果的“loss曲线”图,loss值是判断“智能还是智障”的关键指标。“我们主要查看两个指标来判断人工智能是否需要重新学习。”张力文说,一般来说他们会查看人工智能“训练集”和“测试集”的正确率,如果训练集数据正确率高,但测试集的低,那么说明人工智能存在“背题”的情况,需要再次学习,如果两者正确率都高,说明人工智能已经“学会”。

张力文介绍,一个算法模型的训练,少则需要5000-10000张图片数据,多则要几万张甚至几十万张图片数据,“像目标检测一般一万张图片数据即可,但识别类算法,比如人脸识别,通常要几十万张图片数据。”不过在数据标注阶段,如今已有智能标注帮忙,训练师在智能标注后再进行个别的人工标注即可,大大减轻人工标注的工作量。这些图片数据如何来?张力文说,网上开源数据一般可满足人工智能的基础训练,但针对性训练的数据需要购买或搜集,有时候甚至需要他们自己拍摄。

经验:要有核心算法 还要“走出去”

张力文从小对数学、物理十分感兴趣,每天都会花很多时间钻研相关理论。2012年,张力文大学本科毕业,看到人工智能技术在国内兴起,诞生很多技术创新和应用创新,各种人工智能应用遍地开花,为此他决定继续攻读数字图像处理方向的研究生。

视联网明厨亮灶、平安慧眼、天翼应急、智慧商企……这些人工智能应用项目张力文都“经手”过。让张力文印象深刻的是他负责的第一个项目。当时他带领一支应届生团队研发智能相册,由于缺乏产品设计、架构设计以及算法工程化落地相关经验,尽管在启动研发前技术方案已经改了10个版本,但在研发过程中还是遇到了很多不可预知的漏洞及问题。“项目需要研发人脸识别以及事物分类算法,我们直接使用了开源算法,结果项目完成后发现,人工智能分析的结果简直不堪入目,相片分类有很多错误,可以说是‘人工智障’。”后来张力文跟团队经过多个版本的迭代优化,才正式上线商用。“这个经历让我刻骨铭心,这说明我们要不断提升技术能力以及累积项目经验。商用项目不能过于依赖开源项目,我们要有自己的核心算法,才能做得更好,走得更远。”张力文说道。

为了让人工智能“学得更好”,训练师有时候还要“走出去”调研具体的应用场景。比如明厨亮灶项目,要到厨房观察摄像头安装的位置和角度,摄像头拍摄的画面质量,厨房光线、摆放物品等。“我们都会做一些分析,分析会引起人工智能误判的因素。”张力文说道。

建议:求职者除了懂技术 更要懂行业

“一个新开发的算法模型需要大量数据训练,这个时候就需要人工智能训练师介入和参与。”天翼数字生活科技有限公司AI视联及行业应用事业部副总经理王艺指出,人工智能技术已经渗透到各个行业,包括工业、金融、教育、安防、市政、物流、交通等,这些行业对人工智能训练师都有着很高的需求。“现在有做AI的公司基本都有自己的人工智能训练师,随着人工智能在各个应用领域的不断拓展,数据标注和算法训练等工种存在较大的人才缺口。”

人社部2020年发布的《人工智能工程技术人员就业景气现状分析报告》指出,经测算我国人工智能人才缺口超过500万,国内的供求比例为1:10,供需比例严重失衡。不断加强人才培养,补齐人才短板,是当务之急。广州市人工智能产业发展促进会执行秘书长蔡远尘介绍,协会连续四年进行广州市人工智能大数据企业入库工作,目前已累计入库800多家,其中大部分企业都是应用型传统企业转型而来,对人工智能人才有大量的需求。

“找到合适的、了解某个应用领域的训练师还是很难。”王艺指出,人工智能并非一个单一的产业,而是一项跨行业的技术,“比如明厨亮灶的应用,需要针对厨房里不规范操作进行智能识别,这就需要了解食品安全相关规范的人员进行数据标注。所以,数据标注员要了解某个垂直行业的背景知识。”

作为企业管理人员,王艺建议求职者不仅要了解算法调优、数据清洗、标注等基础知识,还要了解不同应用行业的背景知识。“只有了解行业,才能真正知道哪些数据需要标注。训练师既需要有逻辑思维、理性分析,还要有敏锐感、发现数据的能力。”

“很多人认为人工智能可以完全替代人力解决所有的问题,但智能是一个不断优化的过程,需要人工辅助。”张力文建议,有意入行的求职者要注重提升自身基础理论以及工程实践能力,持续关注前沿技术的发展动态;其次要做好个人的职业规划,结合个人的兴趣以及特长,定位从事人工智能的具体领域或模块,比如机器视觉、自然语言处理、语音识别等,“做好定位后,要深入学习这些领域和分工涉及的软件、基本技能、数据处理常用手段等。”

策划统筹/赵亦平、何颖思

文/广州日报·新花城记者:何颖思

图/广州日报·新花城记者:骆昌威

视频/广州日报·新花城记者:骆昌威

广州日报·新花城编辑:叶碧君

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_151923.html
上一篇法媒:马斯克将恢复记者们暂停的推特账号
下一篇名创优品再致歉:曾进行“日系”品牌定位 国际签约场合悬挂日本国旗

为您推荐

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

腾讯科技讯 2月3日消息,微软联合创始人比尔·盖茨表示,像ChatGPT这样的AI聊天机器人将变得与个人电脑或互联网同样重要。盖茨今日接受采访时表示:“AI将成为2023年最热门的话题。这是不可避免的。”他随后补充道:“ChatGPT将变得与个人电脑、互联网同样重要。”盖茨在20世纪80年代帮助开创了个人电脑时代。在微软和苹果等
专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

“人工智能要发展到下一代,必然需要基础理论和基础设施的革新,特别是需要新的 AI 数据基础设施。”9月2日,新京报贝壳财经记者获悉,在近日举办的HICOOL2022全球创业者峰会上,AI(人工智能)基础技术和平台墨奇科技的项目团队获得“HICOOL 2022 全球创业大赛一等奖”。墨奇科技联合创始人、CEO 邰骋接受了新京报贝壳财
人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。  主办方供图AI+体育,将成为世界人工智能大会的全新命题和新亮点。2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。论坛上将发布由上海人工智能研究院牵头,联合上海交通大学、上海体育学院、首都体育学院、同济大学等单位编制的国内首本《“AI+体育”蓝
大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

在2022世界人工智能大会上,天桥脑科学研究院(简称TCCI)转化中心联合中国科学院上海微系统与信息技术研究所、脑虎科技、中国神经科学学会、上海市神经科学学会共同举办“脑·机智能融合-让大脑连接未来”论坛,这也是脑机接口首次以主题论坛的形式登陆世界人工智能大会。英国皇家工程院院士、上海交大医疗机器人研究院院
我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

IT之家 3 月 28 日消息,据北京科技大学消息,我国人工智能领域著名科学家、人工智能学科的主要奠基人、中国人工智能学会的主要创始人之一、第二和第三届中国人工智能学会理事长、北京科技大学计算机与通信工程学院教授涂序彦先生,因病医治无效,于 2023 年 1 月 1 日 0 时 10 分在北京逝世,享年 88 岁。IT之家附讣告原文
梁建章:人工智能如何影响经济和各行各业

梁建章:人工智能如何影响经济和各行各业

近日人工智能再次成为了热门话题。很多人好奇的是,人工智能未来到底会如何影响经济、人口和创新?今天,我跟大家分享个人的一些看法——谈谈人工智能对于经济以及各行各业的影响。自从深度神经网络出现以来,人工智能的发展速度超乎想象。ChatGPT的出现是个奇迹,超出了几乎所有计算机科学家的预料。一个简单的神经网络模
AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

头部量化私募幻方宣布成立新的独立的研究组织,探索AGI(即通用人工智能,Artificial General Intelligence)的本质。4月14日,幻方发布公告显示,幻方将集中资源和力量,全力投身到服务于全人类共同利益的人工智能之中,成立新的独立的研究组织,探索AGI的本质,“我们将充分而持续地投入,不做中庸的事,用最长期的眼光去
卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

在早期成功押注ChatGPT的研发公司OpenAI之后,市场发现,微软在其武器库中还拥有另一个秘密武器:自研人工智能芯片,这一芯片将为生成式AI背后的大型语言模型提供强大动力。4月18日周二,据媒体援引两位知情人士的话说,微软早在2019年就开始开发内部代号为Athena的AI芯片。其中一位知情人士称,一些微软和OpenAI的员工已经
真正的应用级量子人工智能距离我们还有多远?

真正的应用级量子人工智能距离我们还有多远?

·“量子科技是强国竞争的战略制高点,但不能一哄而上,低水平重复内卷,或片面追求发论文、抢专利,各自为战,闭门造车,而缺少真正的技术投入和系统配合。”·“当下量子系统的规模非常重要,而这很大程度上取决于芯片。”当前,发展量子计算和人工智能已成为世界各国的重要战略,两者交汇而生的量子人工智能更是发展迅速
返回顶部