深度报告|AI新职位“人工智能训练师”

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

深度报告|AI新职位“人工智能训练师”

1-3岁的互联网人是人工智能训练师的主要来源,而人工智能产品经理将会是最合适的上升职位。研究背景有人说,“人工智能训练师”是AI给人类带来的第一个非技术类“新职位”,这也许能让大家对AI多一些客观认知、甚至是好感;不过这个新职位,AI领域从业者的认知度还不高—— AI公司为什么要设立这样一个职位职责边界是什么什么样的人适合职位发展前景如何等等问题,都还是业内空白,为此我将在正文中为大家一一揭晓。核心结论人工智能训练师的定义:通过分析产品需求和相关数据,完成数据标注规则的制定,最终实现“提高数据标注工作的质量和效率”以及“积累细分领域通用数据”的价值。人工智能训练师的行业认知度:开始得到杭州、北京等城市2年以上AI 公司的重视,考虑到人工智能训练师的人才缺口5年后将增长20倍以上,该职位将会愈加受到各家AI公司的重视。人工智能训练师的职业规划:1~3岁互联网产品经理最有可能成为人工智能训练师的主要来源职位;而AI产品经理将成为最合适的上升职位。目录人工智能训练师的产生背景人工智能训练师是什么人工智能训练师的人才缺口人工智能训练师的职业规划结语一、人工智能训练师的产生背景一般而言,AI公司从客户(用户)那里获取到的原始数

据无法直接用于模型训练,在“人工智能训练师”出现以前,是由AI产品经理先用相关工具简单处理,再交给数据标注人员进行标注加工,但因为标注人员对数据的理解和标注质量差异很大,导致整体标注工作的效率和效果都不够理想。同时,AI公司在其细分领域内积累了大量数据,这些数据往往在使用一次后就不再产生更多价值,随之带来了第二个问题,数据无法沉淀和复用。基于这两个问题,“人工智能训练师”应运而生。注:“人工智能训练师”这个职位,据说最早是由BAT某部门在2年前创造的。二、人工智能训练师是什么?1. 定义人工智能训练师,是通过分析产品需求和相关数据,完成数据标注规则的制定,最终实现“提高数据标注工作的质量和效率”以及“积累细分领域通用数据”的价值,从工作流和工作难度等角度看,它介于数据标注和AI产品经理之间。2. 工作职责人工智能训练师的工作职责,主要有以下三点:提供数据标注规则:通过算法聚类、标注分析等方式,从数据中提取行业特征场景,并结合行业知识,提供表达精准、逻辑清晰的数据标注规则,最终确保数据训练效果能满足产品的需求;数据验收及管理:参与模型搭建和数据验收,并负责核心指标和数据的日常跟踪维护;积累领域通用数据:根据细分领域的数据应用要求,从已有数据中挑选符合要求的通用数据(适用于同领域内不同客户/用户),形成数据的沉淀和积

累。注:在不同公司,人工智能训练师的职责具有一定差异性,比如有的偏重前期的数据挖掘和模型训练,有的偏重后期的产品运营和产品体验。3. 职位辨析(一):人工智能训练师和数据标注、AI产品经理的异同1)人工智能训练师和AI产品经理的异同人工智能训练师需要和AI产品经理讨论需求,进而制定数据标注规则,并提出产品体验优化建议。2)人工智能训练师和数据标注的异同人工智能训练师需要和数据标注人员紧密协作,把控好整个流程的输入规则和输出结果,最终输出标注准确的数据(供模型训练)。3)人工智能训练师的工作流程图:下图,展示了人工智能训练师和数据标注、AI产品经理协作的工作流及其每个节点的交付物。不难发现,人工智能训练师在数据标注和AI产品经理之间,起到桥梁的作用。注:人工智能训练师的工作交付物“数据标注规则模板”,可见完整版深度报告(下载方式见文末)。(二):人工智能训练师和初级互联网数据产品经理的异同1)两者工作职责的主要区别在于“积累细分领域通用数据”,这项工作将为公司创造新的价值,比如:大大减少后续标注人员的工作量,提升业务的接入速度和效率。逐步建立细分领域的行业壁垒。总之,由于一般的数据不能全领域通用,所以不同应用场景下,细分领域通用数据少的问题,将成为整个行业的痛点和机会。2)在AI工作场合,原本由初级互联网数据PM完成的

“贡献数据采集标准、打通数据资源、数据应用的推广”等工作,并没有交给人工智能训练师,而是由更适合的AI产品经理完成,原因在于这部分工作更偏重前端的需求和推广(AI产品经理更熟悉和擅长产品体验及流程)。4. 能力模型基于人工智能训练师的工作职责,需要具备哪些能力呢?通过调研分析,我们总结出了如下的能力模型:数据能力:了解科学的数据获取方法论,能运用数据处理工具(如Excel等),逻辑思维强。行业背景:熟悉公司行业领域知识,特别是语言或图像方面数据的特点。分析能力:基于产品的数据需求,及时发现、提炼问题特征,产出优化方案和建议。沟通能力:具备较强与不同岗位同事同频交流的能力,能通俗易懂的阐释专业术语信息。AI技术理解力:能够厘清基本的AI概念,并了解其技术边界(能做什么和不能做什么)。AI行业理解力:具备AI行业知识(如了解行业术语)或相关产品运营经验,在此基础上能够预判行业趋势、深挖场景痛点、设计AI方案。三、人工智能训练师的人才缺口1. 当前人才缺口暂未形成明显的人才缺口,因为一方面,大部分公司都是近期才开始设立这个职位,人才需求量不多(不超过三位数);另一方面,目前大多数人才需求,通过公司内部运营人员转岗和外部招聘就能满足。1)人工智能训练师的职位画像工作经验:大公司的要求明显高于创业公司,一般在三年以上工资范

围:主要集中在8k以下2)人工智能训练师的公司画像发展较为成熟的智能客服类公司,对于人工智能训练师的需求量明显领先于其它行业。出人意料的,杭州AI公司表现出了更高的敏锐度(有4家公司,和北京并列第一),背后原因可能是政府的大力推动——根据2017年11月杭州人社局发布的相关政策,人工智能训练师不仅被纳入杭州市专项能力考核项目,而且获得高级专项能力认证的人工智能训练师将有机会申请公租房及杭州落户加分等政策福利。(原文链接:《杭州人社局:人工智能训练师将有机会享受落户加分等福利》)成立2年以上的公司(73%)更需要人工智能训练师,一般情况早期创业公司侧重搭建产品技术框架、验证解决方案和商业模式,没过多精力放在“提升效率”或“积累细分领域通用数据”上,所以“人工智能训练师”对于需控制团队规模、降低管理成本和风险的早期创业公司而言,非必需单独拆分的职位。已上市和A轮的公司,相对而言对人工智能训练师的需求量更大。另外需要说明的是,按道理CV(计算机视觉)领域也有数据标注工作,但我们搜索了10多家(计算机视觉)领域公司的招聘页面,暂时都没有发现人工智能训练师的需求,这可能是因为相对“标注语料数据”,“标注图像数据”更简单,主要找外包公司即可完成。注:以上结论,来自对15家公司职位描述信息的分析汇总。2. 未来人才缺口1)未来5年人才

相关文档
最新文档