“人工智能(AI)训练师,通俗点儿说,就是对人工智能模型不停地训练、调整、培养,让AI更聪明。”
(资料图片)
“画一幅驴肉火烧。”
赵佳明在对话框里打出一行字,向生成式人工智能(AI)“文心一言”发出指令。
不到1秒钟,AI就给出了一幅画——一头驴,站在一簇火堆旁,火烧得很旺,火里烤着一块肉。
“你看,驴、肉、火、烧,4个要素全齐了,但这个结果让人哭笑不得。这就是最初的人工智能,还比较‘笨’,只能把你提出的几个元素简单机械地组合起来。而我们的工作,就是训练人工智能,让它越来越聪明,直到学会画出真正的驴肉火烧。”说着,赵佳明又向AI发出同样的指令。
这一次,“文心一言”给出了一幅烧饼里面夹着肉的图片。“这就是我们训练过的人工智能,聪明了很多吧!”
那是怎么个训练法呢?“就是将大量的文字、语音、图像打上标记,人工智能模型识别了这些标记,就能被训练出更强的分辨能力。”赵佳明又展示了一张人工智能识别监控的照片。监控画面中,一个人揪住另一个人的衣领在撕扯。赵佳明在图上打了一个标记——打架。然后将成千上万个类似的标记“喂”给人工智能,人工智能便形成了自己的认知——原来这个动作就是有人在打架。于是,监控中只要出现了衣领被揪住的场景,人工智能就会把这个行为认定为“打架”,还会报警。
作标记是最初级的训练工作。训练师每天要看成百上千张图片,为每张图片打上标记,记录下图中物品的特征,比如类别、颜色、形状……这些标记就是投给人工智能的“饲料”,标记的特征越多、越细,人工智能识别的精度就越高,最终给出的答案就越准确。
一个算法模型的训练,少则需要5000到1万张图片数据,多则要几万张甚至几十万张图片数据。
但是,人工智能总会存在错误、偏差,所以,赵佳明和同事们的工作,就是让它离完美更近一步。于是,更高级别的人工智能训练师会根据人工智能的表现,对它不断进行纠正、提升,令其快速迭代。这背后的一系列工作涉及模型、算法、算力……程序员们为此废寝忘食,写下不计其数的代码。
作为时下最具发展前景的行业,人工智能需要的人才也是海量的。
赵佳明更重要的工作是推进落地百度500万AI人才培养计划,打造一个AI人才培训平台。目前他们已与100多所高校合作,培养复合型人工智能技术人才,弥补国内AI人才缺口。百度与职业院校的合作,诞生了一系列接地气的案例,比如AI检测水蜜桃是否有缺损;鉴定紫砂壶的制作工艺是否有瑕疵;进行行人闯红灯的智能检测预警……去年,赵佳明的团队还参与研究了“AI螺蛳粉”,尝试使用百度AI优化螺蛳粉生产流程,解决螺蛳粉生产中的痛点。目前,百度已经培养AI人才超过300万人。