ChatGPT背后竟藏血汗工厂!时薪不到2美元,员工遭受心理创伤

近期大热的AI聊天机器人ChatGPT被誉为当年最具创新性的人工智能工具之一,掀起了一场AI 狂欢,然而,该程式背后却有着鲜为人知的黑暗面。外媒爆出,为了训练ChatGPT,OpenAI雇佣了时薪不到2美元的肯尼亚外包劳工,他们所负责的工作就是对庞大的数据库手动进行数据标注。而这些劳工因长时间接触色情与残酷内容的字句文本,而留下心理创伤。

这让人们在欣喜AI 技术发展的同时,也不由思考,生成式AI炼成的背后是否会制造出更多的血汗工厂。

ChatGPT 智能化的背后:廉价的非洲血汗工

于2022年11月发布的ChatGPT被誉为当年最具创新性的人工智能工具之一。

这项强大的AI聊天机器人几乎可以生成任何问题的文本,从莎士比亚的十四行诗,到用5岁孩子都能理解语言描述的复杂数学问题,可谓「无所不能」。

瑞银此前发布的一份研究报告显示,ChatGPT的月活跃用户在今年1月份预计达到了1亿,这距离其推出只有2个月时间,成为史上增长最快的消费者应用。

然而,在ChatGPT掀起的这场人工智能「革命」和资本市场狂欢的背后,有一个被边缘化的、被遗忘的却又至关重要的群体,值得所有人关注,他们就是数据标注员 。这份工作除了薪资被剥削外,也需长时间接触性虐待、兽交、酷刑和乱伦等文本,因此留下心理创伤。

从当下看来,OpenAI已经成为「生成式人工智能」行业无可争议的领头羊。

最乐观的投资者认为,计算机生成的文本、图像、视频和音频将改变无数行业的经营方式,从创意艺术到法律,再到计算机编程,该技术都将提高人类的工作效率。

然而,数据标签员工的工作条件揭示了行业背后「黑暗」的部分: 尽管人工智能魅力无限,但它往往依赖于全球最廉价的劳动力,他们往往被大幅剥削。尽管他们为数十亿美元的产业作出了杰出贡献,但这些几乎「隐形」的工人仍然处于最边缘的地带 。

时薪仅2 美元的数据标注员,清除暴力、歧视等言论

据美国《时代周刊》上月中旬的报导,为了训练ChatGPT,OpenAI 从2021 年11 月雇佣了时薪不到2美元的肯尼亚外包劳工,他们所负责的工作就是对庞大的数据库手动进行数据标注。其中大部分文本似乎从暗网中提取,内容包括儿童性虐待、兽交、谋杀、自杀、酷刑、自残和乱伦等可怕内容。

《时代周刊》查阅的文件显示,OpenAI在2021年底与Sama签署了三份总价值约20万美元的合约,为数据库中有害的内容进行标记。

Sama是一家总部位于旧金山的公司,在肯亚、乌干达和印度雇用员工为Google、Meta 和微软等矽谷客户标记数据,并自诩为一家「有道德的AI」公司,并声称已帮助50,000 多人摆脱贫困。

然而事实却是,Sama 在训练ChatGPT 的项目中,大批雇佣了时薪不到2 美元的肯亚劳工,他们所负责的工作是对庞大的数据库手动进行数据标注。据《时代杂志》采访的三名员工表示,他们在9 个小时的工作时间内,要阅读和标注150~200 段文本,这些文本的范围从100 个单字到1000 多个单字不等;计算后,平均每小时他们最多要阅读和标注超过2 万个单字。

另《时代杂志》 在审查了内部文件后指出,OpenAI 在2021 年底与Sama 签署了三份总价值约20 万美元的合约,专为性虐待、仇恨言论和暴力等恶意内容进行标记;合约规定,OpenAI 将为该项目向Sama 支付每小时12.5美元的报酬,但数据标注员的实际时薪却仅有 1.32 美元至2 美元之间,具体时薪取决于资历和表现。

据Sama员工透露,「代理商」是三个小组中最初级的数据标签人员,他们的基本工资为每月2.1万肯尼亚先令(约170美元)。此外,他们每月还能获得约70美元的奖金,如果达到准确性和速度等关键绩效指标,他们还可以获得佣金。

按此计算,一名每天工作9小时的员工预计税后时薪至少能拿1.32美元,如果超额完成所有目标,则最高可达到1.44美元。质量分析师是资历更深的数据标签员工,他们的工作是检查「代理商」的工作,如果他们达到了所有绩效目标,时薪可以拿到2美元。

公开资料显示,肯尼亚并没有统一的最低工资标准,但当这些外包员工受雇时,肯尼亚首都内罗毕的最低时薪是1.52美元。

据《时代周刊》报导,Sama的一名发言人在一份声明中称,公司对工人的要求是在9小时的工作中标注70段文字,而非200段。此外,工人们的税后时薪是1.46美元~3.74美元,不过这位发言人拒绝透露哪类岗位会达到其所述时薪区间的上限。

OpenAI的一位发言人则在另一份声明中称,该公司没有发布任何的业绩目标,且外包员工的工资和心理健康由Sama的管理层负责。

员工心理创伤严重,心理治疗师形同虚设?

《时代杂志》 也采访了参与ChatGPT 项目的四名Sama 员工,这些员工都表示,该工作给他们留下了持久的心理创伤。

有一位负责为OpenAI 阅读和标记文本的工作人员告诉记者,他在阅读了一名男子在幼儿在场的情况下与狗发生性关系的文本后,反覆出现幻觉。他表示:

那是一种折磨,整个星期你都会读到很多这样的内容,周五放假的时候,你会因为想到那张照片而感到不安。

尽管他们有权参加健康咨询师课程,但四人都表示,由于对工作效率的要求很高,他们只能选择参加小组会议。其中还有一人表示,他们要求以一对一的方式与心理咨询师会面的请求,被Sama管理层多次拒绝。

OpenAI 与Sama 结束合作

2022年2月,Sama开始为OpenAI的另一个项目进行试点工作,但工作内容根据美国的法律是非法的。尽管这项试点工作似乎与ChatGPT无关,但仅仅在几周之内,Sama便叫停了与OpenAI的所有项目,比合同中约定的时间提前了8个月。

Sama当时在一份声明中称,其为OpenAI收集的图像协议中不包括任何涉及非法的内容,直到相关工作开始后,OpenAI才发来「附加指示」,提到了「一些非法的类别」,随后肯尼亚团队的高管立即提出了担忧并结束了该项目。

ChatGPT 闪耀的背后是依赖全球最廉价的劳动力,这些数据标注员被大幅剥削且留下精神创伤,却鲜为人知,近期才藉由OpenAI 与Sama 的事件,顺势揭露人工智能仍须依赖大量劳动力的黑暗事实。

AI 模型内的歧视与偏见

由于运算愈来愈便宜、搜集资料成本和难度愈来愈低,再加上演算法的进步,这些因素都让人工智能的威力大幅上升,产出的模型连带增强许多,无论是以文生图的Midjourney、DALL·E 2,还是能够跟人类对话的ChatGPT,都受益于上述趋势,有着令世人惊艳的表现。

不过,因为人工智能模型需要经过反覆训练,迭代测试后不断改善,这个过程大幅仰赖训练集的资料,而这些资料又是出自于人类的日常生活当中,因此产出的服务,无可避免会复制人类社会中常见的偏见。

例如,Google搜寻有过在自动完成建议(autocomplete suggestions)中特定族群与负面形容词绑定的纪录,又或者是搜寻特定职业如医生的图片时,白人男性出现的照片不成比例地高,隐含医生都是白人男性的刻板印象,忽略早就有许多女性与多元种族担任医生的事实。

另外,2020年韩国企业Scatter Lab曾推出聊天机器人Iruda,2016年微软也介绍了聊天机器人Tay,两款人工智能服务都会从与使用者的对话中学习,改善自己的表现。然而,正因为这个特点,聊天机器人上线没有多久,很快学会了种族歧视与性别歧视,甚至会讲仇恨言论,Scatter Lab和微软都在问题爆发后无奈将机器人下架。

为了避免出现上述情形,企业们也用各自的方式改善问题,例如请研究人员开发在模型中减少偏见,甚至全面消除歧视的方法,又或者从源头解决—也就是从训练资料下手,根本性的排除问题。

生成式AI炼成的背后令人担忧

ChatGPT的前身GPT-3已经展示了非常强大的语句串联的能力。然而,当时的GPT-3却存在很多弊端,例如内容容易出现暴力、性别歧视等言论。之所以会出现这样的不足之处,是因为AI工具从互联网抓取了数千亿个单词来训练,这也是一把双刃剑——由于互联网的词汇有不少带有偏见及负面的词汇,因此单纯凭借学习能力无法来清除这些训练数据。

《时代周刊》的报导显示,即使是一个由数百人组成的团体,也需要几十年的时间才能手动搜索庞大的数据库。OpenAI只能透过建立一个额外的、AI驱动的安全机制,才能控制上述弊端,创造出适合人们日常使用的聊天机器人。

据报导,为了建立这个安全系统,OpenAI借鉴了Facebook(现Meta)等社交媒体公司的做法。此前,Facebook已经证明其可以构建能够检测仇恨言论等的AI工具,并将这些内容从其平台上移除。这项工作也很简单:给AI提供标有暴力、仇恨语言等标签,AI工具就可以学会检测这些内容。目前类似的工具已经内置到ChatGPT当中,以检测它是否与训练数据的内容相呼应,并在它触及到用户之前将不良内容过滤掉。

《时代周刊》报导称,为了获得这些有害内容的标签,OpenAI从2021年11月开始便向一家外包公司发送了数万条文本片段。其中大部分文字似乎都是从互联网「最黑暗的角落」挖掘出来的。

据报导,OpenAI发言人曾在一份声明中证实,Sama在肯尼亚的员工为该公司正在开发的监测有害内容的工具作出了贡献,该工具最终被内建到ChatGPT中。

除了OpenAI,Sama还为谷歌、Mate和微软等矽谷科技巨头标注数据。此外,Sama还标榜其是一家「有道德的人工智能公司」,并称其已经帮助5万多人脱贫。

人工智能组织联盟Partnership on AI表示,「尽管这些丰富数据的专业人士发挥了基础作用,但越来越多的研究表明,这些工人都面临着不稳定的工作条件。这可能是庆祝技术效率提升的同时,试图掩盖人工智能对庞大劳动力依赖的结果。」

本文链接地址:https://www.wwsww.cn/yuanyuzhou/16185.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。