实地探访河南AI村:给人工智能贴标的新富士康工人 河南AI村,工智能,富士康工人 · IT界

创业故事 阅读(1393)

对河南AI村的实地考察:贴有人工智能的新“富士康工人”

在中国的小城镇中,无数的年轻人正在成为“数据标记者”,他们每天坐在计算机前八个小时,然后单击数十张照片以概述背景,前景和特定项目。他们的工作为AI算法提供并处理了大量数据。

周俊凯的办公室位于东沙河边缘。它是一条安静的河流,将中国中部河南省318,000人口的小县城中民权县的新旧部分区分开来。 19岁的周俊凯和他26岁的堂兄在这里于今年夏天共同建立了他们的小型数据标签工厂。

他们成立的“君鹏科技公司”办公室是一个典型的河南乡村,位于一所租用的传统四合院中。这房子很大,高两到三层,与中国大城市无处不在的公寓楼不同。在房子后面,一个男人在一块土地上舔树叶,周说这片土地是农作物。

周俊凯(右)和他的表弟

在室内的唯一温暖的房间是办公室,十几个年轻人坐在大屏幕照亮的屏幕前。顶楼照亮的房间,窗外是大自然。3座屋。1座大房子,1座小房间。2。3.。1。1。1。1。1. 3。1。1. 3。2; 3. 2。3。2?2!3。2?。。。。。。。。。。。。。或者;的。。。。。在11月的某一天,屏幕和荧光灯几乎无法照亮整个房间,当地的污染水平阻挡了阳光,到处都是浓雾。

“俊鹏科技公司”员工

这些年轻人是“数据标记者”,他们每天坐在计算机前八个小时,然后单击数十幅概述背景,前景和特定项目的照片,这些照片均基于正在接受人工智能的客户规范。有些人可能会标记医学扫描照片,有些人会标记风景和树木的照片,而另一些人会标记无人驾驶车辆的道路图片。这些是人工智能算法学习“看到”的数据。

人工智能产业依赖这种廉价劳动力,因为算法和“机器学习”在许多情况下都是由真人训练的。

人工智能需要大量的数据来学习和识别模式,无论是图片、音频还是文本,因为它们不同于人类的解释媒体。为了教会算法如何准确识别苹果是一个苹果,它需要成千上万的苹果图片。此外,该算法容易上当受骗。在一项实验中,安全研究人员发现,通过扭曲校车图片,人工智能系统再也不能认识到这是校车,即使人眼看不到变化。

很少有地方比河南更能吸引资金流入中国的人工智能产业。几年前在河南富士康工厂(生产苹果产品)和电子工厂就已经知道了,河南的城镇现在有了办公室工作人员,他们无聊的输入,让电脑变得智能。

研究公司aib的研究显示,去年,风险投资家向中国的人工智能初创企业投资了50亿美元,使该行业的资金首次超过美国。中国政府已将人工智能行业列为优先领域,并于去年夏天宣布了一项雄心勃勃的政策:到2030年,建设1500亿美元的人工智能产业。

在推动中国经济发展的制造业工厂中,河南人也发现自己处于日益增长的劳动密集型数据标签公司的边缘行业,这些公司为算法提供和处理大量数据。除了中国最大城市的几家大公司外,这些数据主要分布在较小的城市、城镇和农村地区。

周俊凯在平顶山镇看到一些类似的数据工厂后,就想到开店。他的堂兄弟姐妹拿出多年积蓄(4.5万美元),买了几十台电脑,租了办公室。据他们所知,他们是民权县唯一从事这个行业的人。

“你不能指望工资这么高的人能完成这份劳动密集的工作。”

从贸易学院毕业后,周俊凯开始进入这条线。他以前一直在找工作,但受到限制。

19岁的周俊凯来自河南民权县的一个村庄。他说,从商学院毕业后,他没有太多的工作选择。

他说:“如果您不知道将来要做什么,您可以去一个大城市,成为白领,然后每天挤地铁去挤公交车。”至于其他领域,如果要取得成功,就需要大量的知识,经验和教育。而这些是我们所没有的。”

他很难找到汽车修理工的工作。他说他已经在工厂辞职了很短的时间。工作太辛苦了,一天要花14个小时。

他说:“我以为我再也受不了了,但是,目前正在运转的行业感到它有潜力。”

韩金浩(Jinhao Han)说,现在有很多人涌向数据标签行业。一年多以前,他在河南省省会郑州开设了数据标签公司Dianwokeji(技术点),目前拥有100多台数据标签机。

“尽管贴标是一项低水平的工作,但进入门槛相对较低,并且仍然属于人工智能行业。”他说,“因此,我们认为,如果我们可以从这里开始,那么就应该慢慢地逐步走下去。高价值的东西。”

Han拥有6,000多个数据标签设备,这些设备已在他建立的Craigslist平台上注册,较小的公司寻找外包或雇用新员工。

赵梦瑶(18岁)是新手。她于今年10月开始在公司工作。当我访问办公室时,她正在跟踪停车场停车位的白线:图片失真,线条弯曲,就像相机的鱼眼镜头一样,但是她很容易将鼠标放在上面。 20分钟后,赵梦瑶继续处理她的下一张照片。这是停车场另一个角度的照片。

年轻的女孩正在学习如何给汽车贴标签

在她旁边,一个年轻男子正在画歌手所穿橙色衣服的蓬松边缘。接下来,他开始绘制高尔夫球手的轮廓。

赵梦瑶曾经是一家婚纱摄影工作室的化妆师,但由于工作累而辞职。几天后,她必须在凌晨4点起床为客户的拍摄做准备,而且她只能在晚上7点回家。

她对当前的工作节奏非常满意:8到6晚,休息一个半小时。在午餐时间,她和她的同事们可以聊天,谈论他们一起玩的游戏。

她说:“我认为这很好,很免费。”

赵说,薪水仍然可以是:每套照片(约20张)可以拿到约20元钱。她每天可以完成4至8组或80至160张照片。当我问她,她认为照片会去哪儿以及那是什么时,她不知道。

我与之交谈过的七个数据标签商的月薪从2000元到4000元不等。这相当于中国工人的平均可支配收入或税后收入。 2017年为2164元。 “郑州有很多工作可以拿到这样的薪水。”现年25岁的技术员王玉双说。

我的大多数员工都只有20多岁。

人工智能照片识别教学的标准是使用ImageNet的图像,这是由斯坦福大学教授李菲菲及其团队创建的1400万幅图像的数据库。该数据库依赖于Amazon的Mechanical Turk,后者将劳动密集型工作(如照片标记)外包给互联网用户,费用为几美分/人。

但是,随着全球公司越来越多地将人工智能应用从无人驾驶汽车到医疗诊断程序,ImageNet和Mechanical Turk已被证明是不足够的。

您认为我们会让无生命的事物控制人类吗?

数据标签公司Awakening Vector的创始人彼得杨(Peter Yang)说:“医疗业务需要非常详细的数据,以使人工智能学习如何发挥作用,例如区分CT扫描中的肿瘤和眼球。”它需要很多不同的照片,数据用于指示照片中的肿瘤是什么样,需要手动单击和注释。

“但是大多数人工智能初创企业只有几个全职员工,通常是数据科学家。”

“这需要大量的体力劳动。您不能指望收入如此之高的人从事这种劳动密集型的工作,因此您必须将这项工作外包。”

此外,还有隐私和质量控制问题。

例如,医学图像需要保密。亚马逊土耳其突厥(13.810,-0.11,-0.79%)(Amazon Mechanical Turk)任务是由任何希望赚取额外收入的注册用户完成的,而不是周一至周五有固定薪资的用户。

外包意味着这些业务现在在全国各地蓬勃发展。

彼德杨的业务集中在新疆,其客户包括百度和跨国制药公司诺华。韩金浩的公司为一些国内无人驾驶汽车初创公司提供服务,并在河南和邻近的山东省设有分支机构。

传统观点是,随着技术的进步,那些“低技能”的工人将失去工作。大多数学术研究也支持这种观点。

但这并不意味着技术将必然取代所有工作。

波士顿大学技术与政策研究计划执行主任詹姆斯贝森说:“历史研究表明,自动化创造了就业热潮。”

“例如,在19世纪初期的纺织工业中,由于面料太贵,大多数人只有一套衣服。但是随着技术的发展,一些任务变得自动化了,从而降低了制衣成本和对面料的需求。它也在增长。服装需求的增长带来了更多的就业机会。尽管纺织业被认为是“低技能”产业,但随着规模的迅速扩大,它已经带来了新一代的工人。不要学会操作复杂的机械。只有满足需求后,就业人数才开始下降。”

目前,我们的劳动力仍然很便宜。

这项工作还超出了图像注释的范围。许多公司还为语音识别,视频标签甚至原始数据付费。

对于某些工人来说,加入新行业显然是一种骄傲。

“我们正在做一些非常基础的工作,尽管我们只是在帮助机器人学习和查看大量数据,但我们还是其中非常重要的一部分。”

因此,如果有一天该算法学会了自己识别事物,那么将有成千上万的“低技能”人工智能人员失业?

韩进豪似乎对此无动于衷:“如果真的在那个阶段,那么人类可能就不会生存。您是否认为人类会让没有生命的事物控制人类?我们只会教如何为人类服务。我们不会他会教得很好,以至于有一天我们将为机器服务。”

资料来源:主板