QQ泡沫乐园 · 免费提供游戏辅助,破解软件,活动资讯,喜欢记得收藏哦!
综合软件_线报活动_游戏辅助_最新电影_最优质的的辅助分享平台

一个框就是3分钱,二十几个点挣一到钱两角

网络 2023-01-29 17:05

作者/ 刘鑫

编辑 / 园长

刺猬公社(ID:ciweigongshe)和何信通话的时侯,他正在做数据标明的工作。

电脑屏上的图片里,三三两两的人在操场上,或是在呼啦圈,或是在围观。何信要做的是用键盘将正在呼啦圈的人框下来。“说出来你可能都不相信,就是画这一个框。”何信解释道,“好比你如今打开笔记本,然后摁住滑鼠右键拉一下,在桌面上就是一个框就是3分钱。”

何信在做数据标明工作,何信供图

何信做数据标明的工作有一年多,他自己创立了一个创业小团队,团队里有十几个人。他们的项目涉及百度、网易、阿里等互联网大厂,他也做细致的“打点”工作,类似一个鞋的边框打点一周,二十几个点,挣一到两角钱。

“阿里众包、京东微工、百度众测、有道众包……”市面上这样的产品有很多,利用碎片化时间获得收入、操作简单无门槛是它们最主要的卖点。这类互联网大厂推出兼职平台,主要以众包的方式给用户分配任务,用户通过完成任务来获得酬劳。但相较这种大厂的著名产品而言,兼职平台们的下载量并不高。

刺猬公社查询产品下载量统计平台七麦数据后发觉,AppStore中阿里众包、京东微工、百度众包等三款产品,近30日日均下载量未超过2000。

从产品数据上看,互联网大厂的兼职App只能说不温不火。在灵活用工、兼职经济高度发展的当下,这类兼职App为何没做上去?都是谁在做这份工作?

1

收益太少,羊毛难薅

互联网大厂出品的兼职APP中,运作流程是:平台发布任务,用户发放任务初验后获得利润。综合各平台来看,主要有数据标明、数据采集、数据转写工作。细分到具体领域,又分为文本、图片、语音、视频等部份的信息处理。任务的价钱通常在0.1元到几十元不等。

放弃倒不是由于钱少,而是由于这份工作过分机械化,重复性劳动让李元很不适应。他学院读的是电子信息工程专业,毕业后工作也比较悠闲。出于挣钱和打发时间的目的,李元下载了这款众包类型的软件。

要吃米,找万里;要吃粮,找紫阳_要吃粮找紫阳,要吃米找万里_我要找标准网 验证码错误

众包,通俗来讲,就是从大众哪里找寻资源。它原意是指一个公司或机构把过去由职工执行的工作任务,以自由自愿的方式外包给非特定的(而且一般是小型的)大众志愿者的做法。

以易迅微工的数据标明为例,在最新一期的任务里要求对文本进行情感判定,根据自己的认知选择文本是正向、中性还是负面。该结算两分一条,以10条为结算单位,要求正确率100%。

图源:京东微工

数据采集通常为音频、图片、视频方面的采集,周舟热衷于做数字采集方面的工作,2019年中学毕业后,他开始尝试这方面的兼职工作。两年的时间,他陆陆续续赚了3000多。“我也没有天天去看,阿里众包在年终、年初、年底的任务好多。”

在每位任务里,都有明晰的要求,周舟觉得这样很明晰,可以很快地区分什么好做什么不好做。

图源:阿里众包

相比于数据标明、采集方面的工作,数据转写的门槛稍稍高些。所谓的数据转写,主要是各类语言转译工作,比如,在有道众包的少儿英语段音频转写里,要求口误重复、语法错误等如实转写,这对于答题者的英文水平要求不低。

图源:有道众包

为了确保用户所递交产品的质量,除了在递交内容上有所要求,在用户递交前也有所培训。周舟以前做过这类型的试题,做完20道题,正确11道,他得出了推论——裸考必挂。

李元出席这些考试,也没有一次就过的情况,“这种题目须要耐心和比较饱满的语感,而我是那个粗枝大叶的人,而且多次失败以后带来的挫败感太糟糕了。”

等平台发任务——做任务——等平台初审是这类众包软件使用的常规流程,而在这种流程里有任何一个环节相悖,都会带来不好的用户体验。

下载软件发觉无任务可做,做任务时发觉门槛过低,任务完成发觉初审太久,审核后发觉正确率不合格……在这条任务链里,用户会遭到各样的问题,有网友在五个任务都初审失败后发文称“费力不讨好。”

部分平台初审不合格后,价格会打折扣。但还是有人赚到钱了,在有道众包的3月报酬排行榜上,第一名报酬1945.99元。周舟对于自己两年多攒的3000多元表示满意,“因为目前还是在校生,没有工作。”

“一小时10元吧。”何信评估了一下做众包工作的平均酬金。

2

用户下沉,也在内卷

兼职众包的平台用户,有一种团队化的趋势。

就目前市面上的众包产品来看,任务好多是不定期推送的,新用户注册后平台上有可能面临无任务可领的情况,而相较于加帮会做团队而言,普通用户赚的钱是极少的。

而这份工作的主力,互联网大鳄们可能也并没有瞄准客户端的普通用户。据何信了解,向他这样做团队接项目的同行有不少,在平台活跃着的也有很大部份是像她们这样的团队。

相比于单独个人当兼职做,团队化容易的多。价格在近年也有了不小的变化,以前价位很贵,现在的价钱越来越低,由此带来用户的不断往下沉淀。何信表示用户下沉是要找实惠的劳动力。

2016左右,那时候做数据标明的人还不是好多,何信说那时候价钱是目前两到三倍,画一个框大约七八分钱。

“以前做的人少就赚钱,现在做的人多了就不值钱了,就这个意思。”兼职众包的用户们,也在不可避免地遭到内卷。

在何信团队里,一个成熟的职工一小时能画600个框,按照一个框3分的标准,能赚18元。“但是这个价钱是我完全不挣钱。”何信说。而3分的价钱在面向用户的平台里甚少出现,在用户平台端三分的价钱算是很高的。何信找的熟人介绍做项目,一般接一个项目几千上万的量,然后做上一个月。

这个行业流动性很大,重复性劳动和越来越低的价钱让很多人止步于此。何信的团队不算大,上个月还是五六个人。来的职工通常都是中学生,兼职在做这份工作。五六个兼职的朋友能够留下一个,何信对自己团队流动习以为常。

“一开始不熟悉业务,做不了这么快,几乎就赚不了哪些钱,完全看自己做的数目。”何信解释团队流动大的诱因。

除了数据标明,何信的团队也做过涉及语音通配符、数据采集等方面的工作,两三岁孩童的语音、粤语、陕西话的通配符她们都做过。语音通配符一般来说三分钟能给到七块左右,数据采集工作相对来说赚的更多,但过分费时吃力,这块业务也渐渐搁下了。

“车道线、车、人脸,人体……”何信做的数据标明类目有很多,但都是二维的。数据标明的同行们有的在做三维标明,这样的工作日薪能达300元左右。

图源:百度众测

但这样的薪水并不是普遍化的,简单重复性的二维图片数据标明工作薪金并没这么可观。

小作坊的出现,是数据标明团队的一个大趋势。何信对于这份工作的人有大约的画像。在城乡结合部,或者乡村小作坊,有这么一批人,二三十岁,学历不是很高,就在市区做这样的工作。而很多人也有投资这些数据小作坊的准备。

“我就形容它是网路时代的那个手工作坊。”何信对这些城乡结合部的小作坊下了一个定义。

“网络时代的民工?”

“完全就是民工了,这不是讥讽。”

3

互联网大厂

为什么须要人兼职训练AI

“训练AI啊。”

何信很明晰的晓得自己所做的工作,电子信息工程专业的李元也晓得这份工作的意义,“平台给你提供的题目相当于是一个训练的样本。所有你做的题目就是AI的训练集,它会通过人类的这些思维判定去训练AI。”

“能晓得的只有他(平台)告诉我的。具体数据去哪了,用于哪些了,没有去揣测。”周舟只晓得平台告知的信息,在阿里众包的一个任务中显示,您接受的任务中涉及对个人信息的搜集,任务发布者承诺在此任务中搜集到的个人信息将会用于“算法训练——牙齿病种辨识”的目的,并仅限于任务发布者使用,并不向任何第三方出售、共享以及披露,匿名化或去标识化的除外。

图源:阿里众包

“我们要教机器认识一个苹果,你直接给它一张苹果的图片,它是完全不知道这是个哪些东西的,需要现有苹果的图片,上面标明着“苹果”两个字,然后机器通过学习了大量的这类图片,才能认识苹果,其中将图片表示为“苹果”的工作就是数据标明。”

数据标明员的工作就是在教机器学习。

人工智能包含着机器学习,而监督学习是机器学习的一种训练方法,通俗来讲,是要给机器一种标准答案来不断进行训练,以此来达到人类一些辨识认知的能力,这也是深度学习的一个目标。深度学习的成功所依赖的既不是算法,也不是估算能力,而是训练和验证数据的可用性,这些数据最终是通过人的参与获得的。

这是一个特别重复性的劳动,因为机器学习须要大量的样本,大量的样本是由无数重复性劳动所缔造的。

而这些重复性劳动在很早之前就有了。2003年,一款“ESP游戏”就用了这些劳动,它的目的是通过互联网上人们的自由参与来获得描述图象的标签。在一个游戏中,两个玩家在屏幕上见到相同的图象,并被提示输入描述该图象的关键字。他们看不到对方正在键入哪些,但若果二人输入相同的关键字足够快(“匹配”),他们都会得到分数。实际上,这些关键字可以用作图象的精确标签。“ESP游戏”后来被微软竞购,被称为微软图象标签。

不止人工的重复性劳动,验证码也是训练机器的一种形式。验证码本身是在人机交互中建立,以验证用户实际上是“人工用户”的工具。reCAPTCHA公司扩充了这一原则,将人类用户的反应重新用作工业深度学习项目的培训数据。为此,用户须要解决一个小任务,如图象辨识或文本辨识,这对人类来说是一个低的障碍,但对计算机机器人来说是一个高的障碍。而reCAPTCHA也被微软竞购了。

科技自媒体“品玩”曾报导过类似的现象,验证码越来越有内容,比如标明门牌路牌,让用户帮分类数据库等。“品玩”也强调在 reCAPTCHA 官网上,Google 公开说明了 reCAPTCHA 集众人之力标明数据,训练 AI 的“众包”模式。

网络中辨识图片的验证码

捕获人类的认知的形式早已不再局限于众包中的重复性劳动,将人类的认知嵌入到计算机网路中,让人和机器的关系愈发密切,而这些隐性的认知捕获在互联网的各个角落都在发生着。

在重复性劳动不断降低的当下,何信打算筹谋新的出路。他的同行同事们早已开始在做简单的数据AI,让简单型的数据标明工作交给机器来操作。

用机器做下来的训练集来训练机器,是一个有意思的事情。

在城乡结合部,一批二三十岁的人正在批量生产着AI训练集,重复是她们工作的常态。也正是由于这么,工作沉闷、报酬微薄,充斥着“训练AI”任务的众包兼职平台相当厌烦,劝退了不少被兼职平台大厂背景所吸引的用户。

而随着AI和机器的不断自我训练和进化,AI训练AI就在不远的未来,这类平台的未来可能性将会更小。

备注:以上何信、李元、周舟均为化名

参考资料:《Human-aided artificial intelligence: Or, how to run large computations in human brains? Toward a media sociology of machine learning》,Rainer Mühlhoff

END

你对AI训练工作有哪些想法 ?