我有个朋友,去年接了家小公司的活儿,帮他们的“血汗工厂”。只不过工人们不是搬砖,而是盯着屏幕画框框。

先说说标注公司到底在干什么。简单讲,就是给机器喂数据。比如自动驾驶,需要让车认识红绿灯、行人、车道线,这就得有人把照片里的这些东西圈出来、标上名字。一家标注公司接单后,甲方会扔过来几万张图,标注员们就得一张张画。活儿不难,小学生都能干,但要求“准”和“快”。“准”意味着标错了甲方不认账,得返工;“快”意味着一天得标几百张,不然工资会缩水。我认识个女孩,她在成都一家标注公司干过,她说自己一天坐十个小时,手速练出来了,但颈椎也废了。她老板更狠,定了个 KPI:每张图不能超过 15 秒,超时就扣钱。结果她为了赶时间,经常漏标小目标,比如远处的一个垃圾桶,结果被甲方投诉,扣了更多钱。
这行还有个特点:门槛低,但天花板也低。你没学历?没关系,只要会认图就行。你没经验?没关系,培训三天就能上岗。但问题是,你干了三年还是这个水平——因为标注公司本质上就是“计件工”。你标一张图,赚几毛钱;标一万张,赚几千块。公司从中抽成,甲方压价,最终到标注员手里的,也就比外卖骑手强一点。我查过数据,2023 年国内标注公司超过千家,但 90% 以上都是小作坊,老板可能是程序员出身,租个民房,拉几台电脑,招几个兼职学生就开始干了。这种公司抗风险能力极差,甲方一砍价,他们只能压榨员工;员工一辞职,他们就招不到人。恶性循环,谁都逃不掉。
但别小看这行,它其实是个“隐形巨头”。你手机里的语音助手、人脸识别、推荐算法,背后都离不开标注数据。比如淘宝的“猜你喜欢”,之所以能精准推送,是因为有人标过成千上万张商品图,把“连衣裙”“高跟鞋”“口红”等标签划得清清楚楚。再比如医院的 AI 诊断,之所以能识别肿瘤,是因为有人把 CT 图里的阴影圈出来,标上“良性”或“恶性”。没有这些标注员,再牛逼的算法也是废纸。所以,标注公司虽然看着 low,但它是 AI 产业链里最接地气的一环,就像建筑工地的农民工——盖楼离不开他们,却很少有人记得他们的名字。
问题在于,这行太“卷”了。甲方大多是互联网大厂,比如百度、阿里、字节跳动,他们手里有海量数据,却不想自己动手,因为太繁琐。于是外包给标注公司,价格压到最低。标注公司为了活下去,只能再压榨标注员。我听说有个项目,甲方要求标出图片里所有“动物”,包括猫、狗、鸟、鱼,每张图给 0.3 元。标注员一天标 500 张,才挣 150 块。但甲方还嫌贵,后来找了个东南亚团队,每张图只给 0.1 元。标注公司老板急了,直接降薪,标注员集体罢工。项目黄了,甲方换公司,标注公司倒闭。这种故事每天都在上演,说白了,就是“劣币驱逐良币”——谁便宜用谁,质量好反而更快被淘汰。
也有想突围的案例。我采访过一家杭州的标注公司,老板是个 90 后,他搭建了一个平台,把标注任务拆解成“众包”模式——任何人都可以注册、接单、标完拿钱。他说模式很灵活,但问题也大:标注员水平参差不齐,有人为了多赚钱,乱标,导致数据质量崩溃。后来他学乖了,设了个“审核员”岗位,专门抽检,不合格的返工。但审核员又不够用,成本上去了。他叹气说,做这行就像走钢丝,要么累死,要么饿死。我问他有没有想过转型,他说想过,比如做垂直领域——医疗标注、法律标注,这些单价高,但门槛也高,得懂专业术语。他招了几个医科生,但人家干了几个月就跑了,因为太枯燥,还不如去药厂卖药。
还有个趋势值得注意:AI 正在“反噬”标注公司。以前需要人标的数据,现在机器能自动标了。比如谷歌的 AutoML,你给它几张样例,它就能自己学习并标注新数据。虽然效果还不够稳定,但进步很快。这意味着,未来对低端标注的需求会越来越少。标注公司如果仍抱着“画框框”的生意不放,迟早会被淘汰。但高端标注呢?比如需要专家判断的医学影像、法律文书,这类工作不好标准化。所以,这行的未来可能两极分化:要么做“快消品”,靠量赚钱,利润薄得像纸;要么做“奢侈品”,靠质赚钱,市场小得像针眼。
我想说的是,标注公司这个行业本质上反映了 AI 时代的残酷真相:技术进步的红利大部分被巨头吃掉,而底层劳动者只能分到残羹冷炙。那些标注员并不是不努力,而是努力的方向被锁死了——你标得再快再好,也只是个“数据工人”。就像我朋友说的,他干了一个月,最大的收获不是钱,而是理解了什么叫“数字时代的富士康”。所以,如果你现在想入行,我劝你三思:要么你有技术,能设计标注算法;要么你有资源,能拿到高端订单;否则,别去当那个画框框的人。因为画得再好,机器总有一天会替你画完。
