去年秋天,我去了一趟北京某人工智能产业园。电梯里碰到两个年轻人,一个背着双肩包,另一个抱着外卖。电梯门快关上的时候,背包的那位突然回头冲外卖小哥喊了句:“兄弟,这周我们团队标注了八万张图,你们那边呢?”外卖小哥头也不抬:“五十万张,全是自动驾驶场景。”我当时就愣住了——一个普通的外卖订单,背后可能牵扯着几十万张图片的标注工作。而这些标注,正喂养着中国最聪明的算法。

标注服务,说白了就是给人眼装上一副“数据眼镜”。你拍一张照片,机器看不懂,但人一看就知道:这辆车是白的,那个行人穿着红色外套,路边的交通标志是限速40。标注员的任务就是把图像里的每一个元素框出来,贴上标签。这个过程既枯燥,又重要。有人说它是“人工智能的体力活”,这话一点没错。但没有这份体力活,再牛的算法也学不会认东西。我认识一个做标注团队的小老板,他告诉我,他们公司最忙的时候,一个月要处理三百万张图片。三百万张啊,全部由真人一张张框出来的。
标注服务的门槛很低,只要会基本的电脑操作就能上手。但它的价值天花板很高,足以决定一家AI公司的生死。你看那些自动驾驶公司,为什么有的车能精准识别路边蹿出来的猫,而有的车对着静止的消防车直接撞上去?根本原因就在训练数据。数据质量差,算法就像瞎子。我有个朋友在百度做算法工程师,他说他们团队经常因为标注数据的准确率吵得不可开交。标注员把马路牙子标成车道线,算法学了就是“瞎学”,结果路测时车子直接冲进花坛。这事儿听起来好笑,但背后是实实在的金钱损失。
标注服务的商业模式特别有意思。它不是靠技术壁垒赚钱,而是靠管理效率。说白了,就是在保证质量的前提下,把成本压到最低。现在市面上做标注的公司,大致分三种:一种是纯人工的,招大量兼职标注员,按件计费;一种是半自动的,先用算法预标注,再让人工修正;还有一种是全自动的,靠算法直接生成标注结果。这三种模式各有优劣,但都有一个共同痛点:标注员的流动性太大。我采访过一位标注公司的HR,她说他们公司标注员的平均在职时间只有三个月。为什么?因为太枯燥了,每天对着屏幕框框框,眼睛都快瞎了,而且工资也不高。
这个问题在行业内被称为“标注疲劳”。一个标注员一天能高效工作的时间大概只有四到六个小时,超过这个时长,错误率就会直线上升。我认识一个做了两年标注的姑娘,她说她最高纪录是一天标注两千张图,结果第二天眼睛肿得像核桃。更可怕的是,她发现自己的反应速度变慢了——走在路上看行人,脑子里会自动生成框框。这种感觉很诡异,就像长期做翻译的人,说话时脑子里先蹦出英文。标注行业的劳动强度,远比外界想象的要大。
但标注服务也在进化。过去的标注只是画框、打标签,现在已经开始向“语义理解”方向发展。比如一张图片里有一群人在开会,标注员不仅要框出每个人的位置,还要标注他们的表情、动作,甚至眼神方向。医疗影像标注更为复杂,需要在CT片子上把肿瘤的边缘精确到像素级别。这已经不是单纯的体力活了,它需要专业知识和经验积累。我有个做医疗标注的朋友,他手下的人全是医学专业毕业的,培训期就要三个月。这种高价值标注,单价能到几十块钱一张,和普通标注完全不是一回事。
标注服务的未来,大概率会走向“人机协同”。算法负责处理90%的简单标注,人工只负责那10%的模糊判断和错误修正。这个转变已经在发生。去年我参观过一家做自动驾驶标注的公司,他们的系统已经能自动识别道路、车辆、行人,标注员只需要纠正算法搞不定的边缘案例。效率提升了至少五倍。但有意思的是,这家公司并没有裁员,反而在扩招。他们的逻辑是——算法解决了80%的常规问题,剩下的20%复杂场景必须靠人来兜底。
回到那个外卖小哥和背包青年的对话。那天电梯到了一楼,我特意多看了外卖小哥几眼。他三十出头,皮肤晒得黝黑,手机屏幕上不断弹出新的派单。我突然意识到,他嘴上说的“五十万张”,背后可能意味着五十万个真实路口、五十万次人工确认、五十万个标签。这些数据不会说话,却在默默改变我们的出行方式。标注服务从来不是什么高精尖的技术,它是最朴素、最底层、最容易被忽略的苦活。但恰恰是这些苦活,撑起了人工智能这个光鲜的行业。
