本文围绕 AI 淘金热展开,聚焦杭州曼孚科技有限公司 CEO 赵剑在博鳌亚洲论坛 2025 年年会期间接受专访时透露的信息,介绍了数据行业的新变化、曼孚科技的业务转型、多模态数据标注的成本挑战及解决方案,分析了公司客户结构特点,探讨了自动驾驶技术路线的问题,还提及全球科技巨头在 AI 数据中心建设上的巨额投入以及赵剑对此的看法。
在当下如火如荼的 AI 淘金热潮中,有这样一群特殊的“淘金者”,他们手持“铁锹”和“镐”,持续不断地“开垦”着更多的数据资源,为 AI 企业的蓬勃发展提供着坚实的基础。
3 月 27 日,正值博鳌亚洲论坛 2025 年年会召开之际,杭州曼孚科技有限公司 CEO 赵剑接受了第一财经记者的独家专访。他指出,随着人工智能技术的飞速发展,不同类型的企业对数据的需求呈现出多样化的态势,数据的应用场景也在不断地拓展和延伸。这一系列的变化,正推动着数据行业经历一场前所未有的变革。
数据,无疑是驱动 AI 产业链不断前行的核心“燃料”。当信息智能逐渐向空间智能、具身智能迈进时,企业对数据的定义和需求也发生了根本性的改变。赵剑透露,曼孚科技正积极调整战略布局,将业务重心逐步转向大模型多模态数据标注领域。他进一步解释道,随着大语言模型(LLM)向多模态方向演进,文本、图像、语音、视频等多种类型数据的融合标注需求呈现出爆发式增长。“未来的 AI 要想真正理解真实世界,多模态是必经之路。”
然而,多模态数据标注并非一帆风顺,成本挑战成为摆在面前的一道难题。赵剑坦言,由于数据处理维度的显著上升,数据成本也随之水涨船高。以自动驾驶领域为例,一辆智能驾驶汽车的传感器涵盖了激光雷达、摄像头、毫米波雷达等多种数据源,收集、清洗、标注这些海量的数据,无疑是一项艰巨且耗费成本的工作。
面对复杂的数据处理场景,如何提升数据处理效率成为关键。赵剑认为,利用 AI 和自动化流程是行之有效的解决方案。在标注环节,AI 辅助技术能够精准识别图像中的车辆、行人,并预先标注关键点;在自动化流程中,则重新建立一套工业化标准,实现流水线式的数据清洗和标注。不过,他也强调,AI 标注存在一定的局限性。“在 AI 本身尚未完全成熟的情况下,AI 自动标注又怎能达到理想的成熟度呢?”
从曼孚科技的客户结构来看,自动驾驶领域的企业依然是公司的主要客户来源。赵剑解释称,这得益于自动驾驶商业化的较高成熟度。“汽车企业愿意为数据付费,且需求明确,整个行业已经形成了从数据采集到模型落地的完整闭环。”
与之形成鲜明对比的是,服务机器人、人形机器人等领域的客户相对较少。赵剑分析指出,机器人是软硬件协同的智能体,公司对自身硬件所适配的数据是否了解,对业务场景是否有清晰明确的定义,都会直接影响他们所要求的数据质量和数据规模。在机器人行业,数据的通用性极低,如果企业在尚未明确自身需求的情况下盲目购买数据,效率必然低下。
对于自动驾驶的技术路线,赵剑指出,从技术发展路径来看,强化学习与端到端模型的探索正在加速推进。但他也提醒,自动驾驶算法的“黑箱”特性带来了不可忽视的法律风险,事故责任的界定仍然是一个亟待解决的难题。这需要在技术、法规甚至伦理层面实现共同突破。
在全球范围内,科技巨头们围绕人工智能领域的布局正持续升温。微软、Meta、OpenAI 等科技公司纷纷透露有建设 AI 数据中心的宏伟计划。微软在 2025 年开年便宣布,在 2025 财年将豪掷 800 亿美元用于建设 AI 数据中心。微软官方表示,这笔巨额资金将着重用于开发能够训练人工智能模型、基于云的应用程序的数据中心等。Meta 公司 CEO 扎克伯格也曾透露,2025 年计划投资 650 亿美元用于扩展人工智能基础设施。在 1 月“星际之门”计划宣布后,OpenAI 也宣布将立即投入 1000 亿美元,在美国建设数据中心。
面对科技巨头们在 AI 数据中心建设上的巨额投入,赵剑表示,相比单纯的数据中心建设,数据处理、筛选以及管理更为重要。“其实从行业角度看,大家在数据处理等环节实际投入的资源不足。”他认为,当前行业仍处于发展的早期阶段,数据标注在处理效率和速度方面尚未达到理想状态,未来仍有巨大的提升空间。
本文围绕 AI 数据行业展开,通过曼孚科技 CEO 赵剑的观点,介绍了数据行业新变化、曼孚业务转型及面临的挑战,分析了不同领域客户情况和自动驾驶技术问题,还提及科技巨头建设 AI 数据中心的投入。指出数据处理等环节资源投入不足,行业在数据标注效率等方面有很大提升空间,未来数据行业发展机遇与挑战并存。
原创文章,作者:Grayson,如若转载,请注明出处:https://www.yanghehb.com/6080.html