联系销售:400-665-8553
立即咨询
新闻动态 新闻动态
技术博客

分享开云智言科技技术博客

专访曼孚科技CEO赵剑:数据已成为决定AI模型上限的关键因素

作者:小编
发布时间:2025-04-02 03:45:06
阅读量: 

  曼孚科技CEO赵剑在与会期间接受南方财经记者采访时表示,以大模型为代表的新技术正推动AI进入新一轮发展热潮;自动驾驶、AI大模型等AI核心应用场景逐渐走向商业化,

  赵剑指出,数据已成为决定AI模型上限的关键因素,对于整个AI行业而言,算法、算力与数据是构成AI的核心三要素。其中,数据处理占据AI时代70%~80%工作量。 随着智能驾驶将成为汽车“标配”,赵剑预计未来3~5年将产生庞大的数据标注需求,而构建从数据采集到模型训练的一体化平台将是行业突破重点。

  对于全球科技巨头不断加大对AI数据中心投资的趋势,赵剑表示,这意味着对于AI基础设施的争夺开始变得白热化。谁掌握了AI数据,即意味谁将掌握AI时代的基础设施,“因此,在AI时代,我们必须要将数据这项基础设施牢牢把握在自己手中。”

  《全球财经连线》:在过去几年取得了哪些显著进展?目前处于怎样的发展阶段?

  赵剑:以大模型为代表的新技术的涌现掀起了人工智能新一轮发展热潮;自动驾驶、AI大模型等AI核心应用场景逐渐走向商业化,人工智能与日常生活联系的更为紧密。

  目前,人工智能逐渐从实验室走向产业端,开始在各个场景实现落地应用,比如自动驾驶。基本上未来三到五年,首先是中国所有的车企都会标配L2智驾,提供辅助驾驶功能,此后智驾会成为全球所有车企的标配,这会给消费者带来更好的体验。

  《全球财经连线》:作为曼孚科技的CEO,您如何看待数据在人工智能发展中的核心作用?比如在自动驾驶和大模型领域,数据质量和处理能力如何影响技术的进步?

  赵剑:从行业角度来看,数据标注作为AI产业的重要一环,这一点已得到投资人的广泛认可。对于整个AI行业而言,算法、算力与数据是构成AI的核心三要素。其中,数据处理占据AI时代70%~80%工作量,数据已成为决定模型上限的关键。算法模型从技术理论到应用实践的落地过程都依赖于大量的训练数据。正因如此,数据标注已逐渐从一个辅助角色,转变为决定AI模型精度、鲁棒性和泛化能力的关键因素。

  数据标注在AI产业链中的位置就如台积电在芯片产业链中的位置一样,都是将算法(芯片)训练调优(制造)出来,以供终端市场使用。早期芯片依靠“手搓”就能生产,但随着制程要求越来越高,只有更先进的制程技术,才能生产出高端芯片。

  这与数据标注行业相似,早期可以通过手动标注简单数据,但随着算法模型更加精细化,场景更复杂,以自动驾驶为代表的新业务兴起,对标注平台产品的场景覆盖度、自动化水平以及协作能力提出了更高的要求。产业链中,数据标注已成为类似芯片生产制造一样的高端制造业。

  在人工智能与机器学习领域,标注数据的质量直接关系到模型的学习效果和预测能力。高质量的标注数据不仅能帮助模型更准确地理解数据模式,还能提高其在不同任务中的预测精度。此外,规模化的标注数据能增强模型的泛化能力,支持更复杂的模型训练。最后,在机器学习与深度学习模型的训练中,数据标注质量直接关系到模型的泛化能力,尤其在模型应用于训练数据之外的环境时,kaiyun中国网页版登录其性能稳定性尤为关键。

  《全球财经连线》:自动驾驶行业对数据的需求相对明确。随着自动驾驶商业化的加速,数据需求是否会迎来更大的爆发?

  从技术角度来看,近些年兴起的端到端、BEV+Transformer等技术方案,都是以数据为核心的方案,相关算法模型的训练与迭代需要海量标注数据。

  从行业角度来看,随着以比亚迪为代表的车企开始推进全民智驾后,未来3到5年,国内所有车企都会标配L2智驾,提供辅助驾驶功能,此后智驾也会成为全球所有车企的标配,这在给消费者带来更好的体验的同时,也会诞生规模庞大的数据标注需求。

  近几年,曼孚科技每年业务量都能实现成倍增长,这既与自身坚定不移的投入与努力相关,也离不开数据标注市场规模的快速扩张。

  赵剑:数据体量从海量到超大规模,AGI需要模拟人类综合智能,其训练数据量需可能接近甚至超越人类终身学习的数据量,复杂度也是几何级提升。此外,数据类型将从单模态到多模态融合。AGI需同时处理文本、图像、音频、视频等多种模态信息,并实现跨模态关联。

  《全球财经连线》:我们看到,全球科技巨头们正不断加大对AI的投资。您怎么看?未来数据处理的核心突破点可能在哪些方面?

  赵剑:这代表着一种趋势,数据之于AI的重要性得到了更为广泛的认知。同时,全球科技巨头们不断加大对AI的投资,也意味着对于AI基础设施的争夺开始变得白热化。谁掌握了AI数据,也即意味谁将掌握AI时代的基础设施。就像PC时代微软凭借操作系统掌握基础设施,互联网时代谷歌凭借广告平台掌握流量入口一样,数据之于AI的重要性逐渐被大众所认知,在AI时代我们必须要将数据这项基础设施牢牢把握在自己手中。

  未来数据处理的突破点主要集中于产品技术层面。只有构建从采集、标注、管理、训练的一体化闭环平台,才能实现对数据的有效管理。这也是曼孚科技正在做的事情,目前曼孚科技已构建起涵盖数据标注平台、数据管理平台与模型训练平台的闭环体系。

开云科技整合自然语言处理与机器学习技术,打造全方位AI开发服务平台

400-665-8553

联系我们:400-665-8553

销售联络:400-665-8553

媒体合作:666666666

展会合作:888888888

北京 | 北京市海淀区中关村科技园区清华科技园创新大厦B座15层(研发中心)

深圳 | 深圳市南山区科技园南区高新南七道数字技术大厦8层(AI实验室)

上海 | 上海市浦东新区张江人工智能岛智能制造大厦A栋12层

成都 | 四川省成都市高新区天府软件园C区云计算中心6层

武汉 | 湖北省武汉市东湖新技术开发区光谷大道光电子信息港B座9层

杭州 | 浙江省杭州市滨江区网新智慧园区创新大厦C座16层

广州 | 广东省广州市黄埔区科学城科技创新基地达实大厦7层

Copyright © 开云智言科技 版权所有

豫ICP备19046769号
在线咨询
电话咨询
400-665-8553
回到顶部