随着通用AI技术到智能体技术飞速发展,各行各业都在追寻数智化转型,大量的AI应用被部署在企业流程当中,然而这些AI应用落地后的实际效果,远远没有达到预期。
在企业部署AI应用时,通常将AI看做一项技术创新,总在某些单项应用上做基于AI的突破,而从整个企业流程的维度上看,这种提升其实微乎其微。因此,要让AI在企业业务中发挥价值就需要让AI实现规模化部署。
我们知道,AI规模化部署的前提,是高质量的数据能否就绪。在大模型领域也一直存在“垃圾进、垃圾出 (garbage in,garbage out)”的说法,如果没有高质量的数据输入,则无论多么先进的算法、多么庞大的算力都无法为大模型带来高质量的结果。
因此,大模型的上限不取决于算法,而取决于数据能否被炼化。AI在企业中规模化落地,也与数据是否就绪息息相关。
从数据应用的广度来看,全国数据资源统计调查的结果显示,2024年我国数据生产量达到41.06ZB,已占到全球数据总量的26.67%。而从数据应用的深度来看,IDC有一份研究表明:企业数据量占据我国数据总量的70%,政府、媒体、专业服务、零售、医疗、金融等行业都成为了数据应用的重点行业。
数字化的基础是数据化,企业数字化转型发展至今,其实可以看作是对数据价值挖掘由浅及深的过程。随着数据应用的深度与广度同步提升,数据之于经济建设和企业数字化转型的价值已不言而喻。
在AI时代,数据是AI的“燃料”,“没有高质量的数据,就没有高价值的AI”也已成为行业共识。
从Gartner成熟度曲线看,AI就绪数据(AI-Ready Data)攀升到炒作周期的最高点,是当前最受追捧、期望最高、讨论最火热的技术概念之一;IDC的分析报告也认为,企业正从以模型为中心转向以数据为中心,进一步强调了数据在大模型时代的重要性;在刚刚结束的以“数据×人工智能”为主题的2025全球数据管理峰会上,邮储银行相关负责人也谈到,邮储银行大模型驱动的全新数据治理范式加速成型,以数据与安全两大底座为支撑,从模型、技术、形态、产品等方面构建起数据治理智能化服务矩阵。这些主流思想的交融,呈现出一种AI与数据双向奔赴、相辅相成的关系。
而将数据与AI的辩证逻辑,延伸到行业,那就是唯有抓住数据所发生的变化,才能把握行业智能化发展的脉络。因此在金融行业,我们相信“数据能力只有进入金融场景,才能真正转化为生产力。”
有别于通用云厂商单纯强调“AI Ready”,中电金信更强调高价值数据与金融场景的结合,用30年金融行业经验构建场景化高质量金融数据集,直击金融业务运营风控、营销、合规的核心痛点。
去年发布的《“数据要素×”三年行动计划》提出,“到2026年底,数据产业年均增速超过20%,数据交易规模倍增”,这意味着作为数据产业要匹配《计划》的目标,无论从数据治理、数据挖掘还是数据运营的水平都要有所突破。
在此进程中,数据产业将经历一场深刻的变革,其核心逻辑围绕数据价值的释放逐步展开,而专业高质量数据集与大模型的结合,正成为重构数据治理技术体系的关键驱动力。
围绕行业场景,构建高质量的数据集将成为核心竞争力。2025年5月,国务院国资委发布首批中央企业人工智能行业高质量数据集优秀建设成果名单,中电金信金融大模型数据集成功入选“首批央企人工智能行业高质量数据集”。 中电金信已经构建了AI数据原生工厂,通过自动标注、场景数据萃取、合成数据等,让海量数据变为高质量AI燃料。
当然,拥有了高质量的数据集,也不意味着就拥有了数据价值。数据的价值本质在于流动与应用,数据不是仓库里的存货,而是需要持续运营的资产,所以必须通过持续、主动的运营才是能焕发活力的宝贵资产。
客观地说,数据运营的视角,是将数据的焦点从“管好”转向了“用好”。数据资产运营也在通过打破数据孤岛,促进多元异构数据的整合、共享与深度利用,使其真正服务于业务决策与创新。
好的数据运营平台会让数据价值的挖掘事半功倍。中电金信在2025全球数据管理峰会上从技术趋势、客户需求及产品实践等维度展开分享。其中,中电金信源启·多模态管理(知数)平台,一举打破“单一模型解决单一问题”的旧模式,实现以统一的技术架构和相近的数据处理流程,对非结构化数据进行加工,具备将所有数据纳入容易管理的条件,能够快速接入非结构化资产,建立统一的数据体系,帮助企业快速构建全域数据资产知识库。
而要实现从数据到数据资产的跃迁,坚实的数据治理体系是不可或缺的前提。没有数据治理体系作为保障,数据不但不能转变为企业资产,还很容易让企业陷入“数据沼泽”的陷阱。
金融行业的监管和合规极其严格,对数据治理的要求本就很高。但仍要清晰的认识到,金融数据治理的终极目标,绝非仅仅为了满足监管要求,更深层次的价值是在于驱动业务经营。
在数据治理方面,中电金信新升级的源启·数据资产平台,可以帮助企业全面提升智能化能力,协助企业重构数据治理体系。通过对数据标准、质量、安全的全方位管控,为数据的可信、可用奠定基石,从而让数据能够精准地赋能风险管理、客户洞察、产品创新等核心业务环节。
不难总结,当高质量数据集成为大模型价值释放的引擎,数据资产运营就是实现数据价值的必然路径,而数据治理则是这一切得以实现的坚实基础。
事实上,智能时代所面临的数据课题,早已不是某个环节或局部的优化,而是一场贯穿数据全链条的变革。也不仅仅是数据运营视角的转换,更是整个运营模式的重塑,覆盖了技术研发、数据治理、业务运营、场景应用乃至产业生态构建的每一个层面,是一场全局性的进化。
这场进化对数据工程的各个环节提出了全新的要求。AI时代正在重塑数据工程的全链条。金融机构应构建治理与AI的双向赋能机制,通过场景测试、模型效果评估、事后运营与安全审计等手段,降低大模型的不确定性,实现在无人工干预下的数据系统自我驱动与可信自治。这一观点清晰地表明,未来的数据体系必须是智能、闭环且可信的。
在这一背景下,传统的“工具赋能”模式已难以满足 AI时代的开发需求,“智能体驱动”正成为新的发展方向。源启·Gien-DBrain正是顺应这一趋势,打破了以往数据开发的固有范式,通过智能体的深度参与,通过“智能体执行,人类审核”的方式:内置了行业专家经验的AI智能体(Agent)自主完成需求澄清、模型设计、代码开发与测试验证,人类角色转变为审核者、决策者和赋能者。同时,数据平台从“功能集合”演进为“专家网络”,从根本上提升了数据开发的效率与质量,为后续的数据应用奠定了坚实基础。
智能应用作为数据价值释放的关键环节,其准确性直接决定了智能能否真正落地可用。源启·ChatBI在这一领域实现了重要突破,将问数准确提升到95%以上,让用户在与系统交互获取数据信息时,能够得到更可靠、更精准的结果,这不仅降低了智能应用的使用门槛,更让数据智能真正融入到实际业务场景中,为决策提供有力支撑。
最后,数据的价值释放从来不是一家企业能够独立完成的,它需要整个产业的共同参与和协同发展。中电金信深刻认识到这一点,不仅自身积极构建数据集,还联合13家企业共同签署“央国企金融数据产业共同体倡议书”,推动行业建立可信共享机制,让数据要素释放更大合力,为金融行业乃至整个数据产业的发展注入新的动力。
从宏观的视角来看,数据要素化已成为国家层面的重要战略方向,它不仅是推动数字经济发展的核心引擎,更是实现经济高质量发展的关键支撑。在此意义上,无论是源启数据系列产品在技术层面的持续突破,还是中电金信在产业协同方面的积极探索,都是对数据要素化战略的有力回应与实践!