聚焦新质生产力系列之六: 从算力到存力, 解锁数据要素新价值
- 2025-07-11 07:38:14
- 110
【环球网科技报道 记者 张阳】在数字化浪潮以排山倒海之势席卷全球的当下,数据已成为驱动社会进步和产业变革的核心要素,其规模正以指数级的速度疯狂增长。特别是随着人工智能(AI)技术的逐步成熟,大模型技术成为科技领域发展的核心热点,决定大模型发展快慢的“算力”,成为街头巷尾的热议话题,而对于“存力”话题却让很多人感到茫然。
所谓“存力”也即数据存储能力,随着全球数据量以36%的年增长率持续扩张,预计到2030年将达到YB级规模,如何高效、安全地存储这些海量数据,成为了让算力将人工智能大模型发挥其应有效力的前提。因为也有评论认为“算力决定人工智能的底线,数据决定人工智能的上限”。而根据工业和信息化部等六部门印发的《算力基础设施高质量发展行动计划》认为,算力是集信息计算力、网络运载力、数据存储力于一体的新型生产力。在这一背景下,算力与存力作为数据价值释放的“双引擎”,正成为新基建竞争的战略制高点。
近日,为了更好探究我国存力发展现状、挑战及未来趋势,中国信息通信研究院组织的“存力中国行”活动正式启动,首站走进广东,为行业搭建了深度交流的平台。
“存力中国行”走进广东,透视存力发展现状
广州华银康医疗集团股份有限公司(简称华银康集团)是以病理为核心的独立医学检验与诊断服务企业。作为国内病理服务的先行者,华银康集团于2010年开始,与国内外多所重点院校共同建设“华银康病理诊断中心”。目前已建立覆盖31个省区的医学实验室网络,全国服务客户超过12800家,其中与近700家医疗机构共建高水平病理科。
华银康集团围绕智慧病理的发展持续布局,依托“数据-算法-场景”全链路技术闭环,在行业内首创“AI+系统+设备+资源”四位一体服务模式,提供模块化智慧病理解决方案。在233位病理专家团队及100位标注专家的支持下,深度融合DeepSeek等大模型技术,在远程病理的基础上为各级医疗机构提供数字病理数据库打造、病理AI辅助诊断、病理结构化报告以及病理全流程管理监控等服务。
以胃活检为例,胃活检诊断具有极高的复杂性,对于处在病情发展中或少量异型细胞存在的情况,模型可通过提示性文字和对应区域展示,针对非明确的散落的可疑异型细胞进行建议性提示。系统针对于胃癌的敏感性超过99%,特异性达90%,有效防止漏诊与误诊。通过AI分析后,会输出整体诊断建议、热力图及色阶图,帮助医生快速定位可疑病变区域,最终由病理医生完成诊断。
华银康在发展过程中遇到的一大难题就是数据存储,全集团年检测标本量约4000万例,每一张完整病理图像都需要近1GB存储空间,同时还要保障能够快速调用这些图片供AI与病理医生进行分析诊断,如果全部完整使用、归档所需要的存储空间以及设备成本将是一个天文数字。所以华银康采用了切片方式对病理图像数据进行处理,仅保留病灶部位的图像切片,并且采用了华为分布式存储系统,构建安全、高效、可扩展的先进存力,并通过高效的压缩技术降低存储空间压力,尽管如此,集团的机房内每年需要扩展的存储容量仍然在PB级别。
数据要素化催生存力新基建
华银康集团面临的难题可以说是AI时代发展的缩影,随着人工智能的爆发式增长和数据总量的指数级跃升,存储已从传统的“数据容器”跃迁为支撑数字经济高质量发展的战略基座,是激活数据要素价值、培育新质生产力的核心引擎。
中国信通院副院长王志勤介绍,我国存力建设取得显著成效,截至2024年底,全国存力总规模已达1580EB,先进存储占比提升至28%。然而,仍面临“存而不用、用而不深”、核心芯片、软件、介质短板以及存算运协同效率待提升等挑战。为此,她提出三大建议:探索最优路径,共享最佳实践;聚焦存力服务普惠与效能提升;强化技术攻关与产业协同生态构建。
华为数据存储产品线战略与业务发展部总裁王旭东对此也深表认同。王旭东在接受记者专访时开门见山地指出:“AI时代是数据的黄金时代,更是算力与存力协同进化的时代。”当DeepSeek等大模型引发产业变革后,数据已从“沉睡资产”蜕变为驱动产业发展的核心生产要素。然而当前我国数据发展面临双重矛盾,记者采访王旭东了解到:一方面2024年全国数据生产总量达41.06ZB,同比增长25%,但存储总量仅2.09ZB,数据留存率不足5.1%;另一方面存储数据中一年内未使用的“冷数据”逐年增多,传统架构下数据孤岛问题严重,导致数据治理效率低下。
这种矛盾在技术层面表现得尤为突出。随着AI进入多模态时代,文本、视频、图像等异构数据融合需求激增,传统网络架构已难以支撑。王旭东以医疗行业为例:“医院在构建AI大模型时,非结构化医学影像数据的标注成本极高,传统方式下数据准备周期长达数月。”这正是存力中心建设如火如荼的核心原因——它通过规模聚数、高效治数、安全供数、产业用数四个维度,构建起数据从资源到资产的闭环体系,与算力基础设施形成互补,共同破解“数据丰富但价值贫瘠”的产业困境。
政策层面的驱动同样显著。国家数据局、工信部等部委密集出台政策,将存力列为重点发展方向,明确提出推动行业和区域数据归集平台建设。在“东数西算”工程中,广东韶关、贵州、京津冀廊坊等枢纽节点同步规划存力中心,使其不仅成为数据存储载体,更升级为省级备份灾备中心、行业语料库开发基地和产业聚集中心。“政策与技术的双重驱动,让存力中心从概念走向落地,成为激活数据要素价值的关键基础设施。”王旭东强调。
从数据汇聚到产业赋能的全链条创新
王旭东告诉记者,在华为的实践中,存力中心的价值释放依托四大核心能力体系,形成了一套可复制的 “华为方案”。
规模聚数:打破数据孤岛的全局掌控力。面对跨区域、跨行业的数据汇聚挑战,华为Omni-Dataverse通过三大创新实现数据全局可视、可管、可用:一是建立统一数据视图,解决“数据在哪里”的认知难题,实现资产注册0遗漏、更新0等待;二是依托智能数据目录,对百亿级数据进行自动标签,支持秒级查找;三是构建自定义数据流通机制,用户可根据需求设定跨区域、跨设备的共享策略。
高效治数:AI 时代的数据质量锻造厂。“AI大模型的竞争力高度依赖高质量数据集。”王旭东以华为AI全流程工具链ModelEngine为例,阐述华为如何通过数据使能、模型使能、应用使能三方面提升数据治理效率。在瑞金医院病理大模型项目中,基于此工具将病理数据标注周期缩短80%,大幅降低了AI模型上线成本。更重要的是,ModelEngine覆盖了“数据预处理-模型训练-应用部署”全流程,使单癌种业务AI应用上线周期缩短80%,为医疗、制造等行业的模型落地提供了加速器。
安全供数:数据流通的可信防护网。数据要素流通的前提是安全可信。华为构建的软硬一体可信数据空间,从技术与管理双维度保障数据流动:技术上采用可信流通策略、芯片级安全保障和端到端传输加密;管理上建立30+数据控制策略,实现全流程日志审计。“就像给数据敷上‘保护膜’,让提供方和使用方都能放心。”王旭东提到,这种安全体系不仅满足合规要求,更解决了龙头企业数据共享的核心顾虑——在医疗领域,通过所有权与使用权隔离技术,已推动多家三甲医院实现数据安全共享。
产业用数:海量数据规模集聚融合之后,要推动“数据+行业+场景”的深度融合,形成数据从采集到治理到应用的正循环。王旭东透露,在某汽车厂商场景中,该企业不仅依托存力中心汇聚了企业内部数据,还整合了城市、金融、充电桩等外部数据,为后续该企业的数据应用服务奠定基础,并为政府部门提供体系化监管服务支撑。
从介质突破到生态协同的破局之路
尽管存力中心发展前景广阔,王旭东也坦诚指出当前产业面临的三大核心挑战:“国内80%以上的数据仍存储在机械硬盘,而该领域核心技术长期不在国内。”王旭东呼吁加速全闪存介质的应用与创新,他强调:“发展存力产业必须构建自主可控的产业链,从芯片到整机再到应用,形成完整的技术生态,这既是安全需求,也是产业升级的必然路径。”
AI应用对存储提出了全新要求:千亿级参数模型训练需要极致性能支撑,边缘推理场景需要长记忆存储能力。华为通过存算协同架构,在训练场景中使AI集群利用率提升30%,在推理场景中实现数据吞吐量提升60%。王旭东建议:“应将AI存储纳入国家关键技术规划,推动行业标准制定,通过技术创新提升我国在全球高端存储领域的竞争力。”
当前我国数据灾备覆盖率仅为34%,远低于发达国家水平,且开源软件依赖度高,存在安全隐患。华为推出的“两地三中心”灾备方案,业务故障时可实现分钟级切换,同时通过自研存储操作系统降低对开源组件的依赖。“数据安全是存力中心的生命线,需要政策引导、技术创新和生态协同多管齐下,构建自主可控的安全底座。”王旭东总结道。
“就像电力改变工业时代一样,存力将定义AI时代的产业新秩序。”王旭东认为,存力中心将从三个维度重塑产业格局:在技术层面,存储设备不仅是数据容器,更将进化为数据处理中心;在产业层面,以存力中心为枢纽,将形成数据采集、治理、交易、应用的完整产业链,催生数据服务商、AI训练师等新兴职业;在社会层面,数据将像水电一样成为公共资源,通过存力中心的高效配置,推动智慧城市、精准医疗等场景的大规模落地。从算力到存力,从数据资源到数据资产,一场深刻的产业变革正在上演。
- 上一篇:樊振东说面对没准备到的困难多想想办法
- 下一篇:壁纸