6月11日,首届CCF大模型与AI工程大会·大模型推理系统工程论坛在天津举办。围绕大模型落地的工程难题,北电数智在会上分享了以“数算模用”全栈赋能企业实现AI生产级部署和应用,端到端打通从模型能力到价值转化的创新实践。
北电数智智算云负责人郭文受邀出席并发表演讲。他表示,大模型只是“跑起来”并不能直接创造价值,还需迈过推理系统工程的鸿沟,才能做到“可生产、可交付”。

CCF中国计算机学会是中国计算机领域最权威的全国性学术团体。本次论坛由CCF自然语言处理专业委员会与天津师范大学联合主办,汇聚学术界与产业界核心力量,共同探讨大模型从研究走向生产的关键工程问题。
从“能跑”到“可交付”
为大模型生产级落地保驾护航
Agent浪潮引发了对AI推理需求的指数级井喷。对企业而言,尤其是政务、金融等对稳定性与合规性要求严苛的领域,要支撑海量、连续、复杂的推理任务,除大规模的算力投入外,还需要一套成熟的企业级推理系统,将模型的技术能力转化为可被业务无缝调用、7×24小时持续输出的服务能力。
郭文指出,推理系统的价值在于实现AI从“模型能跑”到“企业可生产、区域可交付”,是实现Agent等各类AI应用规模化部署的关键环节。然而,受限于全国算力资源分布不均,不同模型接口标准不一,跨区域部署与运维复杂度高,成本、响应延迟、系统稳定性难以兼顾等困境,限制了AI从模型能力到业务价值的转化。
作为面向企业生产环境、支持异构算力的大模型推理基础设施平台,北电数智宝塔·企业级推理系统以云边协同、仿真模拟、模型推理、智能运维四大创新技术体系,打造了覆盖推理引擎、推理模组、部署运维平台、推理评测体系、分布式推理套件的全链路产品体系,构建出可自主进化、可跨域调度的灵活推理架构,形成可交付、可复用、可规模化的推理能力。
得益于技术创新与工程实践,宝塔·企业级推理系统实现了3~7倍的系统级推理优化、打通了生产级交付与运行闭环、具备了自主进化和持续优化能力,让模型不止能跑起来,更能稳定、可控、持续地产生业务价值。目前,系统已支持50余款主流大模型、多模态模型快速接入,全面兼容十余种国产芯片适配,且充分满足各行业合规要求。
“数算模用”全栈赋能
端到端打通生产力转化全流程
宝塔·企业级推理系统已深度融入北电数智“数算模用”全栈产品体系。郭文谈到,AI产业落地不是单点技术的堆叠,而是一项需要全栈协同的复杂系统工程。北电数智以可信数据为根基、全栈工程化能力为支撑,将“数算模用”融为有机整体,致力于打造支撑企业业务全流程AI转型的工业化生产系统,打通生产力转化全流程。
在这一体系的支撑下,北电数智积极携手各政企机构,盘活各领域数据要素流通,支持垂类模型、智能体应用研发和应用,目前已在多个重点行业落地一批可复制、可推广的实践案例:
在工业制造领域,服务头部企业,落地设备预测性维护、文档智能问答等场景,助力工业企业降本增效;在公共服务领域,聚焦政务高频刚需场景,实现政务知识问答、网格化治理、AI助理村支书等功能落地,提升基层服务效率;在医疗健康领域,联合多家三甲医院推出AI全科助手,推动优质医疗资源下沉,助力医疗普惠;在文旅领域,助力多地打造城市IP,激活区域文旅经济。
不止于“应用落地”,北电数智更秉承“长期在地”的理念,深度赋能区域AI发展全生命周期。从城市级AI底座规划建设,到协同产业伙伴共创解决方案,再到助力招商引资、集聚高端人才,打造产业高地,构建起长效可持续的价值创造体系。
郭文表示,“北电数智以原生AI思维,持续深耕推理系统工程与全栈能力建设,重构AI的工业化生产体系,希望帮助各类企业高效、安全、低成本地拥抱大模型技术,稳步实现高质量数智化转型。”