正在阅读：阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

快速发布采购
移动端

智能制造网APP

功能丰富实时交流

智能制造网手机站

移动端访问更便捷

智能制造网小程序

订阅获取更多服务

智能制造网官微

关注获取更多资讯

智能制造网服务号

实时接收采购订单
关注我们

抖音百家号快手 B站视频号今日头条西瓜视频小红书

抖音

百家号

快手

B站

视频号

今日头条

西瓜视频

小红书
本站服务
帮助中心

 自动化物联网机器人 3D打印仪器仪表传感器 AI芯片人工智能

当前位置：智能制造网资讯中心企业动态

阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

2025-10-21 13:24:59来源：快科技关键词：Aegaeon方案 AI模型服务阅读量：696

导读：通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术，Aegaeon将模型切换开销降低了97%，确保了token级调度的实时性，可支持亚秒级的模型切换响应。

　　10月21日消息，在近日于韩国首尔举办的顶级学术会议SOSP 2025（操作系统原理研讨会）上，阿里云发布了其“Aegaeon”计算池化解决方案。

　　Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题，尤其针对那些需求突发或不可预测的大型语言模型。

　　它打破了传统的“一个模型绑定一个GPU”的低效模式，而是在Token级别虚拟化GPU访问，这意味着单个GPU可以被多个不同模型共享服务，实现精细化的资源调度。

　　阿里云Aegaeon系统作为一种推理时间调度器，它能在每次生成下一个token后，动态决定是否切换模型，从而将微小的工作片段安排到共享池中。

　　通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术，Aegaeon将模型切换开销降低了97%，确保了token级调度的实时性，可支持亚秒级的模型切换响应。

　　在阿里云模型市场为期超三个月的Beta测试中，Aegaeon系统在服务数十个参数量高达720亿的大模型时，所需的NVIDIA H20 GPU数量从1192个锐减至213个，削减比例高达82%。

　　GPU用量的大幅削减，对于硬件采购成本高昂的大型模型服务商而言，意味着成本将显著降低。

　　目前，这项核心技术已成功应用在阿里云百炼平台。

上一篇：2500万跨界押注！传统材料巨头抢滩柔性触觉传感赛道

下一篇：巧克力换电站突破700座，冲刺全年千站目标

我要评论

昵称

匿名

文明上网，理性发言。（您还可以输入200个字符)

表情

所有评论仅代表网友意见，与本站立场无关。

版权与免责声明：

凡本站注明“来源：智能制造网”的所有作品，均为浙江兴旺宝明通网络有限公司-智能制造网合法拥有版权或有权使用的作品，未经本站授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：智能制造网”。违反上述声明者，本站将追究其相关法律责任。

本站转载并注明自其它来源（非智能制造网）的作品，目的在于传递更多信息，并不代表本站赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。如其他媒体、平台或个人从本站转载时，必须保留本站注明的作品第一来源，并自负版权等法律责任。如擅自篡改为“稿件来源：智能制造网”，本站将依法追究责任。

鉴于本站稿件来源广泛、数量较多，如涉及作品内容、版权等问题，请与本站联系并提供相关证明材料：联系电话：0571-89719789；邮箱：1271141964@qq.com。

不想错过行业资讯？

订阅 智能制造网APP

一键筛选来订阅

信息更丰富

今日焦点/FOCUS 更多

热门话题/TOPICS更多

聚焦|2025中国工博会来啦

智造新纪元，共塑工业未来蓝图！GK直播带您探索中国工博会——工业自动化展区

工博会现场：宇电精准温控方案助力中国制造业智能化升级加速

10个地区试点要素市场化配置综合改革

国务院关于全国部分地区要素市场化配置综合改革试点实施方案的批复

专家解读文章之三 | 抓试点、增动能深入推动要素市场化配置改革

精彩直播/VIDEO更多

【与智造同行】走进华为AI＋制造行业峰会2025——如何让智能制造走深走实？华为给你答案！

【与智造同行】走进华为AI＋制造行业峰会2025——如何让智能制造走深走实？华为给你答案！

: 数字孪生赋能新型工业化分论坛

: 数字孪生赋能低空经济分论坛

推荐产品/PRODUCT 更多

新民市MBR污水处理设备
一体化MBR污水处理设备,污水处理设备用途,地埋式MBR污水处理设备,碳钢、不锈钢、玻璃钢,MBR污水处理设备特点
品牌
明基环保
抗热胎压痕试验仪
地坪涂装材料,建筑涂料抗热胎压痕试验仪,轮胎块抗热胎压痕试验仪
品牌
恒品
HYDAC传感器KDS 3446-2-0250-000
贺德克传感器,hydac传感器介绍,贺德克压力变送器,资料查询贺德克传感器,HYDAC传感器数据表
品牌
干雾加湿系统
二流体雾化加湿器,干雾加湿系统,干雾加湿装置,工业干雾加湿器,干雾二流体加湿器
品牌
雾王
AIMB-786G2 研华三显高扩展工业主板
研华工业主板,工业工控机主板,嵌入式工业计算机主板,一体化工业计算机
品牌
研华/ADVANTECH
HYDAC贺德克流量阀DVE10920-12-C-V特点
HYDAC流量阀特点,贺德克流量阀作用,原装贺德克流量阀
品牌
贺德克/HYDAC

关于我们企业建站本站服务会员服务旗下网站友情链接兴旺通意见反馈分类导航

销售热线：0571-87759904 客服热线：0571-87756395 采购热线：0571-87759926

服务咨询：

网站客服：

媒体合作：

采购咨询：

Copyright gkzhan.com All Rights Reserved 法律顾问：浙江天册律师事务所贾熙明律师 ICP备案号：浙B2-20100369

浙公网安备 33010602000006号

我要投稿

投稿请发送邮件至：(邮件标题请备注“投稿”）1271141964.qq.com
联系电话0571-89719789

工业4.0时代智能制造领域“互联网＋”服务平台

智能制造网APP

功能丰富实时交流

智能制造网小程序

订阅获取更多服务

微信公众号

关注我们

抖音

智能制造网

抖音号：gkzhan

打开抖音搜索页扫一扫

视频号

智能制造网

公众号：智能制造网

打开微信扫码关注视频号

快手

智能制造网

快手ID：gkzhan2006

打开快手扫一扫关注

意见反馈 

我要投稿

投稿请发送邮件至:（邮件标题请备注“投稿”）
1271141964@qq.com
联系电话：
0571-89719789

乐鱼网页版登录入口 | 玩球通平台 | 开云官方在线入口 | 火狐官方网页版 | 开云网页版登录入口 | 开云官方端网站登录入口 | 正规NBA买球（中国）官方网站 | 华体会网页版 | 开云官方端网页版登录入口 |