国内快讯国外快讯行业动态企业动态市场观察科技动态政策标准行业数据人物访谈行业展会自媒体

当前位置：兴旺宝>资讯首页> 企业动态

阅读排行更多

企业直播更多

推荐展会更多

阿里云推出全新AI计算解决方案：大模型所需GPU狂降82%！

2025-10-22 14:12:56来源：快科技阅读量：15342 评论

　　10月21日消息，在近日于韩国首尔举办的顶级学术会议SOSP 2025（操作系统原理研讨会）上，阿里云发布了其“Aegaeon”计算池化解决方案。

　　Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题，尤其针对那些需求突发或不可预测的大型语言模型。

　　它打破了传统的“一个模型绑定一个GPU”的低效模式，而是在Token级别虚拟化GPU访问，这意味着单个GPU可以被多个不同模型共享服务，实现精细化的资源调度。

　　阿里云Aegaeon系统作为一种推理时间调度器，它能在每次生成下一个token后，动态决定是否切换模型，从而将微小的工作片段安排到共享池中。

　　通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术，Aegaeon将模型切换开销降低了97%，确保了token级调度的实时性，可支持亚秒级的模型切换响应。

　　在阿里云模型市场为期超三个月的Beta测试中，Aegaeon系统在服务数十个参数量高达720亿的大模型时，所需的NVIDIA H20 GPU数量从1192个锐减至213个，削减比例高达82%。

　　GPU用量的大幅削减，对于硬件采购成本高昂的大型模型服务商而言，意味着成本将显著降低。

　　目前，这项核心技术已成功应用在阿里云百炼平台。

上一篇：DNE 佛山基地迎土耳其VIP团共拓合作新局

下一篇：匠心守护“玻璃心脏” 佳星玻璃维修班长李野的热与爱

版权与免责声明：1.凡本网注明“来源：兴旺宝装备总站”的所有作品，均为浙江兴旺宝明通网络有限公司-兴旺宝合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：兴旺宝装备总站”。违反上述声明者，本网将追究其相关法律责任。 2.本网转载并注明自其它来源（非兴旺宝装备总站）的作品，目的在于传递更多信息，并不代表本网赞同其观点或和对其真实性负责，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品第一来源，并自负版权等法律责任。 3.如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。

我来评论

昵称验证码匿名

文明上网，理性发言。（您还可以输入200个字符)

表情

所有评论仅代表网友意见，与本站立场无关

相关新闻

关于我们企业建站本站服务会员服务旗下网站友情链接兴旺通意见反馈展会更新

销售热线：0571-87209775 客服热线：0571-87209775 采购热线：0571-87209775 投诉热线：0571-87209775

服务咨询

QQ: 751594915网站客服

QQ:2012523075媒体合作

QQ:1097660699采购咨询

QQ:751594915

Copyright xwboo.com All Rights Reserved 法律顾问：浙江天册律师事务所贾熙明律师广播电视节目制作经营许可证 ICP备案号：浙B2-20100369

浙公网安备 33010602009452号