高通发布AI200与AI250数据中心芯片,单卡支持768GB LPDDR5内存
创始人
2025-10-29 10:44:53
0

高通正式推出AI200与AI250两款数据中心加速器,产品核心聚焦内存容量与数据传输效率。其中,AI200加速器卡支持高达768GB LPDDR内存,可减少大型语言模型与多模态模型运行所需的硬件部件数量,同时避免频繁的卡外数据传输。

AI250则采用近内存计算布局,该设计旨在提升推理过程中的有效内存带宽。推理场景中,工作负载常因反复访问键值缓存而陷入停滞,这一架构恰好可解决此问题。高通表示,该架构能使有效内存带宽提升 10 倍以上,同时降低功耗。

高通CEO Cristiano Amon表示:“高通推出基于AI200与AI250芯片的加速器卡及整机柜产品,为数据中心AI工作负载提供行业领先的机柜级推理性能与内存效率。”

两款产品均提供加速器卡与全液冷机柜两种形态。机柜采用PCIe接口实现纵向扩展配置,通过以太网构建横向扩展集群。单个整机柜的功耗为160千瓦,与其他厂商现有GPU推理机柜处于同一级别。产品上市将分阶段推进,AI200计划于2026年推出,AI250则预计在2027年上市。此外,高通还披露其数据中心产品路线图将保持年度更新节奏,并确认HUMAIN为早期客户之一,该客户计划部署的容量最高可达200兆瓦。

各厂商数据中心芯片内存规格对比

AMD Instinct MI350X:288GB HBM3e内存,带宽8TB/s;其继任型号MI400最高将支持 432GB 内存

NVIDIA B200系列:单GPU约180GB HBM3e内存

Intel Gaudi 3:128GB HBM2e内存

从上述数据可见,高通的产品定位并非以HBM内存容量为竞争点,而是以单卡总内存容量形成差异化优势。

相关内容

最新资讯

AI业务拉动!工业富联单季净利... 工业富联 视觉中国 资料图 工业富联三季度净利润同比大增62%,800G交换机同比暴增超27倍。 1...
比亚迪携定制车型亮相2025东... 深圳商报·读创客户端记者 刘育銮 10月29日,在刚刚开幕的2025日本移动出行展(简称“东京车展”...
中国人保集团党委副书记、总裁赵... 新华社北京10月28日电(记者王艳刚)中国人保集团党委副书记、总裁赵鹏28日在2025金融街论坛年会...
市国资委机关组织退休老同志参观... 金秋送爽,人寿花香。10月29日,市国资委开展了“情暖重阳节 共话新发展”主题活动,组织机关退休老同...
公司受邀参加APEC海洋生物多... 10月28日,APEC海洋生物多样性保护与可持续社区发展研讨会在深圳正式开幕。公司受邀参加此次盛会。...
原创 西... 2024年7月,一场在荷兰阿姆斯特丹举行的技术展引起了国际媒体的围观。Segway-Ninebot的...
原创 中... 2025年刚过十个月,新能源圈里最火的词就得算“固态电池”了。 人民日报十月初就报道,咱们国家科学家...