--- title: AWS推出第四代Graviton4处理器,性能大幅提升并加强AI推理能力 description: 亚马逊云科技发布第四代ARM架构处理器Graviton4,提供更高性能和能效,并加入专用AI加速器,为云计算工作负载带来全新水平的性价比 category: cloud-computing date: 2024-07-20 tags: ['处理器', 'Graviton', 'ARM', '高性能计算', 'AI加速'] author: AWS计算服务团队 image: /images/awsnews/aws-graviton4.jpg views: 2189 trending: true featured: true --- # AWS推出第四代Graviton4处理器,性能大幅提升并加强AI推理能力 亚马逊云科技(AWS)今日宣布推出第四代ARM架构处理器Graviton4,这是AWS自研芯片家族的最新成员,为云计算工作负载提供了显著的性能、效率和成本优势。Graviton4不仅在通用计算性能上实现了大幅提升,还首次加入了专用AI推理加速器,为机器学习应用提供更强大的支持。 ## 性能与架构突破 Graviton4处理器展现了多项关键性能指标的显著提升: - 较Graviton3提升高达**30%**的整体性能 - 单线程性能提升**25%** - 浮点性能提升**40%** - 每瓦性能提升**35%**(能效) - AI推理性能比Graviton3快**4倍** - 支持高达**96**个vCPU核心(比Graviton3的64核增加50%) - 带宽比Graviton3提升**33%** Graviton4基于Arm Neoverse V2内核架构,还采用了多项定制优化,包括: - 增强的分支预测器 - 扩展的指令重排序窗口 - 更大的L1和L2缓存 - 改进的内存子系统 - 专用神经网络加速引擎 ## 适配的工作负载 Graviton4处理器专为多种高性能云工作负载优化: ### 通用计算工作负载 - Web服务与微服务(Java、Go、Python、Node.js等) - 容器化应用和Kubernetes工作负载 - 开源数据库(MySQL、PostgreSQL、Redis等) - 内存缓存和分布式缓存系统 - 高性能计算(HPC)应用 ### AI和机器学习 - 大规模机器学习推理 - 自然语言处理服务 - 图像识别和计算机视觉 - 实时推荐系统 - 时间序列分析和预测 ## 支持的AWS实例与服务 Graviton4将为以下AWS实例和服务提供支持: - **Amazon EC2 R8g实例** - 内存优化型实例,针对内存密集型工作负载 - **Amazon EC2 C8g实例** - 计算优化型实例,针对高性能计算 - **Amazon EC2 M8g实例** - 通用型实例,平衡计算、内存和网络资源 - **Amazon RDS** - 提高数据库性能,降低成本 - **Amazon ElastiCache** - 加速缓存性能 - **Amazon EKS** - 优化容器工作负载 - **AWS Lambda** - 提高无服务器计算效率 首批基于Graviton4的EC2 R8g实例现已在AWS预览计划中提供,支持多种实例大小,从r8g.medium(1 vCPU)到r8g.48xlarge(96 vCPU)。 ## 实际性能表现 AWS和早期客户的基准测试显示了Graviton4的显著性能优势: ### 数据库性能 与Graviton3相比: - MySQL性能提升29% - PostgreSQL性能提升27% - Redis性能提升33% - Cassandra吞吐量提升35% ### Web服务器和应用框架 与Graviton3相比: - NGINX请求处理提升28% - Apache HTTP Server提升26% - Spring Boot应用提升31% - Django应用提升29% ### AI推理性能 支持多种AI框架的高效推理: - PyTorch模型推理速度提升4.2倍 - TensorFlow模型推理速度提升3.8倍 - ONNX Runtime性能提升4倍 ## 客户反馈:金融服务与电商 多家企业已在预览阶段体验了Graviton4的性能: > "作为一家大型金融服务公司,我们需要高性能、低延迟的计算来处理实时交易和风险分析。在预览期间,我们的风险模拟工作负载在Graviton4上比Graviton3快了约30%,同时成本降低约20%。更令人兴奋的是,我们的机器学习风险评估模型在Graviton4的AI加速器上运行速度提高了近4倍,这显著改善了我们的实时决策能力。" > — 某全球金融机构技术架构副总裁 > "我们的电子商务平台在季节性高峰期需要大规模扩展。在测试中,我们的容器化微服务在Graviton4上比Graviton3快28%,我们的推荐引擎性能提升超过3倍。这意味着我们可以使用更少的实例处理相同的流量,降低成本的同时提供更佳的客户体验。迁移过程也很简单,因为我们的应用已经在Graviton3上运行良好。" > — 某大型电商平台首席技术官 ## 开发者生态系统 AWS继续扩展Graviton生态系统,使迁移更加简单: - 目前已有**超过80万**个应用和服务在Graviton上运行 - 超过**12,000**个开源软件包优化支持ARM架构 - 所有主流编程语言和框架(Java、Python、Go、Node.js、.NET等)都可本地运行 - 提供完整的开发工具链,包括编译器、调试器和性能分析工具 - AWS Graviton Fast Start计划提供迁移支持和最佳实践 ## ARM架构的持续发展 自2018年首次推出Graviton处理器以来,AWS已成为ARM服务器架构采用的领导者: - **Graviton (2018)** - 首代ARM处理器 - **Graviton2 (2020)** - 比第一代性能提高7倍 - **Graviton3 (2022)** - 比Graviton2提高25%性能 - **Graviton4 (2024)** - 比Graviton3提高30%性能,新增AI加速 这一发展轨迹证明了ARM架构作为数据中心和云计算处理器的可行性和性能潜力。 ## 能效与可持续发展影响 Graviton4处理器对AWS可持续发展承诺做出了重要贡献: - 每瓦性能比Graviton3提高35% - 每vCPU平均功耗降低20% - 帮助AWS数据中心减少碳足迹 - 使客户能够降低计算工作负载的环境影响 - 支持AWS到2025年实现100%可再生能源供电目标 ## 优化工作负载的最佳实践 AWS提供了多种资源,帮助客户在Graviton4上获得最佳性能: 1. **应用评估** - 确定哪些应用最适合迁移到Graviton4 2. **代码审核** - 检查与架构相关的依赖和优化点 3. **性能测试** - 比较ARM和x86实例上的应用性能 4. **逐步迁移** - 使用蓝绿部署策略安全迁移工作负载 5. **架构优化** - 利用Graviton4特性调整应用架构 详细的最佳实践文档可在[AWS Graviton开发者门户](https://aws.amazon.com/ec2/graviton/)获取。 ## 定价与成本优势 基于Graviton4的实例提供显著的价格性能优势: - 较同等x86实例节省**20-40%**的成本 - 较Graviton3实例降低约**10%**的每vCPU成本 - 内置AI加速器不额外收费 - 支持EC2 Spot实例,可提供额外高达70%的成本节约 最终定价将在实例正式发布时公布。 ## 全球可用性 AWS计划在2024年后期在全球主要AWS区域陆续推出基于Graviton4的EC2 R8g实例: - 美国:弗吉尼亚北部、俄亥俄、俄勒冈 - 欧洲:爱尔兰、法兰克福、伦敦 - 亚太:东京、新加坡、悉尼 - 其他区域将在2025年初逐步上线 ## 入门指南 对Graviton4感兴趣的客户可以通过以下方式开始: 1. 申请加入[EC2 R8g预览计划](https://aws.amazon.com/ec2/r8g-preview/) 2. 利用[AWS Graviton Fast Start](https://aws.amazon.com/graviton/fast-start/)计划和资源 3. 使用[AWS Graviton Ready探索器](https://awsgravity.com/)评估应用兼容性 4. 参考[Graviton开发者文档](https://github.com/aws/aws-graviton-getting-started) 5. 参加AWS提供的Graviton4开发者网络研讨会 ## 结论 AWS Graviton4处理器代表了AWS芯片设计能力的又一次重大飞跃,为客户提供卓越的性能、效率和成本优势。通过增加专用AI加速功能,Graviton4不仅加强了传统工作负载的处理能力,还为机器学习应用提供了显著的性能提升。 随着云计算工作负载对性能和效率要求的不断提高,Graviton4展现了自定义芯片如何为特定需求提供优化解决方案。对于寻求降低成本同时提高计算性能的企业而言,Graviton4代表了云计算基础设施的未来发展方向。