186 lines
7.7 KiB
Markdown
186 lines
7.7 KiB
Markdown
---
|
||
title: AWS推出第四代Graviton4处理器,性能大幅提升并加强AI推理能力
|
||
description: 亚马逊云科技发布第四代ARM架构处理器Graviton4,提供更高性能和能效,并加入专用AI加速器,为云计算工作负载带来全新水平的性价比
|
||
category: cloud-computing
|
||
date: 2024-07-20
|
||
tags: ['处理器', 'Graviton', 'ARM', '高性能计算', 'AI加速']
|
||
author: AWS计算服务团队
|
||
image: /images/awsnews/aws-graviton4.jpg
|
||
views: 2189
|
||
trending: true
|
||
featured: true
|
||
---
|
||
|
||
# AWS推出第四代Graviton4处理器,性能大幅提升并加强AI推理能力
|
||
|
||
亚马逊云科技(AWS)今日宣布推出第四代ARM架构处理器Graviton4,这是AWS自研芯片家族的最新成员,为云计算工作负载提供了显著的性能、效率和成本优势。Graviton4不仅在通用计算性能上实现了大幅提升,还首次加入了专用AI推理加速器,为机器学习应用提供更强大的支持。
|
||
|
||
## 性能与架构突破
|
||
|
||
Graviton4处理器展现了多项关键性能指标的显著提升:
|
||
|
||
- 较Graviton3提升高达**30%**的整体性能
|
||
- 单线程性能提升**25%**
|
||
- 浮点性能提升**40%**
|
||
- 每瓦性能提升**35%**(能效)
|
||
- AI推理性能比Graviton3快**4倍**
|
||
- 支持高达**96**个vCPU核心(比Graviton3的64核增加50%)
|
||
- 带宽比Graviton3提升**33%**
|
||
|
||
Graviton4基于Arm Neoverse V2内核架构,还采用了多项定制优化,包括:
|
||
|
||
- 增强的分支预测器
|
||
- 扩展的指令重排序窗口
|
||
- 更大的L1和L2缓存
|
||
- 改进的内存子系统
|
||
- 专用神经网络加速引擎
|
||
|
||
## 适配的工作负载
|
||
|
||
Graviton4处理器专为多种高性能云工作负载优化:
|
||
|
||
### 通用计算工作负载
|
||
|
||
- Web服务与微服务(Java、Go、Python、Node.js等)
|
||
- 容器化应用和Kubernetes工作负载
|
||
- 开源数据库(MySQL、PostgreSQL、Redis等)
|
||
- 内存缓存和分布式缓存系统
|
||
- 高性能计算(HPC)应用
|
||
|
||
### AI和机器学习
|
||
|
||
- 大规模机器学习推理
|
||
- 自然语言处理服务
|
||
- 图像识别和计算机视觉
|
||
- 实时推荐系统
|
||
- 时间序列分析和预测
|
||
|
||
## 支持的AWS实例与服务
|
||
|
||
Graviton4将为以下AWS实例和服务提供支持:
|
||
|
||
- **Amazon EC2 R8g实例** - 内存优化型实例,针对内存密集型工作负载
|
||
- **Amazon EC2 C8g实例** - 计算优化型实例,针对高性能计算
|
||
- **Amazon EC2 M8g实例** - 通用型实例,平衡计算、内存和网络资源
|
||
- **Amazon RDS** - 提高数据库性能,降低成本
|
||
- **Amazon ElastiCache** - 加速缓存性能
|
||
- **Amazon EKS** - 优化容器工作负载
|
||
- **AWS Lambda** - 提高无服务器计算效率
|
||
|
||
首批基于Graviton4的EC2 R8g实例现已在AWS预览计划中提供,支持多种实例大小,从r8g.medium(1 vCPU)到r8g.48xlarge(96 vCPU)。
|
||
|
||
## 实际性能表现
|
||
|
||
AWS和早期客户的基准测试显示了Graviton4的显著性能优势:
|
||
|
||
### 数据库性能
|
||
|
||
与Graviton3相比:
|
||
- MySQL性能提升29%
|
||
- PostgreSQL性能提升27%
|
||
- Redis性能提升33%
|
||
- Cassandra吞吐量提升35%
|
||
|
||
### Web服务器和应用框架
|
||
|
||
与Graviton3相比:
|
||
- NGINX请求处理提升28%
|
||
- Apache HTTP Server提升26%
|
||
- Spring Boot应用提升31%
|
||
- Django应用提升29%
|
||
|
||
### AI推理性能
|
||
|
||
支持多种AI框架的高效推理:
|
||
- PyTorch模型推理速度提升4.2倍
|
||
- TensorFlow模型推理速度提升3.8倍
|
||
- ONNX Runtime性能提升4倍
|
||
|
||
## 客户反馈:金融服务与电商
|
||
|
||
多家企业已在预览阶段体验了Graviton4的性能:
|
||
|
||
> "作为一家大型金融服务公司,我们需要高性能、低延迟的计算来处理实时交易和风险分析。在预览期间,我们的风险模拟工作负载在Graviton4上比Graviton3快了约30%,同时成本降低约20%。更令人兴奋的是,我们的机器学习风险评估模型在Graviton4的AI加速器上运行速度提高了近4倍,这显著改善了我们的实时决策能力。"
|
||
> — 某全球金融机构技术架构副总裁
|
||
|
||
> "我们的电子商务平台在季节性高峰期需要大规模扩展。在测试中,我们的容器化微服务在Graviton4上比Graviton3快28%,我们的推荐引擎性能提升超过3倍。这意味着我们可以使用更少的实例处理相同的流量,降低成本的同时提供更佳的客户体验。迁移过程也很简单,因为我们的应用已经在Graviton3上运行良好。"
|
||
> — 某大型电商平台首席技术官
|
||
|
||
## 开发者生态系统
|
||
|
||
AWS继续扩展Graviton生态系统,使迁移更加简单:
|
||
|
||
- 目前已有**超过80万**个应用和服务在Graviton上运行
|
||
- 超过**12,000**个开源软件包优化支持ARM架构
|
||
- 所有主流编程语言和框架(Java、Python、Go、Node.js、.NET等)都可本地运行
|
||
- 提供完整的开发工具链,包括编译器、调试器和性能分析工具
|
||
- AWS Graviton Fast Start计划提供迁移支持和最佳实践
|
||
|
||
## ARM架构的持续发展
|
||
|
||
自2018年首次推出Graviton处理器以来,AWS已成为ARM服务器架构采用的领导者:
|
||
|
||
- **Graviton (2018)** - 首代ARM处理器
|
||
- **Graviton2 (2020)** - 比第一代性能提高7倍
|
||
- **Graviton3 (2022)** - 比Graviton2提高25%性能
|
||
- **Graviton4 (2024)** - 比Graviton3提高30%性能,新增AI加速
|
||
|
||
这一发展轨迹证明了ARM架构作为数据中心和云计算处理器的可行性和性能潜力。
|
||
|
||
## 能效与可持续发展影响
|
||
|
||
Graviton4处理器对AWS可持续发展承诺做出了重要贡献:
|
||
|
||
- 每瓦性能比Graviton3提高35%
|
||
- 每vCPU平均功耗降低20%
|
||
- 帮助AWS数据中心减少碳足迹
|
||
- 使客户能够降低计算工作负载的环境影响
|
||
- 支持AWS到2025年实现100%可再生能源供电目标
|
||
|
||
## 优化工作负载的最佳实践
|
||
|
||
AWS提供了多种资源,帮助客户在Graviton4上获得最佳性能:
|
||
|
||
1. **应用评估** - 确定哪些应用最适合迁移到Graviton4
|
||
2. **代码审核** - 检查与架构相关的依赖和优化点
|
||
3. **性能测试** - 比较ARM和x86实例上的应用性能
|
||
4. **逐步迁移** - 使用蓝绿部署策略安全迁移工作负载
|
||
5. **架构优化** - 利用Graviton4特性调整应用架构
|
||
|
||
详细的最佳实践文档可在[AWS Graviton开发者门户](https://aws.amazon.com/ec2/graviton/)获取。
|
||
|
||
## 定价与成本优势
|
||
|
||
基于Graviton4的实例提供显著的价格性能优势:
|
||
|
||
- 较同等x86实例节省**20-40%**的成本
|
||
- 较Graviton3实例降低约**10%**的每vCPU成本
|
||
- 内置AI加速器不额外收费
|
||
- 支持EC2 Spot实例,可提供额外高达70%的成本节约
|
||
|
||
最终定价将在实例正式发布时公布。
|
||
|
||
## 全球可用性
|
||
|
||
AWS计划在2024年后期在全球主要AWS区域陆续推出基于Graviton4的EC2 R8g实例:
|
||
|
||
- 美国:弗吉尼亚北部、俄亥俄、俄勒冈
|
||
- 欧洲:爱尔兰、法兰克福、伦敦
|
||
- 亚太:东京、新加坡、悉尼
|
||
- 其他区域将在2025年初逐步上线
|
||
|
||
## 入门指南
|
||
|
||
对Graviton4感兴趣的客户可以通过以下方式开始:
|
||
|
||
1. 申请加入[EC2 R8g预览计划](https://aws.amazon.com/ec2/r8g-preview/)
|
||
2. 利用[AWS Graviton Fast Start](https://aws.amazon.com/graviton/fast-start/)计划和资源
|
||
3. 使用[AWS Graviton Ready探索器](https://awsgravity.com/)评估应用兼容性
|
||
4. 参考[Graviton开发者文档](https://github.com/aws/aws-graviton-getting-started)
|
||
5. 参加AWS提供的Graviton4开发者网络研讨会
|
||
|
||
## 结论
|
||
|
||
AWS Graviton4处理器代表了AWS芯片设计能力的又一次重大飞跃,为客户提供卓越的性能、效率和成本优势。通过增加专用AI加速功能,Graviton4不仅加强了传统工作负载的处理能力,还为机器学习应用提供了显著的性能提升。
|
||
|
||
随着云计算工作负载对性能和效率要求的不断提高,Graviton4展现了自定义芯片如何为特定需求提供优化解决方案。对于寻求降低成本同时提高计算性能的企业而言,Graviton4代表了云计算基础设施的未来发展方向。 |