信息资源管理

AWS希望忘记阿联酋地区的三月份事件

发布于:2026-03-31 点击量:62 来源:至 顶网

本周我收到了一封来自AWS的邮件和账单通知,这可能是云计算历史上措辞最外交的沟通文件。以下是去掉常规模板内容后的核心信息:

"AWS将免除ME-CENTRAL-1地区2026年3月的所有使用相关费用。此免费政策将自动应用到您的账户,无需您采取任何行动。"

没有解释,没有提及3月1日伊朗无人机攻击物理摧毁了该地区三个可用区中的两个。没有提到109项服务的中断,也没有提及那些花费数周时间无法通过控制台终止EC2实例的客户,因为控制平面和底层硬件一样彻底瘫痪。没有承认整个月的云基础设施实际上停止了运行。甚至没有链接到他们相当简短的企业博客文章(可能因为没有侮辱金融时报的报道),解释该地区在不久的将来可能都无法可靠工作。

只是说:我们免除费用。不客气。继续前进。

我要明确表示:我对此没有意见。这是一个棘手的情况,这不是AWS的错,毕竟亚马逊还没有常备军事力量。

但这里有一点引起了我的注意。邮件继续写道:"处理完成后,您在成本和使用报告或成本浏览器中将不会看到ME-CENTRAL-1地区2026年3月的任何使用情况。"

他们不仅仅是免除客户一个月的费用;他们正在删除账单和库存数据!

对于大多数组织来说,AWS账单不仅仅是发票。它是基础设施存在、运行位置和运行时长的权威记录。成本和使用报告(CUR)是许多公司拥有的最接近单一真实来源的东西,能够准确描述他们的云足迹。即使是相对较新推出的AWS资源浏览器,声称是库存服务,也缺少一些关键资源类型。列出所有内容的唯一工具仍然是AWS账单;这是了解云环境中到底有什么的单一真实来源。

合规团队依赖它。审计师要求它。FinOps团队在其上建立整个实践。当安全团队想知道3月份除了CloudTrail显示的内容之外,您是否在中东运行资源时,他们会检查CUR。到3月31日,当他们询问时,亚马逊的答案将是:没有。您没有。那里什么都没有。一个干净、空白的月份。

基础设施确实存在,某种程度上。它运行了,或者至少试图运行。客户为无法关闭的资源付费,因为API无法访问,因为当三个可用区中的两个无响应或完全被摧毁时,没有什么能正常工作。现在所有这些记录都被归零了。

在任何人开始撰写"AWS应该为此做好准备"的热评之前:不。停止。

AWS工程师为某些类型的故障设计可用区。硬件故障、停电、光纤被其天敌"强大的挖掘机"切断、冷却系统故障等?可用区处理这些。它们的设计使一个区域的问题不会级联到另一个区域。该模型有效。它已经被反复测试。它是AWS上每个良好架构部署的支柱。无论知道与否,几乎每个AWS客户的数据恢复策略都依赖于此。

可用区不是为国家行为者决定数据中心不应该再存在而设计的。

没有人的故障树分析包括"建筑物被军用无人机击中"。世界上没有灾难恢复手册有标题为"地区武装冲突"的章节。

说实话?它不应该有。试着把这个放进你公司的数据恢复计划中,你会比我在投资公司BlackRock时更快地被取消业务连续性规划的邀请,当时我指出如果旧金山和us-east-1都不可用,绝对没有人会在可预见的未来关心我们的智能投顾,如果有的话。(我不知道为什么被解雇了。)云基础设施的整个前提是你从处理物理问题的人那里租用容量,这样你就可以专注于软件。该合同没有考虑数据中心成为军事目标,很难责怪五角大楼之外的任何人没有在风险登记册上列出这个特定项目。

那么为什么要删除数据?

我能想到两个解释,它们并不相互排斥。

首先,提供的数据可能不存在。当多个可用区因物理硬件熔化而离线,TLS现在在"地板上"终止时,计量和计费基础设施也随之消失。您无法为在不再有电力或物理凝聚力的服务器上运行的资源生成使用报告。AWS可能真的没有关于运行什么、停止什么以及何时停止的可靠遥测数据。你不能为无法测量的东西收费——你不能报告你没有记录的东西。

其次,实用主义。客户无法使用AWS控制台终止资源,因为终止命令需要确认;它们不像死狗一样被扔过栅栏让邻居担心。EC2实例卡在停止状态数周。弹性IP被困在死硬件上。如果AWS试图正常计费然后处理退款,这将意味着成千上万的个人支持工单,每一个都是准确记录失败内容和时间的书面记录。对于AWS支持部门辛勤工作的人员来说,生活会变成绝对的地狱。一次性免除和清理数据记录在操作上更简单,在外交上更整洁。

我怀疑两者都是。

无论潜在原因是什么,AWS做出了正确的决定。客户不应该为他们在因军事行动而物理摧毁的地区中无法控制的资源付费。免费是正确的结果。

但是。

机制现在存在,并且已经被执行。AWS可以清零整个地区一个月的使用数据,结果与那个月从未发生过无法区分。账单,那个唯一的权威真实来源,根本不会显示它。

今天的原因是战争,这是一个好理由。但先例不会永远附带上下文。下次CUR中缺少一个月的数据时,会有邮件吗?会有解释吗?会有你能接受的*理由*吗?

我不知道。AWS没有说。他们可能说不了太多。在3月31日之后,数据也不会说任何话了。

Q&A

Q1:AWS为什么要免除阿联酋地区三月份的费用?

A:因为伊朗无人机攻击物理摧毁了ME-CENTRAL-1地区三个可用区中的两个,导致109项服务中断,客户无法控制或终止资源。AWS认为客户不应该为在因军事行动而物理摧毁的地区中无法控制的资源付费。

Q2:AWS删除三月份数据会带来什么问题?

A:AWS账单是许多公司基础设施的权威记录,合规团队、审计师和FinOps团队都依赖它。删除数据意味着这个月的记录完全消失,可能影响合规审计和安全检查。这创造了一个先例,AWS可以清零整个地区一个月的使用数据。

Q3:可用区设计能防护哪些故障?

A:可用区设计用于处理硬件故障、停电、光纤被切断、冷却系统故障等常规故障。它们确保一个区域的问题不会级联到另一个区域。但可用区不是为国家行为者的军事攻击而设计的,没有灾难恢复计划包括"建筑物被军用无人机击中"的情况。

【版权声明】:本站内容来自于与互联网(注明原创稿件除外),如文章或图像侵犯到您的权益,请及时告知,我们第一时间删除处理!