Facebook解释周一全球停摆背后的骨干网络关闭事件

导致Facebook、其相关服务（Instagram、WhatsApp、Oculus、Messenger）、其企业平台和公司内部网络瘫痪的大规模故障，都是从一次例行维护开始的。据基础设施副总裁桑托什·贾纳丹（Santosh Janardhan）说，在维护过程中发出的一条命令无意中导致了连接世界上所有Facebook数据中心的骨干网的关闭。

图片.png

这本身就够糟糕的了，但正如我们已经解释过的，你无法使用Facebook的原因是，指向其服务器的DNS和BGP路由信息突然消失了。但据Janardhan说，这个问题原本反倒是次要的，因为Facebook的DNS服务器注意到与骨干网的连接丢失，并停止分发BGP路由信息，以帮助互联网上的每台计算机找到其服务器，这就导致DNS服务器本身仍在工作，但它们无法到达。

然后连锁反应恶化了问题的表现：网络连接的缺乏和DNS的丢失切断了服务器与试图修复问题的工程师的联系，并禁用了他们通常用于修复和通信的许多工具--就像我们昨天听到的那样：

图片.png

什么是BGP，它在Facebook的大规模故障中发挥了什么作用？

由于围绕这一关键硬件的物理和系统安全问题，工程师们遇到了额外的障碍。一旦他们"激活安全访问协议"（这显然不是"用角磨机切开服务器门"的暗语），他们就能够让主干网上线，并在逐渐增加的负载中慢慢恢复服务。这也是昨天一些人花了较长时间才恢复访问的部分原因，因为一次性打开所有资源所带来报复性访问需求可能会导致计算机更多的崩溃。

所以，没有黑客入侵，只是一个审计工具遗漏了一个命令中的错误，而在六个小时内，连接数十亿人的服务就这样莫名其妙地消失了这么久。

对文章打分

Facebook解释周一全球停摆背后的骨干网络关闭事件

最新资讯

编辑精选

热门评论

相关文章

App 30天内疯狂访问位置信息7万次小红书客服回应：不会泄露隐私

Meta同意不追踪原告从而解决了英国“反对广告追踪权”诉讼

TikTok 将开始向用户的“For you”栏目推送AMBER警报

Meta下周将在美国推出社区笔记功能基于X的开源技术

小红书新规：禁止引导站外交易违规最高永久封号

吹哨人揭秘Facebook曾为进入中国而专门设计内容审查系统

Top 10

“不结账不给装电梯”要回4.62亿这家公司卡住了恒大的脖子

NASA等了11年的观测：竟被一根破裂的水管逼停了

现在任何人都无需登录即可使用 Google Gemini

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

头发白了，还能变黑吗？医生的答案出乎意料

下毒迷晕再交配为避免被吃掉，雄性蓝纹章鱼手段很“下作”