Skip to main content

One post tagged with "software engineering"

View All Tags

「时髦」的 OpenAI 与「过时」的软件工程

· 21 min read

这篇文章的起源是 OpenAI 这个月发布的一篇故障报告,事故发生时间为 2024 年 12 月 11 日太平洋标准时间(PST)15:16 至 19:38,故障持续了将近 4 个半小时,影响范围是 ChatGPT、Sora 以及 OpenAI 的所有 API。这篇故障报告写得非常清晰,把故障时间线、影响范围、故障分析、如何一步一步处理以及后续改进措施都详细记录了下来,通篇基本没什么废话,也没有什么「遮遮掩掩」,值得作为一篇好的故障报告范例传阅给中国各大云厂商或者做 To B 服务的公司学习(说的就是你,阿里云,要写故障报告就写得认真一点,否则干脆别写)。