Error Handling Guide

Search 和 lookup 工作流里的 Twitter API 错误处理，避免临时失败把整条流程搞崩

很多 search 和 lookup 流程会在 retry、fallback 和 debug note 都没写清楚时，悄悄变得不可维护。稳的 error handling，会让 monitoring path 更可读，也更容易让团队信任。

2026-04-20

1. 先把“可重试失败”和“需要人工看”的失败分开

不是每种失败都该走同一条处理路径。有些应该自动重试，有些则应该留下明确 workflow state 等团队复核。

很多时候，静默失败比显式失败更伤害团队信任。

当 retry 规则太宽、又没人说得清为什么这样写时，后面的 debug 会非常难做。

更稳的方式，通常是把 retry 收窄到少数明确的临时失败条件。

即使 search 或 lookup 失败，也最好留下足够 workflow context，让团队知道当时在跑什么 job、什么 query 或账号参与了这次失败。

这在 repeated monitoring 里尤其重要，因为很多失败只有以后才会看出影响。

最有用的错误处理，不只是 retry，而是当一类失败反复出现时，能告诉团队这条工作流本身要维护了。

很多 repeated failure 最后都说明 query、checkpoint 或 routing 逻辑需要重看。

这些通常会在 Twitter / X 数据流程不再只是一次性测试、而是开始长期跑任务时出现。

通常是太早把失败吞掉，而不是把它显式留成团队还能复核的 workflow state。

通常不该。retry 最稳的做法是只覆盖少数明显临时的失败。

因为它回答的是团队在“第一次成功请求之后”真正会遇到的维护问题，这类问题比泛产品话术更真实，也更容易建立可信度。

如果问题更像“结果不完整”而不是显式失败，可以继续看这页。

如果 repeated failure 其实是 checkpoint 问题，可以继续看这页。

如果 endpoint 选错导致工作流太复杂，可以继续看这页。

如果你想把 error handling 决策和文档里的实现方式对照起来，可以继续看文档。

如果这些问题已经开始频繁出现在你的流程里，可以去验证 tweet search、账号复核或 timeline 接入路径，并把输出接进稳定团队循环。