为什么你的美股 tick 策略回测总出现“幽灵偏差”？聊聊我

我做量化分析有很长一段时间了，主要盯美股市场，策略从日频逐渐进化到分钟和 tick 级别。在这个粒度下，我越来越深刻地感受到：很多策略在回测里莫名其妙出现的偏差，根源并不是模型本身，而是数据采集时那些不起眼的“断档”。

说起来你可能不信，有一次我复盘日内反转策略，发现某只股票的成交量在特定几分钟内异常地低，进一步查证才发现，那段时间我的数据链路断了一次，WebSocket 重连后直接跳过了中间的行情，导致整个 VWAP 计算都发生了漂移。自那以后，我把断线重连和数据补推机制提到了和数据源选型同样重要的位置。

场景：tick 级流式数据的脆弱性与隐性成本

美股 tick 数据通过 WebSocket 实时推送是行业常态，但这类长连接特别容易受网络环境影响。你的云服务器可能突然抖动，数据提供方可能做常规维护，甚至只是本地网卡负载过高，都会造成掉线。问题是，大部分 API 只为“当下”服务，一旦恢复，不会主动告诉你“你错过了从 10:15:00 到 10:18:00 的行情”。

在低频场景下，丢几分钟数据可能只影响几个 K 线，但在 tick 分析里，那可能就是几百笔成交、上千档报价。这些缺失会让你对市场微观结构的理解产生断裂——流动性突然“枯竭”、价差瞬间“拉大”，其实只是你没看到罢了。这种隐性成本比显性的数据费用更可怕，因为它会无声地扭曲你的研究结论。

我的断线重连方法论：不只是重连，是会话恢复

我把解决思路总结成一套可复用的会话恢复模式，核心是在连接层实现“快速感知、有序恢复”。

心跳驱动感知：我不依赖 TCP 层的超时，而是自己维护一个心跳计时器。如果一定周期（比如 8 秒）内没有收到服务端的任何消息——包括 ping 或行情——我直接判定连接失效，立即回收资源并启动重连，把不可用时间压缩到最小。
订阅状态持久化：在每次成功订阅后，我都会把当前的股票列表存起来。重连后，程序自动遍历这个列表重新订阅，不需要人工干预，也不会因为遗忘而漏订某个品种。
智能退避与状态标记：为了避免在服务端侧形成“请求风暴”，我用逐渐增大的等待间隔重试。重连成功后会立即设置一个“数据缺口待补”的状态位，这个标志就像给下游系统递了一张便条：“从现在往回补，直到某个时间点。”

缺口补全：用历史接口把时间轴重新对齐

光有重连是不够的，补推才是保证数据连贯性的关键。我的做法很直接：在正常接收行情期间，持续更新内存中最后一条 tick 的时间戳（也可以持久化到 Redis 以防进程重启）。一旦检测到连接断开，这个时间戳就自然成为缺口的起点。

重连成功后，我会立刻向支持历史区间查询的 REST API 发起请求，传入起点时间戳，获取之后所有的 tick。像我一直用的 AllTick 数据源，它的历史接口可以精确返回这段时间内的全部逐笔数据，字段和实时流完全对齐，这让我不用做任何字段映射，直接按时间顺序插入队列就好。

import websocket
import json
import time
import requests

# 本地に保存された最後のtick時刻
last_tick_time = "2026-06-05T10:15:00Z"

def on_message(ws, message):
    data = json.loads(message)
    global last_tick_time
    last_tick_time = data["timestamp"]
    print(data)

# WebSocket再接続
def reconnect():
    ws = websocket.WebSocketApp(
        "wss://apis.alltick.co/stock/ws",
        on_message=on_message
    )
    ws.run_forever()

reconnect()

# 欠落データの補填
def fetch_missing_data(start_time):
    url = f"//apis.alltick.co/stock/api/history?start_time={start_time}"
    resp = requests.get(url)
    ticks = resp.json()
    for tick in ticks:
        print(tick)
    # 最後のtick時刻を更新
    global last_tick_time
    if ticks:
        last_tick_time = ticks[-1]["timestamp"]

fetch_missing_data(last_tick_time)

从单点方案到系统性保障的几点经验

在企业级项目里，这套机制还要做得更“耐操”，我总结了几条实用技巧：

用缓冲队列彻底解耦顺序问题：实时 tick 和补推 tick 可能并发到达，我把它们全部抛进一个按时间戳排序的缓冲队列，下游消费者只看队列，永远拿到严格递增的序列。
细粒度水位管理：不同股票的交易活跃度不一样，掉线对每只股票的影响也不同。我改为对每个代码单独记录最新 tick 时间，补推时按需拉取，既快又省资源。
健全的监控与日志：每次断线的时间点、恢复耗时时长、补推条目数，我都会详细记录，这不仅是排查网络问题的依据，日后做数据质量报告时也是坚实的底气。
重订阅分批次：重连后如果瞬间订阅几百只股票，系统容易出现处理尖峰。我会分组延迟订阅，把瞬时压力拉平成温和的斜坡。

最后：稳定的数据流比想象中的“低延迟”更重要

很多人刚开始做高频分析时，都会去追求尽可能低的延迟，但我后来慢慢意识到，对大部分策略研究和回测场景来说，确定性比极速更关键。一个能自动重连、自动补推、自动排序的数据链路，才是可信研究的基础。偶尔的网络波动不会毁掉你的分析，但没有闭环的修复能力，一定会悄悄侵蚀你对数据和模型的信心。搭建好这套机制之后，我很少再为数据完整性发愁，也终于能把精力安心地放回策略本身。