从 K 线到 Tick：量化系统中数据粒度的取舍

在量化交易系统的设计中，行情数据往往被视为“已经解决的问题”。
K 线接口成熟、历史数据丰富，搭建策略与回测框架并不困难。

但在系统逐步演进后，尤其是交易频率提高、策略开始关注更短时间尺度时，数据粒度往往会成为隐性约束。

本文结合实际系统开发经验，讨论在什么情况下需要从 K 线过渡到 tick 数据，以及这一调整对策略研究和系统稳定性的影响。

场景变化：什么时候 K 线开始不够用

在以下几类研究或实盘场景中，我们会明显感受到 K 线的局限性：

策略对入场或出场时机较为敏感
需要监控盘中异常波动或成交行为
模型依赖更连续的价格变化而非聚合结果

K 线本质上是对行情的再加工结果，更适合描述“状态”；
而在上述场景中，研究对象更接近“过程”。

数据层面的核心问题

引入 tick 数据并不是为了追求“更高频”，而是为了获得更完整的市场信息。

在实际接入过程中，真正需要关注的问题包括：

数据是否连续、是否存在推送间断
延迟在高波动时是否放大
多品种订阅时，字段与时间戳是否一致

这些问题不会直接体现在策略代码中，但会通过回测结果稳定性、信号一致性等方式间接反映出来。

接入方式的选择：轮询与推送

在实时行情获取上，REST API 轮询的实现成本较低，适合低频研究或验证阶段使用。
但在以下情况下，轮询模式会逐渐暴露不足：

请求频率受限，难以覆盖细粒度变化
网络抖动会直接影响数据完整性
数据更新呈现明显的“批次特征”

因此，在需要持续接收 tick 数据的系统中，WebSocket 推送通常是更合理的选择。

工程实践：Tick 数据的接入与使用

在系统实现上，我们采用 WebSocket 方式订阅实时 tick 数据，并将其作为数据管道的一部分，而非直接绑定策略逻辑。

示例中通过 Python 建立连接并订阅 BTC/USD 的 tick 数据（代码保持不变）：

import websocket
import json

# AllTick API WebSocket 地址
url = "wss://api.alltick.co/realtime"

def on_message(ws, message):
    data = json.loads(message)
    # 打印每一条 tick 数据
    print(f"时间: {data['timestamp']} | 市场: {data['market']} | 价格: {data['price']} | 成交量: {data['volume']}")

def on_open(ws):
    print("连接已建立，开始订阅 tick 数据...")
    # 订阅 BTC/USD 的 tick 数据示例
    subscribe_data = {
        "action": "subscribe",
        "symbols": ["BTC/USD"]
    }
    ws.send(json.dumps(subscribe_data))

def on_close(ws):
    print("连接关闭")

ws = websocket.WebSocketApp(url,
                            on_open=on_open,
                            on_message=on_message,
                            on_close=on_close)

ws.run_forever()

在实际系统中，tick 数据通常会被：

写入缓存或消息队列
转换为统一的内部数据结构
提供给策略、监控或可视化模块使用

这样可以避免策略层直接依赖具体的数据源实现。

对回测与研究的影响

tick 数据并不会天然提升策略收益，但它能带来两点实际价值：

回测结果更贴近真实交易环境
特别是在存在滑点、成交密集或快速波动的情况下。
模型行为更容易解释
连续数据有助于分析信号形成过程，而不仅是结果。

在多次对比中可以观察到，使用 tick 数据构建的研究结果，其稳定性和可复现性通常更好。

总结

是否引入 tick 数据，取决于系统阶段和研究目标，而不是频率本身。

当策略或模型已经开始受到数据粒度限制时，
将行情数据从“结果型”升级为“过程型”，往往是自然的一步。

数据层的设计属于基础设施，一旦选型不当，后续优化成本会持续放大。
因此，在系统演进阶段，提前评估数据粒度、延迟与一致性，通常比单纯优化策略逻辑更有效。

希望这些实践经验能为正在进行系统优化或策略研究的朋友提供一些参考。