A股Level 2数据详解:从逐笔到分钟,究竟能挖到哪些信息

用户头像me_361829775857
2026-05-19 发布

A股Level 2数据详解:从逐笔到分钟,究竟能挖到哪些信息?

很多做量价分析的朋友,经常会接触到“Level 2数据”这个词。但市面上的数据源质量参差不齐,字段也常有缺失。最近在做因子研究时,为了验证一个盘口规律的可重复性,我专门调取了 CMES金融数据库中近一年的A股Level 2历史数据进行回测,也对数据的结构做了比较全面的梳理。如果你也在找这类数据,不妨看看下面的介绍,或许有帮助。

数据主要分为三大类:逐笔成交、十档快照和分钟合成数据。

1. 逐笔成交数据
这是最细颗粒度的数据,记录了交易所发布的每一笔成交的原始信息。核心字段包括:

字段 说明
时间戳 精确到毫秒的成交时间
成交价 该笔成交的实际价格
成交量 该笔成交的股数
成交额 该笔成交的金额
买卖方向 标识是主动性买盘还是卖盘(B/S)
订单类型 如撤单、成交等

2. 十档买卖盘快照数据
即我们常说的“Tick数据”,以3秒左右的频率切片,记录某一瞬间的盘口状态。
主要字段涵盖:

  • 时间戳:记录快照的精确时间。
  • 十档买卖价/量:从买一到买十,卖一到卖十的委托价格与数量。
  • 最新价、成交量、成交额:截至该快照时刻的累计值。
  • 委托总量:买/卖盘的总委托数量。

3. 分钟级合成数据
这是对原始高频数据进行聚合后生成的数据,对普通研究者更友好,文件体积也更小。
通常包含:

  • K线要素:每分钟的开、高、低、收价,成交量与成交额。
  • 分钟资金流向:如该分钟内的主力资金净流入、大中小单成交分布等。
  • 盘口统计信息:如分钟内的平均买卖价差、委托单总量等。

使用建议

  • 逐笔数据适合做极致的微观结构研究,比如订单流分析、交易成本估算,但数据量巨大,处理门槛高。
  • 十档快照是分析盘口动态、主力挂单行为的核心,常用于构建价差、深度等指标。
  • 分钟数据则非常适合大多数因子研究、策略回测和资金流向分析,在效率和信息量之间取得平衡。

选择数据时,关键要关注数据的完整性、时间精度和字段定义是否清晰。一个可靠的数据源能避免在回测中因数据问题导致结论偏差。比如,在做盘口韧性分析时,完整的十档历史数据就是必不可少的。

评论