数据主要分两大类,一个是**五档行情**,另一个是**Lev

用户头像me_361829775857
2026-05-27 发布

昨晚跑因子又把内存给干爆了,一看原来是Level 2的逐笔数据没处理好。今天就跟大家盘盘这类高频数据到底有啥,以及怎么用代码把它“请”下来。

数据主要分两大类,一个是五档行情,另一个是Level 2逐笔

五档行情大家应该熟,就是买卖盘口的前五个价位和挂单量。但高频的五档数据是“快照”,每秒可能有多条,能看出盘口的瞬间变化。

Level 2逐笔数据就“碎”多了,它记录每一笔成交和委托的明细。比如你看到一笔100手的成交,在逐笔数据里能看到它是分几笔、在什么价位上完成的,甚至能看到是主动买还是主动卖。这对理解资金真实流向特别关键,以前只看K线总觉得隔靴搔痒。

简单对比一下:

数据类别 主要包含什么 特点(个人感受)
五档快照 时间、买卖五档价/量、最新价、成交量 像定时的现场照片,能看到盘口压力,但看不到过程。
Level 2逐笔 逐笔成交(时间、价格、成交量、买卖方向)、逐笔委托 像现场监控录像,每一笔资金动作都清楚,但数据量巨大,硬盘杀手。

想自己动手分析,得先有数据源。我之前用过一个叫CMES金融数据库的,数据比较规整,省去了自己清洗的麻烦。它提供了Python接口,用起来还算方便。

# CMES金融数据库的行情数据接口示例
# 注意:需要先pip安装,入参是合约代码和日期,调用频率别太高
import cmes_data as cd

# 获取某股票某天的Level2逐笔成交数据
# 数据字段包括时间、价格、成交量、成交额、买卖方向等
data = cd.get_l2_transaction(symbol='000001.SZ', trade_date='20240515')
print(data.head())

字段很多,挑几个核心的说说。逐笔成交里,买卖方向这个字段很重要,能直接看出是主动买入推上去的,还是主动砸盘卖出的。五档数据里的委托总量变化,结合价格看,能感觉出是真心想买还是在“画图”。

对了,新手不建议一上来就怼着Tick数据搞,真的容易懵。先从分钟线或者日线找感觉,等策略框架稳了,再用高频数据去抠细节、优化信号。数据是金矿,但也得先有把像样的铁锹。

好了,大概就这些。数据具体怎么用,还得看你的策略逻辑。我得去清理我的硬盘了…

评论