海量LEVEL2数据因子挖掘系列(四):集合竞价相关因子
2024-07-06数据制胜:如何能在股票市场的博弈中胜出?对于量化投资者来说,关键在于对数据的全面收集,并结合数学模型和算法进行深入分析,从海量数据中挖掘出隐藏的市场规律。
集合竞价:A 股市场的竞价时段主要分为集合竞价阶段和连续竞价阶段,而集合竞价阶段又可以分为开盘集合竞价和收盘集合竞价。其中,开盘集合竞价在09:15~09:20 时段内是可以撤回委托单的;而开盘集合竞价在09:20~09:25 时段内和收盘集合竞价14:57~15:00 时段内是不可撤回委托单的。
集合竞价因子:开盘集合竞价和收盘集合竞价作为当天股票市场的开始和结束,其中的委托、成交、撤单情况反映了当天个股的活跃度等情况,与股票市场的未来走势存在关联性。因此,本文基于level2 数据中的逐笔订单信息,利用集合竞价期间的委托、成交、撤单数据构建出了15 个集合竞价相关因子。
因子回测表现:由于上交所和深交所对集合竞价期间的level2 逐笔订单数据结构差异,本文针对深证A 指成分股范围内个股构建了上述15个集合竞价相关因子,并对其在2019 年3 月~2024 年5 月期间的深证A 指成分股范围内选股性能进行了统计。
09:15~09:20 时段:成交比例因子中表现较好的是买单方向因子,20日平滑换仓RankIC 均值为-9.20%,胜率为22%;撤单比例因子中表现较好的仍为买单方向因子,其20 日平滑换仓RankIC 均值为-5.00%,胜率为27%。
09:20~09:25 时段:成交比例因子中表现较好的是买卖双向考虑的因子,其20 日平滑换仓RankIC 均值为-9.20%,胜率为28%。
09:15~09:25 时段:成交比例因子中表现较好的是买单方向因子,20日平滑换仓RankIC 均值为-10.10%,胜率为28%。
14:57~15:00 时段:该时段成交比例因子中,买单方向因子RankIC 均值接近于0%,胜率徘徊在50%左右,是一个几乎没有选股能力的因子。但与之相反的卖单方向因子则展现出了较为有效的选股性能,其RankIC 均值为-9.60%,胜率为23%。这表明在收盘集合竞价阶段,卖单中的成交比例越大,则该股票在未来的看空可能性更大;而买单中的成交比例则与未来股价走势关系甚微。
风险提示:(1)本文所述模型用量化方法通过历史数据统计、建模和测算完成,所得结论与规律在市场政策、环境变化时存在失效风险;(2)本文策略在市场结构及交易行为改变时有可能存在失效风险;(3)因量化模型不同,本文提出的观点可能与其他量化模型结论存在差异。