小微

基于排序学习的选股增强策略

2025月12月01日 79534浏览

西南证券股份有限公司博士后研究人员、权益投资一部交易员 慕宗燊

基于排序学习的选股增强策略

摘要

基于排序学习的选股增强策略

2025年中国A股市场风险偏好显著提升,增量资金持续入场,助推A股呈现稳步上行趋势。中小盘风格表现尤为亮眼,量化模型借技术优势超额收益显著领先指数。目前,大多数量化多因子模型对横截面收益率预测采用均方误差的损失函数进行模型优化,这种方法追求精确值预测,对极端值敏感,并不能直接衡量股票间的排序结果,因此导致策略模型在选择头部股票的时候,缺乏区分力度,多头策略的表现欠佳。本文提出了一种基于排序学习的LightGBM选股模型,通过LightGBM模型对多因子进行非线性关系的组合,利用LambdaRank排序学习算法对横截面股票收益进行最大化排序一致性的优化,通过引入位置感知机制、灵活利用标注类型,使模型直接输出股票间相对序位匹配组合构建逻辑,提升对头部股票的关注度,实现多头策略的改善。在中国A股市场的实验表明,基于排序学习的机器学习算法可有效提升投资组合的夏普比率。

基于排序学习的选股增强策略

 

1.引言

2025年中国A股市场正处于“结构性缓慢上行行情”的启动阶段,其核心驱动力源于政策逆周期调节加码与市场流动性持续宽松的双重支撑。一方面,货币政策延续宽松基调,央行通过降准降息推动企业融资成本降至历史低位,并配合财政扩张(广义财政赤字或达12万亿)投向新型城镇化、消费及新兴产业;另一方面,经济基本面逐步企稳,房地产销售降幅收窄叠加制造业升级,驱动沪深300盈利增速预期修复。在此背景下,投资者风险偏好显著提升,股权风险溢价高于历史均值1.2个标准差,居民超额储蓄(约6万亿)与险资增配权益资产(年入市规模近7000亿)共同形成增量资金池,为市场提供流动性支撑。

当前A股估值处于中长期洼地,较全球新兴市场存在显著折价。在风格快速轮动与市场效率提升的背景下,传统多因子模型的同质化风险加剧(40%机构策略相似),量化选股模型通过动态因子加权成为破局关键。

传统资产定价模型(如CAPM、APT、Fama-French三因子模型)通过线性回归框架识别系统性风险因子(市场风险、规模、价值等),其核心贡献在于将收益归因于有限维度的经济逻辑变量(如企业基本面、宏观风险溢价)。然而,随着市场结构复杂化与另类数据激增,传统模型面临两大瓶颈。一是非线性关系建模不足,股价驱动因子间的交互效应(如动量与波动率的协同作用)难以通过线性方程刻画。二是高维特征处理低效,当因子数量增至百维以上(如资金流、舆情、供应链数据),传统方法易陷入“维度灾难”。在此背景下,决策树与神经网络(ResNet、LSTM、CNN)等机器学习算法凭借非线性函数拟合能力成为收益预测的新范式。尤其神经网络通过深层特征变换可挖掘因子间的隐性关联(例如CNN捕捉量价时空模式、LSTM建模因子时变效应),在预测精度上显著超越线性模型。尽管神经网络预测性能卓越,但其在金融场景的落地面临两大关键挑战:模型复杂性过高,深度网络需超参数调优、GPU算力支持及海量训练数据,中小券商基础设施难以承载(如ResNet训练单模型耗时超LightGBM的5倍);因子归因能力弱,隐层特征变换导致经济逻辑模糊,无法清晰追溯收益来源(例如无法量化价值因子对组合收益的贡献度),严重阻碍策略迭代与风控审计。相比之下,LightGBM凭借梯度提升决策树(GBDT)框架,在保持非线性建模能力的同时兼具解释性与低复杂性。

LightGBM框架进行横截面收益率预测,其核心是通过梯度提升决策树(GBDT)融合高维因子(如量价、基本面、资金流等),以均方误差(MSE)作为损失函数回归预测个股绝对收益率。这一方法虽能捕捉因子非线性关系,却存在本质性缺陷:目标函数与投资任务错位。MSE优化的是收益率绝对值预测精度,而投资组合构建实际依赖的是股票相对排序(如优选TopK个股);其平等加权所有样本误差的特性导致对尾部噪声敏感(如财报暴雷股),且忽略头部股票排序准确性的关键价值(NDCG@K指标与MSE优化方向脱节),最终使组合收益被非关键误差干扰。

为克服上述缺陷,本文将排序学习(LambdaRank[8])损失函数被引入LightGBM框架,实现从“回归预测”到“排序优化”的范式升级。排序学习的创新一方面将梯度重构,绕过显式损失函数定义,直接基于排序评价指标(如NDCG)设计梯度;另一方面将股票样本数据在训练时以分组形式指定每日横截面股票池规模,确保同一交易日股票作为独立查询组参与排序学习,从而直接优化头部股票的分层准确性。

在中国A股市场的实证表明,对于LightGBM选股模型,排序学习策略在相同因子库下相比MSE均值回归策略夏普比率提升66%(1.86 vs 1.12),换手率降低46%,验证了排序学习对量化选股任务的目标适配性。

2.相关工作

在不确定条件下资产未来风险与收益之间的权衡关系是资产定价(Asset Pricing)的核心问题。传统资产定价模型主要有资本资产定价模型(CAPM)和套利定价理论(APT)。CAPM 是基于风险资产期望收益均衡基础上的预测模型,它认为资产的预期收益率等于无风险利率加上风险溢价,而风险溢价取决于资产的系统性风险。APT认为资产的预期收益率取决于多个因素,而不仅仅是市场组合的收益率。它通过构建多因素模型来解释资产的收益。如果资产的定价不合理,就会出现套利机会,投资者会通过套利行为使资产价格回归合理水平。Fama-French三因子模型认为股票的收益率除了受市场风险因素影响外,还受到公司规模、账面市值比等因素的影响。套利定价理论为三因子模型的发展提供了理论基础,Fama-French三因子模型是在套利定价理论基础上的具体应用和拓展。Fama-French多因子模型还存在盈利水平风险、投资水平风险等其他因素影响股票的收益率。随着数据的丰富和计算能力的提升,大量的因子被挖掘出来,用于解释资产价格或投资组合的表现,就如同一个“动物园” 里有各种各样的因子——“Factor Zoo”。这些因子来源多样、数量众多且特性各异,主要分为市场因子、规模因子、价值因子、盈利因子、投资因子等。

金融数据和因子的几何式增长对传统资产定价和组合管理模型的参数估计、有效性都充满了挑战。随着深度学习的提出和硬件算力的提升,金融领域也正在迎接“大数据+深度模型”的时代。金融数据具有非线性、非平稳性和高噪音性三大性质,这对于传统统计学方法是困难的,但机器学习不需要复杂的数据预处理,能够通过大量样本的训练保证模型的泛化能力。其中集成学习算法将多个弱学习器通过各种投票机制构建成一个强学习器的模型,在图像识别、自然语言处理等领域都有广泛应用。目前集成算法分为Bagging(袋装法)和Boosting(提升法)两类。Bagging以随机森林为代表,通过对原始数据集进行有放回的随机抽样,得到多个不同的子数据集,然后分别在这些子数据集上训练多个弱学习器(通常是决策树),最后通过投票等方式将这些弱学习器的结果进行组合。Boosting以AdaBoost(Adaptive Boosting)、 GBDT(Gradient Boosting Decision Tree)为代表,是一种串行的集成方法,即依次训练多个弱学习器,每个弱学习器都是基于上一个弱学习器的错误进行调整和改进。通过不断地调整样本权重和学习器权重,使得后续的弱学习器更加关注那些被前一个弱学习器错误分类的样本,从而逐步提高整体模型的性能。微软开发的LightGBM采用了一系列优化技术,在训练速度、内存占用和准确率等方面具有明显优势,广泛应用于信用风险评估、金融市场价格和趋势预测等任务。

3.方法

根据决策树输出结果的不同,决策树可以分为分类树和回归树两类。其核心逻辑是根据度量标准,从树根开始选择最优特征逐级分裂,递推生成一颗完整的决策树。业界大多使用信息增益(表示信息不确定性减少的程度,越大越好)、信息增益比(越大越好)、基尼系数(衡量集合的纯度,越小越好)作为分裂标准。CART(Classification and Regression Tree)决策树每次选择基尼系数最小的属性进行迭代,它既可以解决分类问题又可以解决回归问题。决策树在建立树时如果参数选择不合理(即树根或者枝干略有差池),树就可能会彻底长偏,产生过拟合的现象,导致泛化能力变弱,因此大多会采用剪枝、交叉验证等手段。除此之外,为了有效减少单决策树带来的问题,与决策树相关的组合(比如Bagging, Boosting等算法)也逐渐被引入进来,这些算法的精髓都是通过生成N棵树(N可能高达几百)最终形成一棵最适合的大树。如图1所示,Bagging技术类似多数投票机制,对于不同的分类器可以通过并行训练而获得,且每个分类器的权重相等;但Boosting则是在前面已训练获得的分类器基础上加以调整(更关心之前分类器分错的样本)而获得新的分类器,因此Boosting中的分类器权重并不相等,其权重值代表该分类器在上一轮迭代中的成功度。总的来说Boosting主要关注降低偏差,能基于泛化性能相对弱的学习器构建出很强的集成;Bagging主要关注降低方差,在不剪枝的决策树、神经网络等学习器上效用更为明显。GBDT(Gradient Boosting Decision Tree)是基于bagging的算法,通过构造一组弱的分类回归树CART,并把多颗决策树的结果累加起来作为最终的预测输出。所有弱分类器的结果相加等于预测值。每次都以当前预测为基准,下一个弱分类器去拟合误差函数对预测值的残差(预测值与真实值之间的误差)。LightGBM是GBDT的算法实现,引入了并行方案、基于梯度的单边检测、排他性特征捆绑等,提供一个快速高效、低内存占用、高准确度、支持并行和大规模数据处理的数据科学工具。在本研究中,将股票的多因子特征作为输入,股票未来几日的收益率作为标签,通过决策树拟合股票未来N天的收益率变化趋势。

图1 集成算法Boosting和Bagging的区别

Point-wise的MSE,平等惩罚所有预测误差,忽视投资组合构建的排序本质。Pair-wise的Lambdarank,直接优化股票对的相对顺序,来提升排序质量,其计算流程基于RankNet的梯度改进,并引入位置感知机制。对于横截面任意两只股票组合,股票i和j的真实标签满足收益率i大于收益率j时,模型打分时需满足股票i的得分高于j的情况。RankNet使用交叉熵损失建模股票对排序概率,而LambdaRank在RankNet基础上引入排序评价指标(如NDCG)的变化量作为梯度权重。在LightGBM的树分裂增益时,以梯度加权信息增益选择分裂点。综上,通过对NDCG的变化加权,头部排序错误产生更大损失(如交换第1位和第10位的损失远高于交换第50位和第60位)。在LightGBM中直接优化IR指标(NDCG),避免MSE回归的绝对误差偏差。

4.实验

我们在中国A股市场上评估验证了框架的有效性,选取了全市场市值排名在前90%的标的进行模型的训练。选取了年化收益率ARR、最大回撤MDD和年化夏普比率 ASR衡量不同风险偏好。ARR(Annualized Rate of Return)是一个持有周期的年化平均收益率,是持有期的平均收益率减去无风险收益率。AVol(Annualized Volatility)是年化平均波动率,反映了策略的风险水平。MDD(Maximum DrawDown)是衡量投资策略在最糟糕情况下的损失。ASR(Annualized Sharpe Ratio)是年化夏普率,反映在年化波动率下的风险调整收益。

为了验证排序学习是否能够优化已有因子组合的模型,我们对比了多因子等权组合、基于MSE均值回归的LightGBM。

表1分别展示LightGBM和等权组合在全市场市值前90%股票池中根据多因子模型选取前100只股票条件下收益和风险的表现。

整体来看基于排序学习的LightGBM相比等权组合,在年化收益率、年化夏普率、最大回撤指标上结果更好,在换手率指标上结果稍逊。这表明机器学习算法可以改进传统的资产配置结果,实现在风险可控条件下较高的收益。在2022、2023年市场低迷的情况下,基于排序学习的LightGBM比基于MSE的LightGBM性能表现欠佳,这可能是因为市场横盘震荡风格持续切换,多头排序一直变化很难捕捉到规律。在2024年和2025年尽管市场波动剧烈,但是风格持续时间较长,基于排序学习的LightGBM能够捕捉趋势,抓住赚钱效应。总的来看,基于排序学习的LightGBM相比等权组合模型,在最大回撤相差不大的情况下,夏普率有一定提升。

排序学习的损失函数在逻辑和结果上均具有一定优势,在实际使用中若直接将其取代MSE,可能导致模型过分追求排序结果,而股票间收益率的大小关系差异会被忽略,因此后续我们将探讨多任务学习,将排序和回归两个目标结合,使模型在两个方向同时学习,从而达到两者兼顾的效果。

本文证实了横截面收益预测策略因引入排序学习(LTR)技术显著提升组合收益的稳健性。然而市场风格剧变(如2024年微盘股流动性问题、小市值因子波动率飙至4.8%)倒逼模型持续迭代,证券公司需建立动态对抗机制,突破因子内卷,将技术壁垒转化为竞争优势。未来突破在于联邦学习框架下的行业协作——在数据隐私合规前提下共享因子有效性情报,推动量化投资从“零和博弈”转向提升市场整体韧性的基础设施。

版权声明

本文仅代表作者观点,不代表B5编程立场。
本文系作者授权发表,未经许可,不得转载。

{if $type=='index'&&$page=='1'}