明汯投资:金融时间序列预测更倾向于前向验证

在实际交易中,投资市场具有高度不确定性,充斥着大量的噪声和随机波动,帮助投资者形成投资决策的量化投资模型需要不断适应市场的变化和新的投资环境,并处理大量有关市场走势、财务数据、公司基本面、宏观经济等多个方面的复杂数据。明汯投资深知这一点,并致力于构建能够适应这些变化的量化模型。从影响股票量化策略的市场因素来看,主要涉及交投活跃度、波动水平、行业轮动速度、市场风格特征、股指期货基差贴水情况、因子稳定性、行业政策影响等,因此量化模型的构建相对较为复杂。

明汯投资:金融时间序列预测更倾向于前向验证

明汯投资在模型构建过程中,特别注意模型的泛化能力,避免出现过拟合现象。当模型过于复杂、参数数量过多、学习能力太强时,容易出现模型对于训练集以外的数据泛化能力差的现象,表现为过拟合。

明汯投资认为,由于大多数机器学习模型并不是专门为金融时间序列开发的,这些模型在量化建模中的应用需要适时调整。因此,在将机器学习应用到量化投资领域时,如何在模型训练中预防和避免过拟合显得尤为重要,需要综合考虑预测精度、模型可解释性、模型鲁棒性和计算复杂性等因素。

系统鲁棒性是指当系统面临内部结构或外部环境的改变对其造成冲击时,系统受特定干扰的变化特征及维持多种原有功能的能力,也可以简单理解为系统承受冲击的能力。明汯投资在模型开发中,特别重视系统的鲁棒性,以维持模型在不同市场环境下的稳定性。

自创立以来,明汯投资在短周期、中周期、长周期和基本面都积累颇丰,获取alpha的能力经历多次迭代升级,期间数度斩获金牛奖。目前,明汯投资管理规模和投研能力均处行业前列。

明汯投资:金融时间序列预测更倾向于前向验证

基于自身投资实践经验,明汯投资强调,金融时间序列预测必须避免使用未来信息,有时更倾向于随着时间的推移将时间序列分成训练、验证和测试块,即进行前向验证,而非模型超参数优化中的交叉验证。前向验证是通过将策略应用到历史数据上,并计算策略的实际表现来验证其效果。投资者可在训练块上训练模型,在验证块上检查模型的预测能力。如果模型的预测能力好,就可以在测试块上进一步测试模型,观察模型的表现。而交叉验证则是通过将数据集分成多个子集,并在不同的子集上多次进行训练和验证,以评估模型的泛化能力。

大观网-36氪的头像大观网-36氪
Previous 2025 年 2 月 13 日 下午6:09
Next 2025 年 2 月 13 日 下午6:41

相关推荐