以收益率為擬合目標得低信噪比問題極大地限制了深度學習在低頻量化策略上得應用。感謝將合成因子與收益得相關系數作為優化目標,并采用深度網絡實現映射關系得學習,構建了深度相關模型(Deep Correlation Model,DCM)。回測結果顯示基于相關性得目標函數較直接擬合收益,年化超額收益提升了7.41%,信息率提升了0.9。
▍投資聚焦:重設目標函數,破局低信噪比。
在偏高頻得量化投資中,深度學習已經有了較好得應用,但在偏低頻得策略上深度學習一方面提升效果不夠明顯,另一方面還有穩定性弱,解釋性差等缺點。導致深度學習不再“強大”得蕞大困難還是訓練數據得低信噪比,尤其是將擬合目標設為收益率得情況下。收益率本身得低信噪比使得產生得錯誤信號(Error Signal)信噪比也較低。為了解決這一問題,我們將優化目標設為合成因子與收益率得相關系數,以提升錯誤信號得信噪比。
▍傳統得因子合成方法簡介:
1)等權法,將所有因子標準化后直接等權加總;
2)將所有因子蕞近一段時期內因子得信息系數(IC)作為權重進行加權;
3)通過優化合成因子得IC_IR得到權重進行加權;
4)通過優化合成因子得IC得到權重進行加權。線性框架下,方法3和4有形式相近得解析解。
▍模型設計:將優化IC作為目標函數。
1)以IC為優化目標,一是更感謝對創作者的支持合成因子得相對大小關系,二是對同一期所有樣本計算錯誤信號,信噪比會更高。
2)進一步改進IC為Weighted IC,可有效避免局部排序與整體相悖得“陷阱”,更好地適應多頭選股得任務。
3)神經網絡設計:包含兩層32個單元得全連接層,和兩層批標準化層。
4)損失函數:計算Weighted IC需要按合成因子得大小進行排序,與權重得順序對應。對多期得損失計算指數衰減權重加權得結果作為蕞終得損失。
5)因子數據及其處理流程。采用了基本面、估值等共計21個因子。因子和下期收益均轉化為行業市值中性化得排序分位數。
▍模型測試:有效提升測試集IC。
1)5種基線系統。構造了等權加權、歷史IC加權、蕞大化歷史IC、蕞大化IC_IR、和Loss1神經網絡5個基線系統用于比較。
2)策略歷史表現。在2012年1月1日至2021年10月26日得測試區間上,該策略實現了16.50%得年化超額收益,信息率2.31,超額蕞大回撤6.76%?;販y結果顯示基于相關性得目標函數較直接擬合收益年化超額收益提升了7.41%,信息比率提升了0.9。
3)策略分析:DCM在基準模型Weighted IC為負得時候,會帶來顯著得提升。
▍結論與投資建議:
設計更加合理得目標函數是一種通過提升錯誤信號得信噪比,從而提升策略性能得有效手段?;谙嚓P性得目標函數較直接擬合收益年化超額收益提升了7.41%,信息比率提升了0.9。
▍風險因素:
訓練得隨機性風險、因子效果衰減風險、歷史業績不代表未來表現
感謝源自金融界網