原創(chuàng)文章第244篇,專注“個人成長與財富自由、世界運作的邏輯與投資"。 說到量化里的機器學習模型,并不缺。qlib幾乎把前沿的機器模型都實現(xiàn)了。 問題的關(guān)鍵在于,模型的學習能力是夠的,甚至是超過的(過擬合)。而因子是不穩(wěn)定的。某一段歷史上,學習的“經(jīng)驗”也許只是恰好這個因子有效罷了。而這個因子失效的,模型的結(jié)果也就不成立了。 模型不需要特別多,把一兩個好的,用到精通也就可以的。 我建議是lightGBM,做表格數(shù)據(jù)訓(xùn)練與預(yù)測速度快。 多因子策略的研發(fā),就是一個這樣的過程 1、因子挖掘:找到更多與未來股票收益高度相關(guān)的因子 2、因子配置:找到因子對未來收益的影響比重和影響方式 多因子是量化的基本功。“特征將決定整個算法模型的上限”。 從提供解決方案的角度,用戶的剛需是一個策略,可以應(yīng)用于實盤,真正可以賺到錢。如何衡量一個策略是可行的呢? 有兩種類型。 投資偏理財?shù)模?strong>追求絕對型收益,比如年化8-12%,但對于最大回撤有要求,比如不超過12-15%,一般這樣的策略要求夏普比或者卡瑪比率比較高,更多傾向于大量資產(chǎn)配置,風險平價,在這個基礎(chǔ)上做收益增厚,平衡風險與收益,這種策略持有體驗會比較好,很多FOF,或者智能投顧都是這個邏輯。 追求更高收益的,衡量標準是相對收益,好比基金里的參考基準,可能是一個指數(shù),一般說跑盈指數(shù)多少多少。比如滬深300指數(shù),跌了6%,而你的策略僅跌了2%,那也算跑盈了4個點。允許回撤,但得跑盈基準來證明你的策略是有效的。 策略為王,后續(xù)打算周一至周五,每天爭取發(fā)布一個策略。 很多時候,從模仿到超越,集大家的廣議,是進步最快的方式,星球里的朋友也是如此,不必著急去批評一個朋友的策略,而是看自己如何能從中獲得啟發(fā)。 我從ETF開始,是因為ETF從資產(chǎn)配置的角度是合適的,因為它可以全球配置。適合我們上面說的“絕對收益型”的配置。畢竟ETF不是一種“進攻型”的品種??梢栽诖箢愘Y產(chǎn)的基礎(chǔ)上,做行業(yè)輪動增加。但ETF有一個比較麻煩的的事情,它的數(shù)據(jù)比較少。比如要計算這個ETF的基本面,那需要對指數(shù)成份股進行加權(quán)后進行計算,比較麻煩。 (這個部分我在場外做了更簡單的投資組合) 單一的價量數(shù)據(jù),容易讓模型陷入過擬合。 下周切入股票市場,股票的基本面數(shù)據(jù)比較容易獲得,相比ETF更具進攻性。股票的基礎(chǔ)上可以順帶做下可轉(zhuǎn)債。 最近文章及代碼、數(shù)據(jù)下載: 年化收益 21%:lightGBM的WFA滾動訓(xùn)練,使用qlib的alpha158因子集 |
|