一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

朱雀基金量化組負責人章曉玨:再談CTA策略,打開黑箱

 復利60年 2021-01-05

1、量化投資的決策依賴于大樣本下的統(tǒng)計顯著性,所以量化投資者會以更長遠的眼光來看待交易結(jié)果,不計較單筆交易的得失。

2、遺傳規(guī)劃的優(yōu)勢除了可以提升挖掘因子效率之外,更重要的是它可以突破人類的思維定式,挖掘出一些隱藏的、難以通過人腦構(gòu)建出來的因子。

3、機器學習是量化CTA策略的新方向,相較傳統(tǒng)線性模型提供了高維的非線性視角,可以更好地分類并提升擬合效果。而可視化可以打開機器學習的黑箱。

4、從大類資產(chǎn)配置的角度看,由于低相關(guān)性,在持有股票型基金獲取阿爾法的同時,配置CTA產(chǎn)品可以在資產(chǎn)組合的層面起到風險分散化的作用。


以上是朱雀基金量化組負責人章曉玨12月12日在“融入洪流”朱雀基金2021年度策略會上發(fā)表的觀點。以下是我們整理的演講精要:

量化CTA策略介紹


首先簡單介紹一下什么是量化CTA策略。簡而言之,就是用量化的手段構(gòu)建交易模型,由模型給出對期貨標的走勢的漲跌判斷,從而在期貨上進行做多、做空或多空雙向的操作,目的是為了獲得絕對收益。

目前國內(nèi)CTA的投資范圍還是股指期貨及期權(quán)、大宗商品期貨和國債期貨。至于投資策略,我們會用機器學習的手段做模式識別,從而給出價格預測。

量化CTA策略是如何盈利的呢?整體來說它不像主動投資那么地看重因果邏輯推演,而是更看重基于歷史行情大樣本下提取出來的量價統(tǒng)計規(guī)律,并且我們認為在歷史上重復出現(xiàn)的量價規(guī)律大概率在未來也會繼續(xù)出現(xiàn)。這里的統(tǒng)計規(guī)律可看做是條件概率,也即在已發(fā)生的特定量價模式下,指數(shù)未來上漲或下跌的概率。

舉個例子,如果我們通過數(shù)據(jù)挖掘,發(fā)現(xiàn)當指數(shù)在下跌超過一個點之后會加速下跌,我們就可以基于這個規(guī)律構(gòu)建簡單的交易策略,當指數(shù)日內(nèi)下跌超過一個閾值之后,我們就進行跟隨開空的操作,只要這個簡單策略在歷史回測中所有單筆交易的總和是盈利的,比如每交易100筆里面有55筆盈利、45筆虧損,并且平均單筆盈利幅度大于虧損幅度,我們就認為這是一個具有正收益期望的策略。

當這個策略投入實盤運作之后,我們不會再計較單筆交易的得失,而是看重長期多筆交易累計之后的收益情況。因為根據(jù)統(tǒng)計大數(shù)定理,單筆交易的盈虧有一定的隨機性,但是當我們交易足夠多次之后,所有單筆交易的收益總和會逐漸接近策略本身的收益期望,而這是一個具有正期望的策略,所以長期來看我們終將會盈利。這也是為什么量化投資者會以一個更長遠的眼光來看待交易策略,并且會更多地關(guān)注策略的收益期望

接下來展開講一下策略的單筆收益期望,大家可以把它理解成我們對策略長期的盈利預期,它其實是由策略的勝率和盈虧比(賠率)決定的。

期望收益=勝率×盈虧比(賠率)


整體來說不同持倉周期策略的勝率往往不一樣,但一般而言對量化投資者來說勝率高于50%的策略已經(jīng)是合格的策略了。當然我們也可以通過對因子和模型持續(xù)優(yōu)化來不斷提高策略的勝率。盈虧比就是我們所說的賠率,可以通過在策略中加入止損手段得到提高。

這是我們一個CTA子策略的單筆收益分布直方圖,橫軸代表策略單筆交易的收益區(qū)間,縱軸代表收益落在該收益區(qū)間的交易筆數(shù)。我們可以看到,單筆盈利大于0的交易占比高于50%,也即策略相比于隨機決策有更高的勝率。同時整個收益分布是向右偏移的,因為我們做了止損,所以左側(cè)的虧損是截尾的而右側(cè)的盈利是長尾的,也就是說這個策略的盈虧比大于1。這是一個非常典型的正收益期望策略。而CTA的凈值就是由幾百幾千筆具有這樣收益特征的單筆交易一點一點累加起來的。

來源:朱雀基金

總結(jié)來看,量化CTA策略就是不斷從歷史行情數(shù)據(jù)中挖掘一些具有正期望的量價規(guī)律,再在實盤中根據(jù)市場的變化來進行規(guī)律的匹配,從而快速改變投資方向。在這個過程中我們強調(diào)以大樣本下的期望作為我們的視野。

最后,我們認為對CTA而言分散化是最好的風控手段。我們的實盤經(jīng)驗支持“分散化是金融市場中唯一免費的午餐”這一說法,也就是說分散化可以在不引入額外風險的前提下增厚我們的收益。所以我們在實際投資時,一直秉持交易品種的分散化、策略持倉周期的分散化,和交易信號產(chǎn)生邏輯的分散化。

我們認為機器學習是量化CTA策略的新方向,它相較傳統(tǒng)線性模型提供了高維的非線性視角,可以更好地分類并提升擬合效果。這里將機器學習CTA的流程拆分成四步:

Step 1:因子挖掘

主要指從原始的行情數(shù)據(jù)中提取可以描述當前市場特征的因子,比如PB因子就可以用來描述當前市場的整體估值。

Step 2:因子篩選

在控制因子間相關(guān)性的前提下,對第一步挖掘得到的因子進行有效性檢驗,從中篩出對市場有預測效力的因子。

Step 3:機器學習

在得到有效因子池后,將因子輸入機器學習模型進行因子組合,這里機器學習的任務是對歷史的因子樣本進行學習,并從中挖掘出具有正收益期望的規(guī)律。

Step 4:交易決策

在訓練完機器學習模型后,模型就可以基于對實時行情數(shù)據(jù)的分析給出后市的漲跌預測,從而指導實盤的投資決策。

以上是機器學習CTA的大體流程,近期我們的研究突破主要在第一步的因子挖掘和第三步的機器學習的可視化上

傳統(tǒng)來說,因子挖掘主要由投資經(jīng)理根據(jù)自己的交易經(jīng)驗和邏輯來手工完成,人工挖掘得到的因子因為具有較強邏輯性,因此往往可以在較長時間內(nèi)都保持有效。但缺點是因子挖掘的周期較長,并且這兩年隨著各家機構(gòu)研究的不斷深入,人工挖掘因子的效率不斷降低。所以我們在傳統(tǒng)的人工因子挖掘外引入了遺傳規(guī)劃,由算法自動對因子進行挖掘。算法挖掘因子的優(yōu)勢是可以依托計算機的強大算力,因子挖掘效率非常高,但缺點是由于因子的邏輯性較弱,所以需要定期的迭代更新來維持因子的有效性。

第二個突破點是在機器學習做因子組合上。我們對機器學習的可視化做了一些努力。后面我們會展開來介紹下遺傳規(guī)劃因子挖掘和機器學習可視化這兩方面的突破。


遺傳規(guī)劃:跳出人類思維定式


遺傳規(guī)劃所做的事情,其實就是模擬了自然界中物競天擇、適者生存的演化模式,通過優(yōu)化迭代的手段逐漸生成契合優(yōu)化目標的因子,優(yōu)化的目標往往被設定為因子對價格走勢的預測能力。

遺傳規(guī)劃的優(yōu)勢除了前面提到的可以提升因子挖掘的效率之外,更重要的是可以突破人類的思維定式,挖掘出一些隱藏的、難以通過人腦構(gòu)建的因子。同時我們也可以通過算法控制因子間的相關(guān)性,從而得到兩兩低相關(guān)的因子池。因為因子間的高相關(guān)性會導致后續(xù)機器學習時模型的參數(shù)不穩(wěn)定,所以低相關(guān)的因子池可以在一定程度上使我們的模型更加穩(wěn)健


接下來我們看看遺傳規(guī)劃的具體算法。首先,我們需要事先定義一個變量集和一個算子集,這里的變量往往是基礎的行情指標,而算子集中包含常規(guī)的運算符,如加減乘除均值等等。然后我們會將變量和算子隨機組合生成大量的個體樣本,這里的每一個樣本個體都可以被翻譯成一個因子的公式表達式,從而得到初始種群。之后,我們會計算初始種群中每個個體對環(huán)境的適應度,并從中選出適應度高的個體作為下一代進化的父代。因為適應度是以因子對價格的預測效力衡量的,所以通過這一步我們就選出了對價格走勢有一定預測效力的因子集作為父代種群。有了父代種群之后,下一步就是遺傳變異。一部分父代個體可以直接進入子代,而一部分父代將通過變異的方式,將部分因子結(jié)構(gòu)傳遞至下一代。

這里展示了幾種常見的變異方式。第一種交叉變異類似人類的染色體交叉,兩個適應度較高的父代個體會互相交換一部分因子結(jié)構(gòu)生成子代,交叉變異較為保守,可以保留并傳承父代中“好”的因子結(jié)構(gòu)。第二種子樹變異會隨機替換父代樹結(jié)構(gòu)中的一個子樹。第三種點變異則是隨機替換父代樹結(jié)構(gòu)中的一個葉片。子樹變異和點變異更像基因突變,是比較激進的變異方式,可以重新引入被淘汰的因子結(jié)構(gòu)來維持種群的多樣性。第四種提升變異可以理解為基因片段剪除,我們會隨機地從父代中移除一部分樹結(jié)構(gòu),這樣做可以防止因子結(jié)構(gòu)過于復雜而導致過度擬合。

<<  向右滑動查看下一張圖片  >>

數(shù)據(jù)來源:gplearn

那么,在第一代種群經(jīng)過一系列的遺傳變異之后,我們就可以得到第二代種群,整體來看,第二代種群中因子的適應度會高于第一代,也就是第二代種群中因子對價格有更高的預測效力。這樣不斷循環(huán)迭代,我們就可以不斷提升種群中因子的有效性,最終得到對價格有較強預測效力的因子集。以上就是遺傳規(guī)劃的大致流程。

可視化:打開機器學習的黑箱



我們的另一個新進展是機器學習的可視化。機器學習策略的優(yōu)勢,在于可以處理海量的歷史數(shù)據(jù),并且它的預測準確率更高。同時機器學習有一定的自適應性,可以不斷學習新的數(shù)據(jù)來優(yōu)化自身。但是因為機器學習特別是神經(jīng)網(wǎng)絡模型的決策流程是一個黑箱,所以這類模型一直以來也被批評可解釋性太差。那我們現(xiàn)在做的就是想打開神經(jīng)網(wǎng)絡的黑箱,來看看它到底是如何做出價格預測的。

我們先以一個圖像識別的例子來說明。假設我們已經(jīng)有了一個訓練好的神經(jīng)網(wǎng)絡,如果我們要識別一張圖片里的動物是貓還是狗,最經(jīng)典的做法就是把圖片先轉(zhuǎn)換成數(shù)字像素矩陣,然后輸入給卷積神經(jīng)網(wǎng)絡,樣本在經(jīng)過若干層卷積層后,最后由softmax函數(shù)來給出這是一只貓或者狗的概率。

在深度學習模式下,圖片從輸入模型到輸出結(jié)果中間可能要經(jīng)過幾百層的卷積層,整個神經(jīng)網(wǎng)絡的結(jié)構(gòu)非常復雜,人腦很難解釋清楚它的內(nèi)部決策機制。而可視化可以告訴我們,在神經(jīng)網(wǎng)絡給出判斷的時候,主要讀取了圖片里哪些局部區(qū)域的特征。

具體到算法層面,我們可以計算最后一層隱含層的激活函數(shù)值和它的梯度斜率,然后以熱力圖的形式來表征每個局部特征的重要性。這里熱力圖的顏色越紅表示這塊區(qū)域?qū)D像識別越重要,反之顏色越偏藍,表明該區(qū)域越不重要。我們可以看到神經(jīng)網(wǎng)絡在判斷動物類別的時候,主要是讀取了貓和狗的頭部區(qū)域和身體花色的特征,這其實是非常明智的。


然后我們再來看在CTA策略中,神經(jīng)網(wǎng)絡模型在預測后市漲跌的時候,主要是基于了哪些特征因子。這里的熱力圖是對CTA神經(jīng)網(wǎng)絡模型可視化后的結(jié)果,圖中每一列代表一個因子,從左到右逐漸從趨勢因子過渡到反轉(zhuǎn)因子。

我們可以看到在2015年6月的時候,熱力圖左側(cè)區(qū)域更為明亮,也就是說神經(jīng)網(wǎng)絡在價格預測的時候更側(cè)重于趨勢因子,結(jié)合當時連續(xù)上漲的行情來看,神經(jīng)網(wǎng)絡這一選擇是正確的。而在2015年8月,此時市場已經(jīng)經(jīng)歷了股災、上行趨勢被打破,這時熱力圖的右側(cè)區(qū)域更亮,也就是說此時神經(jīng)網(wǎng)絡在做預測的時候,給了反轉(zhuǎn)指標更多權(quán)重。由此可以得出神經(jīng)網(wǎng)絡在做訓練的時候,可以通過不斷吸納學習新的數(shù)據(jù)來調(diào)整模型自身,并且它在實盤做出價格預測的時候也較好地適應了市場環(huán)境的變化。



在CTA之外,我們今年也對阿爾法策略做了升級改造。阿爾法策略可以分為兩類:一類用量化手段選出可以戰(zhàn)勝基準指數(shù)的股票組合,也就是指數(shù)增強策略,另外是在指數(shù)增強的基礎上疊加相應股指期貨的空頭頭寸來對沖市場風險從而獲得絕對收益,也就是量化對沖策略。所以阿爾法策略的核心還是在于選股,下圖對量化選股的流程做了拆解,可,分為因子挖掘、因子組合和組合優(yōu)化這三步。

第一步,因子挖掘的目的是找出一些可以預測股票未來相對強弱的選股因子,數(shù)據(jù)源包括個股的基本面、量價特征、資金流、分析師對個股的一致預期等等。第二步會把因子放入機器學習模型做因子組合。最后通過對股票流動性的篩選確定選股范圍,再用組合優(yōu)化的手段,使得所選股票組合在風格和行業(yè)上的分布盡可能貼近基準指數(shù),從而得到一個跟蹤誤差低,但同時又可以跑贏基準指數(shù)的股票組合。



明年我們就會推出全新的量化產(chǎn)品,用的策略是CTA+阿爾法策略,用機器學習的手段,挖掘股票和期貨里面的機會,也請大家關(guān)注。


來源:朝陽永續(xù)

    本站是提供個人知識管理的網(wǎng)絡存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    视频一区中文字幕日韩| 99久久精品国产日本| 人体偷拍一区二区三区| 午夜午夜精品一区二区| 欧美日韩中国性生活视频| 亚洲天堂一区在线播放| 清纯少妇被捅到高潮免费观看| 在线免费观看一二区视频| 色婷婷国产熟妇人妻露脸| 国产不卡最新在线视频| 欧美一级内射一色桃子| 欧美国产日产综合精品| 欧美一区二区在线日韩| 最新69国产精品视频| 夫妻性生活黄色录像视频| 日韩欧美高清国内精品| 日本免费一级黄色录像 | 国产亚洲精品香蕉视频播放| 黄片免费播放一区二区| 国产亚洲欧美日韩精品一区| 日韩精品成区中文字幕| 最好看的人妻中文字幕| 一区二区免费视频中文乱码国产| 一区二区三区四区亚洲另类| 国产成人精品视频一区二区三区| 日本不卡一区视频欧美| 国产内射在线激情一区| 国产黄色高清内射熟女视频| 日本加勒比系列在线播放| 日韩aa一区二区三区| 成人三级视频在线观看不卡| 玩弄人妻少妇一区二区桃花| 熟妇人妻av中文字幕老熟妇| 国产成人精品午夜福利av免费| 日本理论片午夜在线观看| 熟女高潮一区二区三区| 欧美韩日在线观看一区| 国产亚洲精品岁国产微拍精品| 中文字幕不卡欧美在线| 精品一区二区三区中文字幕| 精品一区二区三区三级视频 |