1 狂熱的 AI 浪潮近幾年隨著深度學(xué)習(xí)算法的出現(xiàn),人工智能(AI)技術(shù)的熱潮在全球各領(lǐng)域鋪展開(kāi)來(lái)。之前一些計(jì)算機(jī)處理起來(lái)非常困難的任務(wù),依賴深度學(xué)習(xí)算法,得到了很好的解決。在很多特定數(shù)據(jù)集、特定任務(wù)中,計(jì)算機(jī)已經(jīng)達(dá)到甚至超過(guò)了人類的水平。AlphaGo 在圍棋上擊敗人類把這波浪潮推向了一個(gè)新的高峰,人們紛紛對(duì)于 AI 的發(fā)展無(wú)比樂(lè)觀,似乎很快 AI 就要全面取代人類。 這狂熱的一幕在 AI 歷史上已經(jīng)出現(xiàn)過(guò)幾次,早在上世紀(jì) 60 年代,AI 剛剛被提出時(shí),樂(lè)觀的從業(yè)者就認(rèn)為 AI 將很快在國(guó)際象棋和語(yǔ)言翻譯中擊敗人類。90 年代深藍(lán)在國(guó)際象棋中擊敗了人類,日前 AlphaGo 又拿下了更為復(fù)雜的圍棋,但語(yǔ)言翻譯到目前為止 AI 仍然與人類有較大差距。 現(xiàn)在 AI 的旋風(fēng)又刮到了投資領(lǐng)域,AI 投資進(jìn)入市場(chǎng),頗有聯(lián)合收割機(jī)進(jìn)場(chǎng)割韭菜之勢(shì)。AI 是否真的如此神奇?事實(shí)上目前以深度學(xué)習(xí)為代表的 AI 技術(shù)還有著非常大的局限性,AI 的一些核心問(wèn)題仍未解決,AI 未來(lái)的路還很長(zhǎng)。而投資任務(wù)的復(fù)雜性遠(yuǎn)遠(yuǎn)超出了目前 AI 能夠很好處理的范圍。現(xiàn)階段說(shuō) AI 投資將要甚至已經(jīng)擊敗了人類,有些言過(guò)其實(shí)了。 2 AI 擅長(zhǎng)的任務(wù)為什么棋類游戲最先被 AI 攻克?我們來(lái)看棋類游戲的特點(diǎn):
這幾點(diǎn)造成了棋類游戲的的整個(gè)狀態(tài)空間是有限確定的。以圍棋為例,每個(gè)交叉點(diǎn)上無(wú)非就是黑子/白子/空三種狀態(tài),再加上整個(gè)局面輪黑棋或白棋先行,滿打滿算一共也就 3^361 × 2 種局面,之外的任何信息都對(duì)策略沒(méi)有影響。當(dāng)然,以目前的技術(shù)列出圍棋的全部局面是不可想象的,但是計(jì)算機(jī)相較于人的長(zhǎng)處正是海量數(shù)據(jù)的存儲(chǔ)與高速運(yùn)算。因此計(jì)算機(jī)在棋類游戲中擊敗人類就不足為奇了。 再看投資領(lǐng)域,與圍棋相比在上述幾個(gè)特點(diǎn)上都顯著的更為復(fù)雜。與圍棋的全部信息都在棋盤(pán)之中相比,對(duì)于投資你很難預(yù)先確定整個(gè)問(wèn)題的信息邊界。這對(duì)于現(xiàn)階段的 AI 已經(jīng)構(gòu)成了天大的挑戰(zhàn)?,F(xiàn)在的 AI 從技術(shù)以及形態(tài)上顯然無(wú)法像人類一樣主動(dòng)去現(xiàn)實(shí)世界探索信息,那么如果讓 AI 去投資,整個(gè)系統(tǒng)的輸入是什么?哪些信息是相關(guān)的哪些信息是無(wú)關(guān)的?對(duì)于投資這種開(kāi)放性問(wèn)題,大千世界的任何信息都有可能會(huì)對(duì)決策產(chǎn)生影響,信息量巨大而信噪比極低。AI 不可能獲取到一切有可能有意義的信息,從目前常見(jiàn)的做法來(lái)看,除了各類報(bào)表數(shù)據(jù),無(wú)非就是接入互聯(lián)網(wǎng),從新聞以及輿論中挖掘一些有意義的信息。但這遠(yuǎn)非投資需要了解的全部,反而引入了大量的垃圾噪音。 如上圖所示,AI 能夠使用的信息實(shí)際只是現(xiàn)實(shí)世界全部信息一小部分,其中還包含了大量的無(wú)用噪音甚至是虛假、錯(cuò)誤信息。在這樣的數(shù)據(jù)基礎(chǔ)上,無(wú)論使用多么先進(jìn)的算法,也無(wú)異于盲人摸象,難以獲得令人滿意的結(jié)果。 另外棋類游戲有確定的結(jié)束標(biāo)志,存在明確的勝負(fù)標(biāo)準(zhǔn),這也對(duì) AI 的學(xué)習(xí)提供了極大的便利。最新的 AlphaGo Zero 版本正是依賴于此,讓程序從 0 開(kāi)始,不斷的自我對(duì)弈以提升棋力。其背后唯一的邏輯很簡(jiǎn)單:一盤(pán)下完了,贏棋方的著法總是比輸棋方走得好。這其實(shí)是一類非常特殊的問(wèn)題。深入分析一下,圍棋 AI 希望盡可能的提高棋力,而對(duì)弈勝負(fù)正是棋力真實(shí)客觀的外在量化標(biāo)準(zhǔn),可以直接測(cè)量、反饋。作為 AI 只需要不斷地追求勝利即可,這個(gè)量化目標(biāo)與根本目的是完全一致的。同樣的事情放在投資上就不那么顯然了。選出中國(guó)平安的策略比較厲害?還是選出貴州茅臺(tái)的策略比較厲害?我們希望盡可能的提高 AI 的投資能力,但是這個(gè)投資能力缺乏一個(gè)明確的可量化評(píng)測(cè)標(biāo)準(zhǔn)。我們只能利用唯一的歷史數(shù)據(jù),使用類似“近十年的投資信息比率”、“近五年的收益率”等代理指標(biāo)。但是我們應(yīng)當(dāng)清醒的認(rèn)識(shí)到,這些簡(jiǎn)單指標(biāo)均無(wú)法完全準(zhǔn)確的代表投資能力。過(guò)于片面的追求這些指標(biāo)的優(yōu)化,還容易陷入過(guò)擬合的風(fēng)險(xiǎn)。 3 深度學(xué)習(xí)算法的局限目前取得重大進(jìn)展的以深度學(xué)習(xí)為代表的 AI 技術(shù),本質(zhì)上還是基于數(shù)據(jù)的統(tǒng)計(jì),是一種高維空間的模式識(shí)別。這使得 AI 無(wú)法“理解”任務(wù)內(nèi)容,在 AI 看來(lái)所有的任務(wù)都是尋找 f 使得 f(X) -> Y 的過(guò)程。這樣AI的效果將極其依賴于給定的輸入 X 與輸出 Y。前面兩節(jié)已經(jīng)提到,在投資任務(wù)中,輸入 X 中包含了大量的垃圾信息,又將很多真正有意義的信息排除在外;輸出 Y 又不易準(zhǔn)確量化評(píng)價(jià)。對(duì)于人類來(lái)說(shuō),存在大量的領(lǐng)域背景知識(shí),可以輕松的濾掉“顯而易見(jiàn)”的無(wú)用或錯(cuò)誤信息。但是現(xiàn)階段技術(shù)下,這種領(lǐng)域背景知識(shí)很難遷移到 AI 中。AI 將對(duì)所有信息一視同仁,努力在其中發(fā)現(xiàn)模式,而這種模式將完全不同于人類的思維和理解方式,對(duì)于人類來(lái)說(shuō)幾乎是一個(gè)黑箱。這等于 AI 放棄了人類文明千百年來(lái)的持續(xù)積淀,僅通過(guò)目前人類給他劃定的一部分信息,采用不同于人類的方式自學(xué)成才。對(duì)于圍棋來(lái)說(shuō),棋盤(pán)上的信息是完全的,人類的所有領(lǐng)域知識(shí)積累都可以從棋盤(pán)上推演得到,人類的知識(shí)顯得“多余”了。但對(duì)于投資來(lái)說(shuō),涉及的信息無(wú)法窮盡,此時(shí)放棄人類知識(shí)就是非常危險(xiǎn)的。那些人類閉著眼都不會(huì)踩到、甚至根本無(wú)法意識(shí)到其存在的坑,都很可能就會(huì)讓 AI 陰溝里翻船。更何況現(xiàn)在的 AI 對(duì)于針對(duì)性構(gòu)建的惡意樣本還非常脆弱,一旦被人惡意利用,后果不堪設(shè)想。 同時(shí),現(xiàn)階段的 AI 投資還面臨一個(gè)重大挑戰(zhàn)就是數(shù)據(jù)匱乏。從基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)開(kāi)始,到現(xiàn)在的深度卷積神經(jīng)網(wǎng)絡(luò),對(duì)于復(fù)雜的問(wèn)題采取了使用海量數(shù)據(jù)學(xué)習(xí)以暴制暴的方式。AlphaGo 對(duì)弈了數(shù)百萬(wàn)盤(pán)圍棋,達(dá)到了人類的水平。而一個(gè)人類棋手從學(xué)棋開(kāi)始至達(dá)到職業(yè)水平的對(duì)弈數(shù)連 AlphaGo 的零頭都不到。在這一點(diǎn)上,目前的 AI 與人類的思維方式還有著顯著的差別。AlphaGo 擊敗了人類也不意味著機(jī)器就比人更聰明。 人類的優(yōu)勢(shì)是對(duì)復(fù)雜數(shù)據(jù)進(jìn)行高層次的抽象,大道至簡(jiǎn);而深度學(xué)習(xí)算法則是充分發(fā)揮機(jī)器的優(yōu)勢(shì),以量取勝。這使得人類能夠從少量的樣本中總結(jié)出深層次的簡(jiǎn)單規(guī)律,并利用這些規(guī)律做出各種預(yù)測(cè);而 AI 在目前階段無(wú)法做到這一點(diǎn)。觀察到蘋(píng)果落地,牛頓總結(jié)出是因?yàn)榈厍虻囊Γ瑩?jù)此發(fā)展出萬(wàn)有引力定律;愛(ài)因斯坦總結(jié)出是因?yàn)榈厍蛸|(zhì)量造成時(shí)空彎曲,據(jù)此發(fā)展出廣義相對(duì)論。他們都通過(guò)少量(相對(duì) AI 的訓(xùn)練數(shù)據(jù)規(guī)模)的觀察準(zhǔn)確的抽象出了高層次的一些規(guī)律。 在小樣本上的學(xué)習(xí)能力、深層次規(guī)律的抽象泛化能力,人類遠(yuǎn)遠(yuǎn)強(qiáng)過(guò) AI。如果巴菲特是 AI,他可能需要看過(guò) 100 萬(wàn)家“可口可樂(lè)”公司的成功,才能在實(shí)際中選出可口可樂(lè)。但很可惜,可口可樂(lè)公司只有一個(gè),歷史也只有一次。對(duì)于 AI 來(lái)說(shuō),這樣的學(xué)習(xí)數(shù)據(jù)實(shí)在是太少了?,F(xiàn)階段的 AI 算法,如果學(xué)習(xí)數(shù)據(jù)太少,會(huì)非常輕易的陷入過(guò)擬合的陷阱 —— AI 記住了所有的學(xué)習(xí)數(shù)據(jù),而非其中真正能夠持久生效的一些深層規(guī)律。從投資到計(jì)量經(jīng)濟(jì)學(xué),都注定了只有唯一的歷史數(shù)據(jù)可以學(xué)習(xí),時(shí)間持續(xù)流逝,環(huán)境不斷變化,你也無(wú)法控制同樣的環(huán)境反復(fù)的實(shí)驗(yàn)驗(yàn)證。此時(shí)就要求必須能夠從這少量的甚至是唯一的樣本中總結(jié)規(guī)律?,F(xiàn)在 AI 言必稱大數(shù)據(jù),而愛(ài)因斯坦 100 年前沒(méi)有任何實(shí)際的觀測(cè),通過(guò)“零數(shù)據(jù)”就預(yù)言了引力波的存在,直到 100 年后的今天才被實(shí)際觀測(cè)到,這種能力現(xiàn)階段的 AI 是無(wú)法企及的。專家們?cè)缫炎⒁獾搅藱C(jī)器學(xué)習(xí)過(guò)于依賴樣本的局限性,小樣本學(xué)習(xí)的問(wèn)題已經(jīng)被推到 AI 領(lǐng)域前沿,但迄今未出現(xiàn)像深度學(xué)習(xí)算法這樣的重大突破。目前 AI 仍然無(wú)法脫離模式識(shí)別的范疇,我們離實(shí)現(xiàn)真正的智能還有很長(zhǎng)的路要走。 4 AI 投資路在何方目前 AI 在投資上也并非無(wú)用武之地。盡管整個(gè)投資任務(wù)對(duì)于 AI 來(lái)說(shuō)過(guò)于寬泛復(fù)雜了,但 AI 在一些特定的具體領(lǐng)域任務(wù)上足以與人類媲美,已經(jīng)證明了其巨大價(jià)值。AI 的長(zhǎng)處在于大量繁雜數(shù)據(jù)的高速處理,而人類的長(zhǎng)處在于化繁為簡(jiǎn),達(dá)到更高的抽象層次。人類和機(jī)器具備各自獨(dú)特的優(yōu)勢(shì)而又能夠有效互補(bǔ)。對(duì)于投資來(lái)說(shuō),AI 可以作為工具,幫助人類去高效的完成一些特定環(huán)節(jié)。我們?nèi)匀粦?yīng)當(dāng)以人類投資的成功經(jīng)驗(yàn)為基礎(chǔ),在其中一些特定環(huán)節(jié)上由 AI 替代人類高效完成。目前我們關(guān)注研究的重點(diǎn)不應(yīng)當(dāng)是 AI 如何替代人類做投資,而是如何作為工具幫助人類更高效更好的進(jìn)行投資。將 AI 引入投資領(lǐng)域的商業(yè)本質(zhì)仍然是效率的優(yōu)化,是時(shí)間、成本、質(zhì)量之間的平衡。AI 的引入能夠大幅降低低端人力成本,提高企業(yè)投資業(yè)務(wù)處理能力,從而獲得更高的邊際效益。作為專業(yè)投資者應(yīng)當(dāng)擁抱這種變革,但不應(yīng)對(duì) AI 有不切實(shí)際的期望,更不應(yīng)當(dāng)把 AI 作為噱頭,勉強(qiáng)蹭熱度。只有深入的理解 AI 技術(shù),才能了解 AI 的優(yōu)勢(shì)與局限,讓 AI 為投資發(fā)揮其最大的效能。 |
|
來(lái)自: 東西二王 > 《工業(yè)工程》