寫在前面 關(guān)于人工智能如何結(jié)合金融的話題,研投菌早就想做一次專門討論,趁著國(guó)慶假日,我們花點(diǎn)時(shí)間做一次全面的透視如何? 目前金融機(jī)構(gòu)的主流玩法有四種: 1. 投資銀行和賣方研究嘗試自動(dòng)報(bào)告生成,2. 金融智能搜索;3. 公募、私募基金在通過人工智能輔助量化交易;4. 財(cái)富管理公司在探索智能投顧方向。 由于篇幅所限,本文重點(diǎn)討論自動(dòng)報(bào)告生成和人工智能輔助交易,明日將對(duì)后兩個(gè)話題進(jìn)行交流。文章或許有些專業(yè),但保證不無聊。 #人工智能與金融結(jié)合的思考#
文 | 文因新三板、維基百科、上市公司公告 編輯:對(duì)沖研投 轉(zhuǎn)載請(qǐng)注明出處 1 自動(dòng)生成投研報(bào)告靠譜嗎? 在投資銀行的投行業(yè)務(wù)與證券研究業(yè)務(wù)中涉及大量的固定格式的報(bào)告撰寫工作,如招股說明書中的部分章節(jié),研報(bào),以及投資意向書。這些報(bào)告撰寫需要大量的投行初級(jí)員工進(jìn)行長(zhǎng)時(shí)間枯燥繁瑣的數(shù)據(jù)羅列、整理、反復(fù)Copy-Paste工作。 目前,自動(dòng)報(bào)告生成主要運(yùn)用自然語(yǔ)言處理(NLP)中的兩種技術(shù): 自然語(yǔ)言理解(NLU):將日常話語(yǔ)消化理解,并轉(zhuǎn)化為機(jī)器可后續(xù)處理的結(jié)構(gòu); 自然語(yǔ)言生成(NLG):將由機(jī)器拆分好的結(jié)構(gòu)化數(shù)據(jù)以人們能看懂的自然語(yǔ)句表達(dá)出來。 我們可以將這兩種技術(shù)理解看成對(duì)日常對(duì)話這一原料的拆分加工和整裝成可理解的自然語(yǔ)句——最終產(chǎn)品。 然而真正生成報(bào)告還需要利用以上技術(shù)完成3個(gè)步驟: 1.處理海量異構(gòu)數(shù)據(jù)
將投行分析師需要閱讀的年報(bào),彭博新聞社的實(shí)時(shí)新聞以及數(shù)據(jù),行業(yè)分析報(bào)告,以及法律公告等資源進(jìn)行消化。其中對(duì)于文本中的圖片和表格需要OCR(光學(xué)字符識(shí)別)等技術(shù)解析。 2.分析數(shù)據(jù)這一過程涉及運(yùn)用知識(shí)圖譜中常用的知識(shí)提取與實(shí)體關(guān)聯(lián)將其關(guān)鍵邏輯主干抽出,結(jié)合事件地點(diǎn)等因素,將關(guān)鍵信息嵌入預(yù)先設(shè)計(jì)好的報(bào)告模板中。 3.文章生成
經(jīng)過處理海量異構(gòu)數(shù)據(jù)與分析數(shù)據(jù)的過程后,即可生產(chǎn)新聞,券商分析研報(bào),上市招股書,企業(yè)年報(bào),定增公告,甚至基金研究員開每日晨會(huì)所需的投資建議書也都可以用類似方式生成。用戶只需選擇符合其需求的模板確定主題與關(guān)鍵信息,以及報(bào)告呈現(xiàn)形式,便可生成基本內(nèi)容。而且投行分析師可以進(jìn)行校對(duì)與人工二次編輯,加入有價(jià)值的觀點(diǎn)與結(jié)論,并提升報(bào)告精準(zhǔn)度。 自動(dòng)報(bào)告生成已經(jīng)被廣泛的運(yùn)用到新聞行業(yè)中,代表的科技公司有美聯(lián)社投資的Automated Insights已為美聯(lián)社自動(dòng)生成出10多億篇文章與報(bào)告。法國(guó)公司Yseop可以每秒生產(chǎn)3000頁(yè)內(nèi)容,支持英語(yǔ),法語(yǔ),德語(yǔ)等多種語(yǔ)言,產(chǎn)品廣泛用于銀行、電信公司的客戶服務(wù)部門以及財(cái)經(jīng)新聞網(wǎng)站。
但是一些科技公司已經(jīng)不僅僅滿足于為新聞行業(yè)提供自動(dòng)報(bào)告生成的服務(wù)。 Narrative Science由西北大學(xué)的新聞系和計(jì)算機(jī)科學(xué)系的聯(lián)合創(chuàng)立,旨在通過給定主題的數(shù)據(jù)分析,自動(dòng)生成文章報(bào)告。該公司的著名數(shù)據(jù)分析平臺(tái)Quill可以分析結(jié)構(gòu)化數(shù)據(jù),將人工智能與大數(shù)據(jù)進(jìn)行技術(shù)融合,理解這些數(shù)據(jù)的重要性,從而產(chǎn)生簡(jiǎn)短的文字表述或結(jié)構(gòu)化的報(bào)告內(nèi)容。Quill的主要面向?qū)ο鬄椤鹑诜?wù)提供商。 Narrative Science的CEO Frankel 表示“我們的目標(biāo)是替代人工做絕大部分基礎(chǔ)工作,讓機(jī)器來處理數(shù)據(jù)和信息”。 2 人工智能如何輔助量化交易 量化交易從很早開始就運(yùn)用機(jī)器進(jìn)行輔助工作,分析師通過編寫簡(jiǎn)單函數(shù),設(shè)計(jì)一些指標(biāo),觀察數(shù)據(jù)分布,而這些僅僅把機(jī)器當(dāng)做一個(gè)運(yùn)算器來使用。直到近些年機(jī)器學(xué)習(xí)的崛起,數(shù)據(jù)可以快速海量地進(jìn)行分析、擬合、預(yù)測(cè),人們逐漸把人工智能與量化交易聯(lián)系得愈發(fā)緊密,甚至可以說人工智能的3個(gè)子領(lǐng)域(機(jī)器學(xué)習(xí),自然語(yǔ)言處理,知識(shí)圖譜)貫穿量化交易的始終。 1. 機(jī)器學(xué)習(xí):從數(shù)字推測(cè)模型
量化交易分析師們對(duì)財(cái)務(wù)、交易數(shù)據(jù)進(jìn)行建模,分析其中顯著特征,利用回歸分析等傳統(tǒng)機(jī)器學(xué)習(xí)算法預(yù)測(cè)交易策略。這種方式有兩個(gè)主要弊端,其一是數(shù)據(jù)不夠豐富,僅限于交易數(shù)據(jù),更重要的是它受限于特征的選取與組合(Feature Engineering),模型的好壞取決于分析員對(duì)數(shù)據(jù)的敏感程度。此外一種做法是,模仿專家的行為,選擇某一領(lǐng)域的特定專家,復(fù)制他們的決策過程,并導(dǎo)入可重復(fù)的計(jì)算框架。 全球最大的對(duì)沖基金橋水聯(lián)合(Bridgewater Asspcoates)早在2013年就開啟一個(gè)新的人工智能團(tuán)隊(duì),該團(tuán)隊(duì)約有六名員工,由曾經(jīng)供職IBM并開發(fā)了認(rèn)知計(jì)算系統(tǒng)Watson的David Ferrucci領(lǐng)導(dǎo)。據(jù)彭博新聞社報(bào)道,該團(tuán)隊(duì)將設(shè)計(jì)交易算法,通過歷史數(shù)據(jù)和統(tǒng)計(jì)概率預(yù)測(cè)未來。該程序?qū)㈦S著市場(chǎng)變化而變化,不斷適應(yīng)新的信息,而不是遵循靜態(tài)指令。而橋水基金的創(chuàng)始人也曾公開表示,其旗下基金持有大量多倉(cāng)和空倉(cāng),投資120種市場(chǎng),持倉(cāng)組合高達(dá)100多種,并且以人工智能的方式考慮投資組合。
Rebellion Research是一家運(yùn)用機(jī)器學(xué)習(xí)進(jìn)行全球權(quán)益投資的量化資產(chǎn)管理公司,Rebellion Research在2007年推出了第一個(gè)純?nèi)斯ぶ悄埽ˋI)投資基金。該公司的交易系統(tǒng)是基于貝葉斯機(jī)器學(xué)習(xí),結(jié)合預(yù)測(cè)算法,響應(yīng)新的信息和歷史經(jīng)驗(yàn)從而不斷演化,利用人工智能預(yù)測(cè)股票的波動(dòng)及其相互關(guān)系來創(chuàng)建一個(gè)平衡的投資組合風(fēng)險(xiǎn)和預(yù)期回報(bào),利用機(jī)器的嚴(yán)謹(jǐn)超越人類情感的陷阱,有效地通過自學(xué)習(xí)完成全球44個(gè)國(guó)家在股票、債券、大宗商品和外匯上的交易。 (責(zé)任編輯:幽靈學(xué)院) |
|