書名:《量化投資:數(shù)據(jù)挖掘技術(shù)與實(shí)踐》 作者:卓金武 周英 出版社:電子工業(yè)出版社 出版時(shí)間:2015-5-1 內(nèi)容簡(jiǎn)介 全書內(nèi)容分為三篇。第一篇(基礎(chǔ)篇)主要介紹數(shù)據(jù)挖掘與量化投資的關(guān)系,以及數(shù)據(jù)挖掘的概念、實(shí)現(xiàn)過(guò)程、主要內(nèi)容、主要工具等內(nèi)容。第二篇(技術(shù)篇)系統(tǒng)介紹了數(shù)據(jù)挖掘的相關(guān)技術(shù)及這些技術(shù)在量化投資中的應(yīng)用,主要包括數(shù)據(jù)的準(zhǔn)備、數(shù)據(jù)的探索、關(guān)聯(lián)規(guī)則方法、數(shù)據(jù)回規(guī)方法、分類方法、聚類方法、預(yù)測(cè)方法、診斷方法、時(shí)間序列方法、智能優(yōu)化方法等內(nèi)容。第三篇(實(shí)踐篇)主要介紹數(shù)據(jù)挖掘技術(shù)在量化投資中的綜合應(yīng)用實(shí)例,包括統(tǒng)計(jì)套利策略的挖掘與優(yōu)化、配對(duì)交易策略的挖掘與實(shí)現(xiàn)、數(shù)據(jù)挖掘在股票程序化交易中的綜合應(yīng)用,以及基于數(shù)據(jù)挖掘技術(shù)的量化交易系統(tǒng)的構(gòu)建。 前言 量化投資交易策略的業(yè)績(jī)穩(wěn)定,市場(chǎng)規(guī)模和份額不斷擴(kuò)大,得到越來(lái)越多投資者的認(rèn)可。中國(guó)金融業(yè)飛速發(fā)展,尤其是2010年股指期貨的推出,使得量化投資和對(duì)沖基金逐步進(jìn)入國(guó)內(nèi)投資者的視野。2012年丁鵬博士(600804)所著的《量化投資——策略與技術(shù)》出版后,更是推動(dòng)了量化投資技術(shù)在國(guó)內(nèi)的普及。目前,量化投資、對(duì)沖基金已經(jīng)成為中國(guó)資本市場(chǎng)最熱門的話題之一,各投資機(jī)構(gòu)紛紛開始著手打造各自的量化投資精英團(tuán)隊(duì)。 量化投資是將投資理念及策略通過(guò)具體指標(biāo)、參數(shù)的設(shè)計(jì),融入到具體的模型中,用模型對(duì)市場(chǎng)進(jìn)行不帶任何情緒的跟蹤,簡(jiǎn)單而言,就是用數(shù)量化的方法對(duì)股票、期貨等投資對(duì)象進(jìn)行估值,選取適合的對(duì)象進(jìn)行投資。目前,量化投資的書籍主要集中在模型和策略及工具的使用上,但關(guān)于如何產(chǎn)生這些量化模型、量化策略的書籍的確非常少。金融市場(chǎng)瞬息萬(wàn)變,為了更好地進(jìn)行量化投資,我們要不斷去驗(yàn)證既有模型的有效性,同時(shí)要想在金融行業(yè)保持自己的競(jìng)爭(zhēng)力,又必須不斷開發(fā)新的模型,而驗(yàn)證模型、開發(fā)模型,所謂量化投資的主要內(nèi)容,都需要數(shù)據(jù)的支撐。另一方面,金融領(lǐng)域是數(shù)據(jù)資源保存最好、最為豐富的行業(yè),在金融領(lǐng)域已經(jīng)積累了大量的數(shù)據(jù),同時(shí)每天還在產(chǎn)生大量的交易數(shù)據(jù)、價(jià)格數(shù)據(jù)等數(shù)據(jù)信息。這些數(shù)據(jù)資源正好為量化投資提供了很好的數(shù)據(jù)基礎(chǔ),那么問題的關(guān)鍵就是如何利用金融業(yè)豐富的數(shù)據(jù)資源更好地進(jìn)行量化投資。 數(shù)據(jù)挖掘技術(shù)是從數(shù)據(jù)中挖掘有用知識(shí)的一門系統(tǒng)性的技術(shù),剛好解決了數(shù)據(jù)利用的問題,所以數(shù)據(jù)挖掘與量化投資便很自然地結(jié)合在一起。但數(shù)據(jù)挖掘在國(guó)內(nèi)也是一個(gè)新領(lǐng)域,所以還沒有關(guān)于量化投資與數(shù)據(jù)挖掘相結(jié)合的相關(guān)書籍。另外,目前關(guān)于數(shù)據(jù)挖掘的幾本書基本都是譯著,由于語(yǔ)言和文化的差異,國(guó)內(nèi)讀者讀起來(lái)相對(duì)吃力。在這樣的背景下,能有一本書介紹如何利用數(shù)據(jù)挖掘技術(shù)進(jìn)行量化投資還是很好的。 巧合的是,筆者在MathWorks平時(shí)的工作職責(zé)之一是支持金融客戶,相當(dāng)比例是關(guān)于量化投資的,二是支持其他商業(yè)客戶的數(shù)據(jù)挖掘,所以對(duì)這兩個(gè)領(lǐng)域都有一定的了解。在一次研討會(huì)上,丁鵬博士與筆者討論了數(shù)據(jù)挖掘在量化投資中應(yīng)用的話題,感覺這是個(gè)非常好的課題,建議筆者寫一本這樣的書。筆者對(duì)這個(gè)課題也非常感興趣,于是就有了這本書的開始。 雖然筆者之前寫過(guò)一本《MATLAB在數(shù)學(xué)建模中的應(yīng)用》(在MATLAB相關(guān)書籍中也算是有影響力的書,2013年當(dāng)當(dāng)網(wǎng)自然科學(xué)類圖書中銷量排名Top20),具有一些寫作經(jīng)驗(yàn)。但寫這本書確實(shí)還是相當(dāng)費(fèi)勁。因?yàn)榻鹑趶臉I(yè)者大多比較務(wù)實(shí),所以本書的一個(gè)寫作原則就是內(nèi)容一定要?jiǎng)?wù)實(shí)。數(shù)據(jù)挖掘中涉及很多方法,這些方法的理論往往比較難,對(duì)于金融從業(yè)者來(lái)說(shuō),這些方法的思想和應(yīng)用最重要,理論不是關(guān)注的重點(diǎn)。所以對(duì)于本書中介紹的每個(gè)方法,盡量介紹清楚方法的思想、實(shí)現(xiàn)步驟,并以案例形式提供方法實(shí)現(xiàn)的MATLAB程序,這樣讀者就可以直接借鑒書中的程序,很快將書中的技術(shù)轉(zhuǎn)化為自己的實(shí)際操作工具。但筆者查閱了大量的參數(shù)書和網(wǎng)絡(luò)資料,發(fā)現(xiàn)數(shù)據(jù)挖掘中的這些方法,很少有這樣的程序,所以筆者花費(fèi)了大量的時(shí)間和精力去編寫這些方法的程序。這樣做也特別符合當(dāng)代人的學(xué)習(xí)習(xí)慣,現(xiàn)在社會(huì)信息實(shí)在是太豐富了,對(duì)讀者來(lái)說(shuō),一本好書應(yīng)該能讓大家快速掌握這本書的精華。為了早點(diǎn)寫好本書,在寫書期間,筆者將幾乎全部工作和生活之余的時(shí)間全部投入到寫書中去,每個(gè)晚上,每個(gè)周末,每次帶孩子去練習(xí)跆拳道的時(shí)候都在寫書。雖然看似很辛苦,但確實(shí)很有成就感,是這份成就感給了我執(zhí)著的動(dòng)力和快樂,最終完成了此書??傊?,寫書的過(guò)程是“痛并快樂著”! 本書內(nèi)容 全書內(nèi)容分為三篇。 第一篇(基礎(chǔ)篇)主要介紹一些基本概念和知識(shí),包括數(shù)據(jù)挖掘與量化投資的關(guān)系,數(shù)據(jù)挖掘的概念、實(shí)現(xiàn)過(guò)程、主要內(nèi)容、主要工具等內(nèi)容。 第二篇(技術(shù)篇)是本書的主體,系統(tǒng)介紹了數(shù)據(jù)挖掘的相關(guān)技術(shù)及這些技術(shù)在量化投資中的應(yīng)用實(shí)例。這部分又分為如下三個(gè)層次: ?。?)數(shù)據(jù)挖掘前期的一些技術(shù),包括數(shù)據(jù)的準(zhǔn)備(收集數(shù)據(jù)、數(shù)據(jù)質(zhì)量分析、數(shù)據(jù)預(yù)處理等)和數(shù)據(jù)的探索(衍生變量、數(shù)據(jù)可視化、樣本選擇、數(shù)據(jù)降維等)。 (2)數(shù)據(jù)挖掘的核心六大類方法,包括關(guān)聯(lián)規(guī)則、回歸、分類、聚類、預(yù)測(cè)和診斷。對(duì)于每類方法,則詳細(xì)介紹了其包含的典型算法,包括基本思想、應(yīng)用場(chǎng)景、算法步驟、MATLAB實(shí)現(xiàn)程序、應(yīng)用案例。同時(shí),對(duì)每類方法還介紹了一個(gè)在量化投資中的應(yīng)用案例,以強(qiáng)化這些方法在量化投資中的實(shí)用性。 ?。?)數(shù)據(jù)挖掘中特殊的實(shí)用技術(shù),包含兩章內(nèi)容,一是關(guān)于時(shí)序數(shù)據(jù)挖掘的時(shí)間序列技術(shù),二是關(guān)于優(yōu)化的智能優(yōu)化方法。這個(gè)層次也是數(shù)據(jù)技術(shù)體系中不可或缺的技術(shù)。時(shí)序數(shù)據(jù)是數(shù)據(jù)挖掘中的一類特殊數(shù)據(jù),并且金融數(shù)據(jù)往往都具有時(shí)序性,所以針對(duì)該類特殊的數(shù)據(jù)類型,又介紹了時(shí)間序列方法。另外,數(shù)據(jù)挖掘離不開優(yōu)化,量化投資也離不開優(yōu)化,所以又以一章智能優(yōu)化方法介紹兩個(gè)比較常用的優(yōu)化方法,遺傳算法和模擬退火算法。 第三篇(實(shí)踐篇)主要介紹數(shù)據(jù)挖掘技術(shù)在量化投資中的綜合應(yīng)用實(shí)例,包括統(tǒng)計(jì)套利策略的挖掘、配對(duì)交易策略的挖掘、基于數(shù)據(jù)挖掘技術(shù)的股票程序化交易,最后一章——基于數(shù)據(jù)挖掘技術(shù)的量化交易系統(tǒng),則給出了集成主流數(shù)據(jù)挖掘技術(shù)的量化投資系統(tǒng)的框架,讀者可以利用該框架,依據(jù)書中介紹的數(shù)據(jù)挖掘技術(shù),結(jié)合自己的情況,開發(fā)出屬于自己的量化交易系統(tǒng),從而輕松實(shí)現(xiàn)從理論到實(shí)踐這一跨越,更好地利用數(shù)據(jù)挖掘技術(shù)在量化投資的領(lǐng)域乘風(fēng)破浪,不斷創(chuàng)造佳績(jī)。 本書特色 綜觀全書,可發(fā)現(xiàn)本書的特點(diǎn)鮮明,主要表現(xiàn)在: ?。?)方法務(wù)實(shí),學(xué)以致用。本書介紹的方法都是數(shù)據(jù)挖掘中的主流方法,都經(jīng)過(guò)實(shí)踐的檢驗(yàn),具有較強(qiáng)的實(shí)踐性。對(duì)于每種方法,本書基本都給出了完整、詳細(xì)的源代碼,這對(duì)于讀者來(lái)說(shuō),具有非常大的參考價(jià)值,很多程序可供讀者直接套用并加以學(xué)習(xí),并可以直接轉(zhuǎn)化為自己的量化投資實(shí)戰(zhàn)工具。 ?。?)知識(shí)系統(tǒng),易于理解。本書的知識(shí)體系應(yīng)該是當(dāng)前數(shù)據(jù)挖掘書籍中最全、最完善的,不僅包含詳細(xì)的數(shù)據(jù)挖掘流程、數(shù)據(jù)準(zhǔn)備方法、數(shù)據(jù)探索方法,還包含六大類數(shù)據(jù)挖掘主體方法、時(shí)序數(shù)據(jù)挖掘方法、智能優(yōu)化方法。正因?yàn)橛型暾闹R(shí)體系,讀者讀起來(lái)才有很好的完整感,從而更利于理解數(shù)據(jù)挖掘的知識(shí)體系,這對(duì)于學(xué)習(xí)是非常有幫助的。 (3)結(jié)構(gòu)合理,易于學(xué)習(xí)。在講解方法時(shí),由淺入深,循序漸進(jìn),讓初學(xué)者知道入門的切入點(diǎn),讓專業(yè)人員又有值得借鑒的“干貨”。基礎(chǔ)篇、技術(shù)篇和實(shí)踐篇的結(jié)構(gòu)部署也讓本書獨(dú)樹一幟,讓讀者在學(xué)習(xí)數(shù)據(jù)挖掘和量化投資的過(guò)程中有一個(gè)循序漸進(jìn)的過(guò)程,使讀者在短時(shí)間內(nèi)成為一位數(shù)據(jù)挖掘高手,同時(shí)成為一位量化投資高手。 ?。?)案例實(shí)用,易于借鑒。絕大多數(shù)實(shí)例都是量化投資領(lǐng)域的實(shí)例,所以綜觀全書,本書都在有意引導(dǎo)讀者思考如何讓數(shù)據(jù)挖掘在量化投資中產(chǎn)生更實(shí)際的價(jià)值。 ?。?)主線明晰,脈絡(luò)分明。本書涉及知識(shí)面寬廣,以數(shù)據(jù)挖掘和量化投資為中心,輻射銀行、債券、營(yíng)銷、零售等領(lǐng)域和學(xué)科。為了與書稿主線保持一致,這些所涵蓋的領(lǐng)域雖然只是略微帶過(guò),但是從側(cè)面折射出數(shù)據(jù)挖掘技術(shù)真的廣泛服務(wù)于社會(huì)各個(gè)領(lǐng)域。在現(xiàn)代社會(huì),某學(xué)科單打獨(dú)斗的時(shí)代已經(jīng)過(guò)去了,本書在無(wú)形之中已經(jīng)樹立了一個(gè)意識(shí):各學(xué)科的知識(shí)之間是相通的,運(yùn)用知識(shí)的最高境界是各學(xué)科知識(shí)的大融合。 ?。?)理論與實(shí)踐相得益彰。對(duì)于本書的每個(gè)方法,除理論的講解,都配有一個(gè)典型的應(yīng)用案例,讀者可以通過(guò)案例加深對(duì)理論的理解,同時(shí)理論也讓案例的應(yīng)用更有信服力。技術(shù)的介紹都是以實(shí)現(xiàn)實(shí)例為目地,同時(shí)提供大量技術(shù)實(shí)現(xiàn)的源程序,方便讀者學(xué)習(xí),注重實(shí)踐和應(yīng)用,秉承筆者務(wù)實(shí)、切近讀者的寫作風(fēng)格。 ?。?)內(nèi)容獨(dú)特,趣味橫生。很多方法和內(nèi)容是同類書籍所沒有的,這無(wú)疑增強(qiáng)了本書的新穎性和趣味性。 (8)文字簡(jiǎn)介、明了,易于閱讀。在本書編寫過(guò)程中,在保證描述精準(zhǔn)的前提下,摒棄那些刻板、索然無(wú)味的文字,讓文字充滿活力,更易于閱讀。 讀者對(duì)象 從事投資工作的專業(yè)人士,包括證券、基金、私募、信托、銀行、保險(xiǎn)等領(lǐng)域的從業(yè)者。 從事數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)管理工作的專業(yè)人士。 金融、經(jīng)濟(jì)、管理、統(tǒng)計(jì)等專業(yè)的教師和學(xué)生。 從事量化投資或數(shù)據(jù)挖掘方向研究的科研工作者。 希望學(xué)習(xí)MATLAB的工程師或科研工作者。因?yàn)楸緯拇a都是用MATLAB編寫的,所以對(duì)于希望學(xué)習(xí)MATLAB的讀者來(lái)說(shuō),也是一本很好的參考書。 致專業(yè)人士 對(duì)于從事量化投資的專業(yè)人士來(lái)說(shuō),書中的數(shù)據(jù)挖掘技術(shù)是值得借鑒的技術(shù),至少會(huì)有助于挖掘或啟發(fā)策略。書中的實(shí)例都具有一定的實(shí)戰(zhàn)背景,含有一些從數(shù)據(jù)挖掘?qū)用娴牟呗裕蠹铱梢試L試將這些技術(shù)和策略融入自己的思想和策略中,以讓自己的策略更強(qiáng)大。另外,對(duì)于書中介紹的各方法的理論,如果您有很好的數(shù)學(xué)或計(jì)算機(jī)背景,且有時(shí)間或感興趣,可以認(rèn)真看,否則,理論部分可以直接跳過(guò)。但是每種方法的思想,應(yīng)用場(chǎng)景一定要領(lǐng)悟,這樣當(dāng)遇到合適的場(chǎng)景后,就可以馬上想到用哪種方法,然后直接借鑒書中的代碼就可以輕松將這些方法應(yīng)用到自己的量化投資實(shí)踐中。 對(duì)于從事數(shù)據(jù)挖掘的專業(yè)人士來(lái)說(shuō),大家可以關(guān)注整個(gè)數(shù)據(jù)挖掘知識(shí)體系和數(shù)據(jù)挖掘的流程,因?yàn)楸緯臄?shù)據(jù)挖掘知識(shí)體系應(yīng)該是當(dāng)前數(shù)據(jù)挖掘數(shù)據(jù)中體系最全、最完善的。另外,數(shù)據(jù)挖掘流程也介紹得很詳細(xì),具有很強(qiáng)的操作性。此外,書中的算法案例和綜合應(yīng)用案例,也算是本書的特色,值得借鑒。 致教師 本書系統(tǒng)地介紹了數(shù)據(jù)挖掘設(shè)計(jì)的理論、方法和案例,可以作為金融、經(jīng)濟(jì)、管理、統(tǒng)計(jì)等學(xué)科的本科專業(yè)教材或研究生教材。相比一般的數(shù)據(jù)挖掘教材,量化投資更容易激發(fā)學(xué)生的學(xué)習(xí)興趣,興趣是最好的老師,這對(duì)開展教學(xué)是非常有利的。 書中的內(nèi)容雖然系統(tǒng),但也相對(duì)獨(dú)立,教師可以根據(jù)課程的學(xué)時(shí)安排和專業(yè)方向的側(cè)重,選擇合適的內(nèi)容進(jìn)行課堂教學(xué),其他內(nèi)容則可以作為參考章節(jié)。授課部分,一般會(huì)包含第一篇的兩章和第二篇的前8章,總共10章內(nèi)容,而如果課時(shí)較多,則可以增加其他章節(jié),包括后面商業(yè)案例的學(xué)習(xí)。 |
|
來(lái)自: richard_168 > 《待分類》