一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

 昵稱11935121 2018-07-14

本文整理自文因互聯(lián)CEO鮑捷在3月29日舉辦的金融知識圖譜論壇上所做的開場報告。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

今早我看了一下本次大會報名表,大概有 270 個人報名,參加的單位超過 150 個。我人工做了一個簡單的統(tǒng)計:其中有2家交易所,7 家券商,10 多家銀行,還有 10 多所大學(xué),逾 10 家的智能金融從業(yè)公司。除了今天的主講嘉賓之外,還有其他的好多家也過來了。BAT 也悉數(shù)到場,其他的加在一起有超過 10 家大型的互聯(lián)網(wǎng)公司,投資機(jī)構(gòu)來了至少有 30 家??梢钥吹秸麄€智能金融知識圖譜領(lǐng)域受到了極大關(guān)注,跟去年對比非常明顯。我們?nèi)ツ暌彩窃?3 月份的時候,在北京召開了第一次語義對話金融沙龍。那次我們請了一部分嘉賓,大概是來了 30 多個人,那次會場可以看比今天這個會場要小得多。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

這一年的時間,發(fā)生了很大的變化。我們今天討論的很多內(nèi)容,都是在這過去一年里面新增出來的。一年之前大家還把這個東西叫做語義,現(xiàn)在基本上都已經(jīng)轉(zhuǎn)叫知識圖譜了。雖然名字發(fā)生了變化,但是這個技術(shù)的本質(zhì)并沒有變化,其應(yīng)用卻發(fā)生了巨大的變化。像自動化報告,很多跟智能投研相關(guān)的技術(shù),去年都還只處于雛形構(gòu)思階段,到今天已經(jīng)得到了落實,在市場上已經(jīng)可以看到這樣的產(chǎn)品出現(xiàn)。

如果我們把金融知識圖譜放在一個更大的圖景里來看的話,可以看到整個 FinTech 行業(yè)的發(fā)展。過去三四年大家聽到最多的一個詞就是互聯(lián)網(wǎng)金融,最近一兩年有智能金融這個詞冒出來。在我的理解里面,它代表了 FinTech 的上半場和下半場。任何技術(shù)在去改變,或者革新一個已有的產(chǎn)業(yè),通常就會有這樣一個上半場和下半場。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

上半場重點在提高效率,在互聯(lián)網(wǎng)金融這個領(lǐng)域,主要是解決觸達(dá)的問題。不管是交易也好還是平臺也好,P2P 也好,其實它是在解決如何把原有的資源更好地組織在一起的問題。它把線下的搬到線上了,把原來效率低的提高效率,主要解決了一個觸達(dá)的問題。但是當(dāng)一個技術(shù)真正深入到一個領(lǐng)域,它將行業(yè)效率提升到了一個很高的程度,之后會發(fā)生怎樣的情況?通常會有新的商業(yè)模式應(yīng)運而生,產(chǎn)生一個重構(gòu)。以前它不能夠形成的商業(yè)模式,不能夠做的很多應(yīng)用,因為新技術(shù)的支持可以做了。我覺得這塊恰恰就是我們今后兩三年,甚至三四年的時間內(nèi)的一個重心。這一塊的重心就不僅僅是由于互聯(lián)網(wǎng)而更多的是由人工智能來支持的。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

在這個從觸達(dá)到重構(gòu)的變遷里,其實很多經(jīng)驗不完全適用。在更早的互聯(lián)網(wǎng)應(yīng)用里面,無非就是加錢、加人、加機(jī)器解決問題,因為互聯(lián)網(wǎng)的應(yīng)用,它是一種復(fù)雜的系統(tǒng)。但是對于智能系統(tǒng),它也是一種復(fù)雜系統(tǒng),但它不是 complex system,它是一個 complicated system,它里面有非常精細(xì)的小結(jié)構(gòu)在里頭,不僅是通過加錢加人就能夠解決這個問題,所以兩者的發(fā)展路徑上會有點不一樣的地方。

今天我們的主題是知識圖譜,但是知識圖譜其實是整個智能化的一部分。我們金融的智能化也不能脫離過去20年的整個工作。按照我自己的理解把它分為四個階段:

第一個階段就是信息化,包括銀行之前做的就是這件事情,比如我們用紙質(zhì)的文檔,現(xiàn)在變成一種機(jī)器的文檔,從線下到線上解決這個問題。

第二個階段是大數(shù)據(jù)化。過去其實十年的時間,一開始不叫大數(shù)據(jù),但其實做的東西就是大數(shù)據(jù)化,就是把割裂的分散的數(shù)據(jù)把它集中在一起。一開始它叫數(shù)據(jù)倉庫,后來叫大數(shù)據(jù),最近又叫云,每家銀行都在做,券商也在做,交易所也在做。實際上是要把這個數(shù)據(jù)從割裂狀態(tài),變成一個融合的狀態(tài),變成一個大數(shù)據(jù),解決這個問題。

這兩年應(yīng)該說從 2015 年開始,我們又進(jìn)入了下面一個階段,就是一個自動化的階段。在我們有了這么多數(shù)據(jù)之后,我們發(fā)現(xiàn)很多東西是非常繁瑣的,用人工來轉(zhuǎn)移這些數(shù)據(jù),不如用機(jī)器來做這種重復(fù)性的工作。我們用更智能的程序,來幫我們自動化這個過程,把繁瑣變?yōu)楹唵巍_@也是最近兩三年的時間,我們在很多分支里都看到了的嘗試。

智能化可以說是緊跟著自動化開始,我把它稱為從畫龍到點睛,也就是整個系統(tǒng)里面,我們以前是人做所有的工作。但是人應(yīng)該和機(jī)器在一起形成一個協(xié)作系統(tǒng),機(jī)器做復(fù)雜的事情,而人是真正的價值創(chuàng)造者。只有人才能夠點睛,智能化就是要把這個過程變成讓機(jī)器來畫龍,人來點睛的過程。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

人工智能現(xiàn)在有很多不同的分支,我這里列了三個主要的分支,就是經(jīng)驗主義,或者稱為機(jī)器學(xué)習(xí)方法,還有聯(lián)結(jié)主義,最近最火就是深度學(xué)習(xí),在這之前是神經(jīng)網(wǎng)絡(luò)方法,還有今天我們要談到的知識的方法,就是符號主義,更早的時候叫邏輯,后來在90年代末的時候,開始有一個領(lǐng)域叫語義網(wǎng),后來演化成了知識圖譜。在金融領(lǐng)域里面,早期大家對于機(jī)器學(xué)習(xí)比較熟悉,包括像信用卡導(dǎo)購,營銷,用戶畫像技術(shù),我們都會用到很多機(jī)器學(xué)習(xí)的方法;最近一兩年時間,深度學(xué)習(xí)開始廣泛的應(yīng)用,知識圖譜進(jìn)入還是算比較晚的吧。

大家對知識圖譜可能不是很熟悉,我這里就來簡單講一下我個人理解的知識圖譜。在我看來知識其實就是結(jié)構(gòu),我們最簡單的知識就是字典,我們用一些詞去定義另外一些詞,所以這就是形成了詞和詞之間的結(jié)構(gòu)。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

這副圖是谷歌的知識圖譜。它放出來的一個廣告圖,代表了每一個節(jié)點,就是一個實體,這里有一個蒙娜麗莎是一幅畫,然后達(dá)芬奇是一個人,這代表了一個關(guān)系,就是蒙娜麗莎是達(dá)芬奇畫的這樣一個關(guān)系?;仡^陳華鈞老師會更詳細(xì)地介紹。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

另外一個結(jié)構(gòu),就是行業(yè)上下游。每一種行業(yè),我們都可以畫出這個行業(yè)的上游產(chǎn)品、下游產(chǎn)品是什么;在每一種產(chǎn)品上有什么樣的公司在提供這樣一種服務(wù)。以前我們都是用人工來做這樣的事情,它可不可以自動化呢?以前我們對于比如A股上市公司,可能只有那么幾百個行業(yè),我們可以人工來做。但現(xiàn)在我們面臨的是上萬家上市和掛牌公司,上千個細(xì)分行業(yè),我們能不能用機(jī)器來提高效率,來做出這樣的知識圖譜呢?應(yīng)該是可以的。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

這是用了 JSON 的格式從公告里面提取出來的一個高管變動,里面提到了其中某一個人,他因為什么原因,他在什么時間辭去了什么職位,這樣一個知識提取,也是機(jī)器可以幫我們做出來的。

所以整個知識圖譜技術(shù)的核心,就是如何把數(shù)據(jù)結(jié)構(gòu)化。在傳統(tǒng)的數(shù)據(jù)庫研究里面,我們已經(jīng)看到了數(shù)據(jù)是結(jié)構(gòu)化的。知識圖譜技術(shù),從某種程度上來說,是數(shù)據(jù)庫技術(shù)往前的一步,把傳統(tǒng)的表格結(jié)構(gòu)所不能處理的復(fù)雜的關(guān)系,用更新型的數(shù)據(jù)庫來進(jìn)行存儲、表達(dá)。這個技術(shù)雖然是從2012年開始才為大家所知,但從淵源上講,已經(jīng)有差不多15年到20年的發(fā)展時間了。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

今天的論壇是由中文信息協(xié)會來主持的,中文信息協(xié)會以前是側(cè)重在自然語言處理這個技術(shù)上面的。自然語言處理里有一個分支叫知識提取,從非結(jié)構(gòu)化的數(shù)據(jù)里面,把結(jié)構(gòu)化數(shù)據(jù)提取出來。后來到了2012年左右的時候,這一塊就融入了知識圖譜技術(shù),白碩老師待會給大家詳細(xì)地講這一塊技術(shù)。知識表現(xiàn)是另外一塊,更古老的時候叫做邏輯,或者再早的時候叫專家系統(tǒng)。漆桂林老師是這塊的大拿。在語義網(wǎng)研究的十幾年的時間中起起伏伏,當(dāng)然也有一些非常輝煌的成功,包括像 Siri、IBM Watson 這樣的項目,在2010年、2012年的時候,證明了知識表現(xiàn)的價值。到2012年的時候,也被并入了知識圖譜這個領(lǐng)域。知識存儲的淵源,就是剛才提到的數(shù)據(jù)庫技術(shù)?,F(xiàn)在大家聽到得很多,像 Neo4j 這種圖數(shù)據(jù)庫,RDF 數(shù)據(jù)庫,都是代表了新的知識存儲引擎。最后一塊就是知識檢索,今天在座的也有很多從搜索引擎公司出來的朋友。谷歌有一句話是說我們現(xiàn)在搜索的東西,不再是字符串-string,而是實體-entity。

這四個不同的領(lǐng)域,發(fā)展到了某一個關(guān)鍵節(jié)點,都發(fā)現(xiàn)要想解決各自領(lǐng)域里的問題,必須用結(jié)構(gòu)化數(shù)據(jù),進(jìn)而就形成了知識圖譜這個技術(shù)。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

我們具體再來看金融知識圖譜,這是我們今天在中國市場上看到主要的各種類型的金融知識圖譜。這是一個很粗的分類,每一個分類下面,都會有很多更細(xì)分的分類。比如像前面的創(chuàng)投類數(shù)據(jù)庫,滕放騰總,文飛翔文總,還有郭穎哲郭總,他們接下來會分別向大家介紹自己的經(jīng)驗。另外在很多其他類型的市場上,包括一級市場、二級市場,我們都看到各種不同的知識圖譜、數(shù)據(jù)庫陸陸續(xù)續(xù)出現(xiàn)。比如做A股、新三板的公司,其實還有做港股、美股的公司,各種基本面的數(shù)據(jù),行情的數(shù)據(jù),現(xiàn)在都在陸陸續(xù)續(xù)地知識圖譜化。以前大家只看 F10,現(xiàn)在一種智能的“F10”出現(xiàn)了,還有公告數(shù)據(jù)、研報數(shù)據(jù)的提取、公告研報的檢索等等。泛輿情數(shù)據(jù)、泛企業(yè)數(shù)據(jù)和各種工商數(shù)據(jù),都是我們今天看到的金融知識圖譜的不同分支。

金融知識圖譜的現(xiàn)狀和展望——杭州金融知識圖譜論壇開場報告

從應(yīng)用上來講,我能想到的有十幾種。但實際上會遠(yuǎn)遠(yuǎn)不止這十幾種。讓人興奮的是,這里面的大多數(shù)應(yīng)用都是在過去一年里頭出現(xiàn)的。一年之前我列這個列表可能只有四五種,而現(xiàn)在我們可以列出十幾種。所以我們很難想象,明年我們會列出多少種。在各種投資的分支上面,我們可以看到知識圖譜有非常廣闊的應(yīng)用。今天在座的也有很多嘉賓,他們分別都在做各自的工作,這個論壇的目的就是把大家湊在一起,互通有無,交流經(jīng)驗。

我就簡短地說一下,今天主要的時間留給各位主講嘉賓。今天一共有 5 個報告人,前面白老師主要講 NLP 和知識圖譜對接的工作,然后是三個做創(chuàng)投數(shù)據(jù)庫的公司的老總來給大家分享一下自己的經(jīng)驗,最后是陳華鈞教授和丁力老師,來跟大家講一下開放知識圖譜的愿景。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    欧美成人精品一区二区久久| 久久99精品日韩人妻| 日韩欧美好看的剧情片免费| 91香蕉视频精品在线看| 成人亚洲国产精品一区不卡| 国产成人精品国产亚洲欧洲| 亚洲国产精品无遮挡羞羞| 成人欧美一区二区三区视频| 午夜福利国产精品不卡| 午夜福利激情性生活免费视频| 儿媳妇的诱惑中文字幕| 91精品蜜臀一区二区三区| 欧美又大又黄刺激视频| 日韩人妻毛片中文字幕| 两性色午夜天堂免费视频| 日韩精品免费一区三区| 永久福利盒子日韩日韩| 国产午夜福利片在线观看| 国产欧美亚洲精品自拍| 国产一级特黄在线观看| 精品人妻久久一品二品三品| 超薄肉色丝袜脚一区二区| 日韩av亚洲一区二区三区| 很黄很污在线免费观看| 日韩精品免费一区三区| 五月综合婷婷在线伊人| 精产国品一二三区麻豆| 黄色片国产一区二区三区| 久草热视频这里只有精品| 夜色福利久久精品福利| 五月婷婷六月丁香狠狠| 日本午夜免费观看视频| 美国女大兵激情豪放视频播放 | 久久99青青精品免费| 69老司机精品视频在线观看| 中国一区二区三区不卡| 大尺度激情福利视频在线观看| 国产日产欧美精品视频| 国产精品福利一二三区| 久热这里只有精品九九| 夫妻激情视频一区二区三区|