一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

 東西二王 2020-06-18

目錄

  • 一、知識圖譜的機(jī)遇與挑戰(zhàn)▌知識圖譜上半場 1. 傳統(tǒng)知識工程2. 大數(shù)據(jù)知識工程3. 大數(shù)據(jù)知識工程到底解決了哪些問題?▌知識圖譜下半場 1. 應(yīng)用場景轉(zhuǎn)變2. 新的趨勢3. 機(jī)遇4. 應(yīng)對策略

  • 二、行業(yè)知識圖譜的構(gòu)建與應(yīng)用1. 知識圖譜整體結(jié)構(gòu)描述2. 知識建模3. 知識抽取4. 知識融合5. 知識存儲6. 知識計(jì)算7. 知識應(yīng)用8. 知識圖譜的自動(dòng)構(gòu)建


【說在前面】本人博客新手一枚,象牙塔的老白,職業(yè)場的小白。以下內(nèi)容僅為個(gè)人見解,歡迎批評指正,不喜勿噴![認(rèn)真看圖][認(rèn)真看圖]

【補(bǔ)充說明】如果你對知識圖譜感興趣,歡迎先瀏覽我的另一篇隨筆:基于圖模型的智能推薦算法學(xué)習(xí)筆記

一、知識圖譜的機(jī)遇與挑戰(zhàn)

分享一下肖仰華教授的報(bào)告。報(bào)告深度剖析知識圖譜的發(fā)展進(jìn)程,系統(tǒng)整理知識圖譜上半場的主要成果,分析知識圖譜下半場的挑戰(zhàn)與機(jī)遇,以期為各行業(yè)的認(rèn)知智能實(shí)踐帶來有益的參考。

▌知識圖譜上半場1. 傳統(tǒng)知識工程

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

2. 大數(shù)據(jù)知識工程

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

① 大規(guī)模簡單知識表示

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

② 知識獲取

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

③ 基于知識圖譜的簡單推理

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

3. 大數(shù)據(jù)知識工程到底解決了哪些問題?

① 語言表達(dá)鴻溝

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

② 缺失的因果鏈條

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

③ 碎片化數(shù)據(jù)的關(guān)聯(lián)與融合

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

④ 深化行業(yè)數(shù)據(jù)的理解與洞察

⑤ 顯著提升了機(jī)器的自然語言理解水平

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

⑥ 基于知識圖譜的大規(guī)模知識服務(wù)

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

⑦ 知識圖譜可視化已大量應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

⑧ 大數(shù)據(jù)知識工程理論體系日趨完善

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

▌知識圖譜下半場1. 應(yīng)用場景轉(zhuǎn)變

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

2. 新的趨勢

① 繁雜的應(yīng)用場景

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

② 深度的知識應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

③ 密集的專家知識

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

④ 有限的數(shù)據(jù)資源

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

3. 機(jī)遇

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

4. 應(yīng)對策略

知識表示方面:

① 與其他知識表示的協(xié)同表示與推理

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

② 知識圖譜的多模態(tài)表示

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

③ 知識圖譜的個(gè)性化表示

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

知識獲取方面:

① 發(fā)展低成本知識獲取方法

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

② 注重多粒度知識獲取

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

③ 發(fā)展大規(guī)模常識知識獲取

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

④ 復(fù)雜知識獲取機(jī)制與方法

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

知識應(yīng)用方面:

① 知識圖譜應(yīng)用透明化

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

② 基于知識圖譜的可解釋人工智能

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

③ 發(fā)展符號知識指導(dǎo)下的機(jī)器學(xué)習(xí)模型

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

▌總結(jié)

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

二、行業(yè)知識圖譜的構(gòu)建與應(yīng)用

分享一下PlantData的文章:行業(yè)知識圖譜構(gòu)建與應(yīng)用。

1. 知識圖譜整體結(jié)構(gòu)描述

知識圖譜結(jié)構(gòu)拓?fù)鋱D如圖所示:

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

企業(yè)全量數(shù)據(jù)應(yīng)用挑戰(zhàn)及應(yīng)對策略:

(1)多源異構(gòu)數(shù)據(jù)難以融合

使用知識圖譜(本體)對各類數(shù)據(jù)建模,基于可動(dòng)態(tài)變化的數(shù)據(jù)模型(概念-實(shí)體-屬性-關(guān)系),實(shí)現(xiàn)統(tǒng)一建模。

(2)數(shù)據(jù)模式動(dòng)態(tài)變遷困難

使用可支持?jǐn)?shù)據(jù)模式動(dòng)態(tài)變化的知識圖譜的數(shù)據(jù)存儲。

(3)非結(jié)構(gòu)化數(shù)據(jù)計(jì)算機(jī)難以理解

利用信息抽取技術(shù)。

(4)數(shù)據(jù)使用專業(yè)程度過高

(5)分散的數(shù)據(jù)難以統(tǒng)一消費(fèi)利用

在知識融合的基礎(chǔ)上,基于語義檢索、知識問答、圖計(jì)算、推理、可視化等技術(shù),提供數(shù)據(jù)檢索/分析/利用,統(tǒng)一平臺。

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

2. 知識建模

(1)以實(shí)體為主體目標(biāo),實(shí)現(xiàn)對不同來源的數(shù)據(jù)進(jìn)行映射與合并。(實(shí)體抽取與合并)

(2)利用屬性來表示不同數(shù)據(jù)源中針對實(shí)體的描述,形成對實(shí)體的全方位描述。(屬性映射與歸并)

(3)利用關(guān)系來描述各類抽象建模成實(shí)體的數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,從而支持關(guān)聯(lián)分析。(關(guān)系抽取)

(4)通過實(shí)體鏈接技術(shù),實(shí)現(xiàn)圍繞實(shí)體的多種類型數(shù)據(jù)的關(guān)聯(lián)存儲。(實(shí)體鏈接)

(5)使用事件機(jī)制描述客觀世界中動(dòng)態(tài)發(fā)展,體現(xiàn)事件與實(shí)體間的關(guān)聯(lián);并利用時(shí)序描述事件的發(fā)展?fàn)顩r。(動(dòng)態(tài)事件描述)

知識建模工具:Protégé(本體編輯器,較局限)

3. 知識抽取

知識抽取的主要策略如圖所示(針對結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的處理方式不同):

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

知識抽取中的文本信息抽取,主要包括:實(shí)體識別、關(guān)系抽取、事件抽取、概念抽取。信息抽取主要有兩大類工具:

  • OpenIE:面向開放領(lǐng)域抽取信息、關(guān)系類型事先未知、基于語言學(xué)模式進(jìn)行抽取、規(guī)模大、精度相對較低。典型工具:ReVerb、TextRunner(準(zhǔn)確率低,實(shí)用性不強(qiáng),一般不用)

  • CloseIE:面向特定領(lǐng)域抽取信息、預(yù)先定義好抽取的關(guān)系類型、基于領(lǐng)域?qū)I(yè)知識抽取、規(guī)模小、精度比較高。典型工具:DeepDive(主要是針對實(shí)體識別,缺乏對關(guān)系/事件/概念的抽?。?/p>

非結(jié)構(gòu)化文本數(shù)據(jù)的處理包括以下步驟:

  • 分詞、詞性標(biāo)注、語法解析、依存分析

  • NER命名實(shí)體識別、實(shí)體鏈接

  • 關(guān)系抽取、事件抽取

其中,事件抽取可以分為預(yù)定義事件抽取和開放域事件抽取,行業(yè)知識圖譜中主要為預(yù)定義事件抽取。采用模式匹配方法,包括三個(gè)步驟:

  • 準(zhǔn)備事件觸發(fā)詞表

  • 候選事件抽取:尋找含有觸發(fā)詞的句子

  • 事件元素識別:根據(jù)事件模版抽取相應(yīng)的元素

還有基于機(jī)器學(xué)習(xí)模型的抽?。篠VM、邏輯回歸、CRF、LSTM等:

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

補(bǔ)充說明,關(guān)于知識表示,歡迎先瀏覽我的另一篇隨筆:基于圖模型的智能推薦算法學(xué)習(xí)筆記,這里不再贅述。

  • 基于數(shù)理邏輯的知識表示:RDF(資源描述框架)、OWL(RDF Schema 的擴(kuò)展)、SPARQL(RDF查詢語言)

  • 基于向量空間學(xué)習(xí)的分布式知識表示:Rescal、NTN、TransE(Embedding)

4. 知識融合

(1)數(shù)據(jù)層融合:實(shí)體鏈接技術(shù)

即等同性判斷:給定不同數(shù)據(jù)源中的實(shí)體,判斷其是否指向同一個(gè)真實(shí)世界實(shí)體(實(shí)體屬性與關(guān)系的合并)。

  • 基于實(shí)體知識的鏈接

  • 基于篇章主題的鏈接

  • 融合實(shí)體知識和篇章主題的鏈接

實(shí)體鏈接工具:Wikipedia Miner、DBpedia Spotlight等,大部分都是針對百科類的知識庫工作的,基本不支持中文的處理。

(2)語義描述層融合:Schema Mapping

  • 概念上下位關(guān)系合并

  • 概念的屬性定義合并

當(dāng)然還有一些別的需要考慮,例如多源知識融合、沖突檢測與解決、跨語言融合、知識驗(yàn)證等。

例如,通過人機(jī)交互接口對錯(cuò)誤信息進(jìn)行人工糾正,并以此作為種子案例,通過強(qiáng)化學(xué)習(xí)加強(qiáng)模型的識別精度和魯棒性。

5. 知識存儲

知識圖譜是基于圖的數(shù)據(jù)結(jié)構(gòu),其存儲方式主要有兩種方式:RDF存儲圖數(shù)據(jù)庫。

  • 基于關(guān)系數(shù)據(jù)庫的存儲

  • 基于原生圖的存儲

  • 基于混合存儲

下面展示各大圖數(shù)據(jù)庫的對比:

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

行業(yè)知識圖譜的構(gòu)建及應(yīng)用

6. 知識計(jì)算

(1)基于圖論的相關(guān)算法:

  • 圖遍歷:廣度優(yōu)先遍歷、深度優(yōu)先遍歷

  • 最短路徑查詢: Dijkstra(迪杰斯特拉算法)、Floyd(弗洛伊德算法)

  • 路徑探尋:給定兩個(gè)或多個(gè)節(jié)點(diǎn),發(fā)現(xiàn)它們之間的關(guān)聯(lián)關(guān)系

  • 權(quán)威節(jié)點(diǎn)分析:PageRank算法

  • 族群發(fā)現(xiàn):最大流算法

  • 相似節(jié)點(diǎn)發(fā)現(xiàn):基于節(jié)點(diǎn)屬性、關(guān)系的相似度算法

(2)本體推理:使用本體推理進(jìn)行新知識發(fā)現(xiàn)或沖突檢測。

  • 基于表運(yùn)算及改進(jìn)的方法:FaCT 、Racer、Pellet Hermit等

  • 基于一階查詢重寫的方法(Ontology based data access,基于本體的數(shù)據(jù)訪問)

  • 基于產(chǎn)生式規(guī)則的算法(如rete):Jena 、Sesame、OWLIM等

  • 基于Datalog轉(zhuǎn)換的方法:KAON、RDFox等

  • 回答集程序Answer set programming

本體知識推理工具:RDFox。

(3)基于規(guī)則的推理:使用規(guī)則引擎,編寫相應(yīng)的業(yè)務(wù)規(guī)則,通過推理輔助業(yè)務(wù)決策。

  • 在知識圖譜基礎(chǔ)知識的基礎(chǔ)上,專家依據(jù)行業(yè)應(yīng)用的業(yè)務(wù)特征進(jìn)行規(guī)則的定義。

  • 引擎基于基礎(chǔ)知識與所定義的規(guī)則,執(zhí)行推理過程給出推理結(jié)果。

基于規(guī)則推理工具:Drools 規(guī)則定義。

7. 知識應(yīng)用

智能問答(基于語義解析的方法 基于信息檢索的方法)、語義搜索(基于實(shí)體鏈接)、可視化決策支持(D3.js、ECharts)等。

舉例金融業(yè)的基于知識圖譜的風(fēng)險(xiǎn)管理:

  • 知識獲取部分:需要內(nèi)部 外部,需要特別注意完整性原則(信息不對稱是很多風(fēng)險(xiǎn)的根源)

  • 知識融合部分:需要內(nèi)部 外部,需要特別注意準(zhǔn)確性原則(本體一致性、數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)一性、本地表現(xiàn)狀態(tài)一致性)

  • 知識計(jì)算部分:需要特別注意適用性原則

  • 知識應(yīng)用部分:人機(jī)交互接口 貸款全流程:有效控制貸款準(zhǔn)入、提升貸款決策有效性審批額度時(shí):防止多頭授信、規(guī)避關(guān)聯(lián)企業(yè)互相擔(dān)保貸后監(jiān)控中:檢測資金流入關(guān)聯(lián)企業(yè)、參與民間借貸保金過程中:識別企業(yè)的關(guān)聯(lián)資產(chǎn)、彌補(bǔ)損失

8. 知識圖譜的自動(dòng)構(gòu)建

可構(gòu)建的圖譜:例如公司圖譜、產(chǎn)品圖譜、?物圖譜、智能預(yù)警等。在行業(yè)應(yīng)用中使用知識圖譜,大致有如下幾種方式:

  • 可以使用現(xiàn)有的套裝工具,在現(xiàn)有套裝工具的基礎(chǔ)上進(jìn)行擴(kuò)充:LOD2、Stardog

  • 可以使用各生命周期過程中的相應(yīng)工具進(jìn)行組合使用,針對性開發(fā)或擴(kuò)展生命周期中特定工具

如果您對異常檢測感興趣,歡迎瀏覽我的另一篇博客:異常檢測算法演變及學(xué)習(xí)筆記

如果您對智能推薦感興趣,歡迎瀏覽我的另一篇博客:智能推薦算法演變及學(xué)習(xí)筆記 、CTR預(yù)估模型演變及學(xué)習(xí)筆記

如果您對時(shí)間序列分析感興趣,歡迎瀏覽我的另一篇博客:時(shí)間序列分析中預(yù)測類問題下的建模方案 、深度學(xué)習(xí)中的序列模型演變及學(xué)習(xí)筆記

如果您對數(shù)據(jù)挖掘感興趣,歡迎瀏覽我的另一篇博客:數(shù)據(jù)挖掘比賽/項(xiàng)目全流程介紹 、機(jī)器學(xué)習(xí)中的聚類算法演變及學(xué)習(xí)筆記

如果您對人工智能算法感興趣,歡迎瀏覽我的另一篇博客:人工智能新手入門學(xué)習(xí)路線和學(xué)習(xí)資源合集(含AI綜述/python/機(jī)器學(xué)習(xí)/深度學(xué)習(xí)/tensorflow)、人工智能領(lǐng)域常用的開源框架和庫(含機(jī)器學(xué)習(xí)/深度學(xué)習(xí)/強(qiáng)化學(xué)習(xí)/知識圖譜/圖神經(jīng)網(wǎng)絡(luò))

如果你是計(jì)算機(jī)專業(yè)的應(yīng)屆畢業(yè)生,歡迎瀏覽我的另外一篇博客:如果你是一個(gè)計(jì)算機(jī)領(lǐng)域的應(yīng)屆生,你如何準(zhǔn)備求職面試?

如果你是計(jì)算機(jī)專業(yè)的本科生,歡迎瀏覽我的另外一篇博客:如果你是一個(gè)計(jì)算機(jī)領(lǐng)域的本科生,你可以選擇學(xué)習(xí)什么?

如果你是計(jì)算機(jī)專業(yè)的研究生,歡迎瀏覽我的另外一篇博客:如果你是一個(gè)計(jì)算機(jī)領(lǐng)域的研究生,你可以選擇學(xué)習(xí)什么?

如果你對金融科技感興趣,歡迎瀏覽我的另一篇博客:如果你想了解金融科技,不妨先了解金融科技有哪些可能?

之后博主將持續(xù)分享各大算法的學(xué)習(xí)思路和學(xué)習(xí)筆記:hello world: 我的博客寫作思路

    本站是提供個(gè)人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    亚洲熟妇熟女久久精品| 国产农村妇女成人精品| 老司机精品视频免费入口| 亚洲综合色在线视频香蕉视频 | 日韩高清一区二区三区四区| 国产欧美日产中文一区| 久久综合亚洲精品蜜桃| 日本99精品在线观看| 欧美国产日产综合精品| 亚洲丁香婷婷久久一区| 久久亚洲精品成人国产| 女人高潮被爽到呻吟在线观看| 中文字幕乱码免费人妻av| 成人精品欧美一级乱黄| 国产精品推荐在线一区| 日韩日韩日韩日韩在线| 久热久热精品视频在线观看| 在线观看中文字幕91| 久久精品亚洲精品国产欧美| 精品女同一区二区三区| 人妻少妇久久中文字幕久久| 欧美综合色婷婷欧美激情| 国产成人免费激情视频| 日韩高清中文字幕亚洲| 在线观看视频日韩成人| 精品少妇人妻av免费看| 国产一区二区三区成人精品| 亚洲性日韩精品一区二区| 国产盗摄精品一区二区视频| 欧美又大又黄刺激视频| 亚洲视频一区自拍偷拍另类| 国产一区国产二区在线视频| 午夜国产精品国自产拍av| 日韩成人动作片在线观看| 欧美日韩精品久久第一页| 日本欧美视频在线观看免费| 久久精品a毛片看国产成人| 日韩欧美中文字幕av| 国产女性精品一区二区三区| 能在线看的视频你懂的| 国产精品成人免费精品自在线观看 |