論文的主要工作以基于知識圖譜的專利推薦為主題,從研究背景和意義、國內(nèi)外研究現(xiàn)狀、用戶需求分析、系統(tǒng)概要設(shè)計、核心算法設(shè)計、系統(tǒng)詳細設(shè)計以及系統(tǒng)實現(xiàn)與測試等幾個方面對基于知識圖譜的專利推薦系統(tǒng)進行詳細描述。 第1章 緒論 1.1 背景和意義 傳統(tǒng)的文獻檢索方法難以保證快速從海量的文獻集合中獲取關(guān)鍵的文獻信息和相關(guān)知識,更難挖掘數(shù)據(jù)中蘊含的關(guān)聯(lián)關(guān)系 本文設(shè)計和構(gòu)建的專利數(shù)據(jù)知識圖譜,不僅基于專利的TCP分類號、申請人、地區(qū)等外部信息從宏觀上研究科學(xué)技術(shù)的發(fā)展概況W。而且對專利信息進行文本挖掘,提取科學(xué)技術(shù)關(guān)鍵詞,抽取各專利之間在技術(shù)、合作等方面存在的內(nèi)在聯(lián)系,從微觀上研究科學(xué)技術(shù)發(fā)展的關(guān)聯(lián)關(guān)系。本文結(jié)合現(xiàn)有的中文知識圖譜技術(shù),對專利數(shù)據(jù)知識圖譜進行構(gòu)建,獲取百科知識和科技博客的相關(guān)數(shù)據(jù),實現(xiàn)對專利數(shù)據(jù)中的技術(shù)名詞、機構(gòu)等實體知識進行內(nèi)容補充。 1.2 國內(nèi)外研究現(xiàn)狀 google搜索的知識圖譜、百度的“知心”知識圖譜、搜狗的“知立方”、上海交通大學(xué)的學(xué)術(shù)知識圖譜AceKG、國內(nèi)外學(xué)者在專利上的研究 1.3 系統(tǒng)解決的主要問題 1.源數(shù)據(jù)獲取與集成 2.專利之間關(guān)聯(lián)關(guān)系研宄 3.專利數(shù)據(jù)知識圖譜構(gòu)建 4.面向需求的專利推薦 5.系統(tǒng)設(shè)計 1.4 本文主要工作 基于知識圖譜技術(shù),結(jié)合自然語言處理算法,實現(xiàn)專利數(shù)據(jù)的知識檢索與推薦,并將其應(yīng)用到創(chuàng)新工作中。 1.5 論文的組織結(jié)構(gòu) 第2章系統(tǒng)需求分析 基于知識圖譜的專利推薦系統(tǒng)的目標和用戶需求,依據(jù)從企業(yè)和普通用戶調(diào)研獲取的業(yè)務(wù)需求報告,分析確定系統(tǒng)的需求和功能。 2.1 系統(tǒng)目標與主要任務(wù) 目標: 整合不同來源和結(jié)構(gòu)的數(shù)據(jù),包括專利庫和各種知識平臺等,提取數(shù)據(jù)中蘊含的知識實體和關(guān)系,結(jié)合本文設(shè)計的算法模型,實現(xiàn)專利數(shù)據(jù)知識圖譜構(gòu)建、專利知識檢索、面向發(fā)明需求的專利推薦與專利多維展示等功能。 任務(wù): 1. 數(shù)據(jù)的分析與計算 2. 系統(tǒng)展示結(jié)果的可視化設(shè)計。 2.2 系統(tǒng)功能需求分析 2.2.1 多源數(shù)據(jù)獲取
2.2.2 專利數(shù)據(jù)處理
2.2.3 專利數(shù)據(jù)知識圖譜構(gòu)建 2.2.4 專利知識檢索 1.專利信息檢索需求分析 2.作者信息檢索需求分析 3.主題信息檢索需求分析 4.機構(gòu)信息檢索需求分析 2.2.5 面向發(fā)明需求的專利推薦 2.2.6 專利多維展示 2.3 系統(tǒng)非功能性需求分析 頁面設(shè)計需求、系統(tǒng)性能需求、系統(tǒng)可靠性需求和系統(tǒng)的可擴展性需求。 第3章 系統(tǒng)概要設(shè)計 3.1 系統(tǒng)功能架構(gòu)設(shè)計 3.2 系統(tǒng)軟件架構(gòu)設(shè)計
3.3 系統(tǒng)技術(shù)架構(gòu)設(shè)計
3.4 系統(tǒng)網(wǎng)絡(luò)架構(gòu)設(shè)計
第4章 系統(tǒng)詳細設(shè)計 4.1 核心算法介紹 4.1.1 基于Keras的深度學(xué)習(xí)分詞模型 4.1.2 基于TextRank的關(guān)鍵詞提取算法 4.1.3 RAKE關(guān)鍵短語提取算法 4.1.4 基于K-means的實體識別算法 4.1.5 基于多維評分模型的專利推薦算法 4.2 多源數(shù)據(jù)獲取 4.3 專利數(shù)據(jù)處理
4.4 專利數(shù)據(jù)知識圖譜構(gòu)建 4.4.1 專利分類主題詞庫構(gòu)建 4.4.2 專利的實體與屬性提取 4.4.3 實體識別 4.4.4 專利的關(guān)系與屬性提取 4.4.5 三元組數(shù)據(jù)存儲 4.4.6 專利數(shù)據(jù)知識圖譜構(gòu)建類圖 4.5 專利知識檢索 4.5.1 專利信息檢索 4.5.2 作者信息檢索 4.5.3 主題信息檢索 4.5.4 機構(gòu)信息檢索 4.6 面向發(fā)明需求的專利推薦 |
|