引言
商業(yè)智能(BI)是目前在國外企業(yè)界和軟件開發(fā)界受到廣泛關(guān)注的一個(gè)研究方向。可以用兩點(diǎn)來總結(jié)這種研究熱點(diǎn)出現(xiàn)的原因:一、信息技術(shù)的高速發(fā)展帶來了企業(yè)利用信息技術(shù)提高本身競爭力的巨大空間:信息技術(shù)不但使企業(yè)獲取需要的信息,而且,促進(jìn)企業(yè)對信息的再利用,以此營造企業(yè)的競爭優(yōu)勢;二、IT界許多以提供軟件平臺(tái)和工具平臺(tái)的大公司通過多年與企業(yè)的交流,已經(jīng)認(rèn)識(shí)到企業(yè)對商業(yè)智能的迫切需求,紛紛加入到從事商業(yè)智能的研究與開發(fā)上來。IBM建立了專門從事BI方案設(shè)計(jì)的研究中心,ORACLE、微軟等公司紛紛推出了支持BI開發(fā)和應(yīng)用的軟件系統(tǒng),有的直接進(jìn)入了BI的開發(fā)領(lǐng)域。
數(shù)據(jù)挖掘研究院
由于BI尚處于從起步階段到發(fā)展階段的轉(zhuǎn)變時(shí)期,許多人對BI的理解存在一定的偏差。很多人認(rèn)為BI僅僅是一個(gè)進(jìn)行數(shù)據(jù)分析的軟件包,一些較為悲觀的人認(rèn)為BI是存在于理想家頭腦中的、企業(yè)永遠(yuǎn)不可能達(dá)到的境界。本文首先系統(tǒng)地詮釋了BI的概念,從多個(gè)方面總結(jié)了BI具有的功能,接著分析了BI的研究內(nèi)容和發(fā)展趨勢。為了讓讀者更加清晰地把BI與MIS系統(tǒng)區(qū)別開來,本文討論了BI與DSS(決策支持系統(tǒng))、EIS(經(jīng)理執(zhí)行系統(tǒng))的主要區(qū)別。最后,本文分析了制約BI健康發(fā)展的若干因素。 數(shù)據(jù)挖掘論壇
1.商業(yè)智能概述 數(shù)據(jù)挖掘交友
商業(yè)智能不是一個(gè)新名詞。多年來,企業(yè)一直在尋找對商業(yè)智能的理解和實(shí)現(xiàn)的方式,以增強(qiáng)企業(yè)的競爭力。早在80年代,當(dāng)時(shí)“商業(yè)智能”的標(biāo)準(zhǔn)是能容易地獲得想要的數(shù)據(jù)和信息。90年代是商業(yè)智能真正起步的階段。到目前為止,關(guān)于BI還沒有統(tǒng)一的定義,不同的人只是從不同的方面表達(dá)了對BI的理解。早在90年代初,Garter Group的Howard Dresner把EUQR(終端查詢和報(bào)表)、DSS、OLAP稱為商業(yè)智能。企業(yè)使用這些工具使企業(yè)獲得的優(yōu)勢也被稱為商業(yè)智能。后來,出現(xiàn)了數(shù)據(jù)倉庫、數(shù)據(jù)集市技術(shù),以及與之相關(guān)的ETL(抽取,轉(zhuǎn)換,上載)、數(shù)據(jù)清洗、數(shù)據(jù)挖掘、商業(yè)建模等,人們也將這些技術(shù)統(tǒng)歸為商業(yè)智能的領(lǐng)域。目前,存在將商業(yè)智能與數(shù)據(jù)倉庫和基于數(shù)據(jù)倉庫的分析方法等同起來的認(rèn)識(shí)趨勢。 數(shù)據(jù)挖掘研究院
其實(shí),商業(yè)智能代表為提高企業(yè)運(yùn)營性能而采用的一系列方法、技術(shù)和軟件的總和。商業(yè)智能,是幫助企業(yè)提高決策能力和運(yùn)營能力的概念、方法、過程以及軟件的集合。對該定義的正確解釋,從四個(gè)層面展開:
數(shù)據(jù)挖掘?qū)嶒?yàn)室
信息系統(tǒng)層面:稱為商業(yè)智能系統(tǒng)(BI System)的物理基礎(chǔ)。表現(xiàn)為具有強(qiáng)大決策分析功能的單獨(dú)的軟件工具和面向特定應(yīng)用領(lǐng)域的信息系統(tǒng)平臺(tái),如SCM、CRM、ERP。與事務(wù)型的MIS不同,商業(yè)智能系統(tǒng)能提供分析、趨勢預(yù)測等決策分析功能。
數(shù)據(jù)挖掘?qū)嶒?yàn)室
數(shù)據(jù)分析層面:是一系列算法、工具或模型。首先獲取與所關(guān)心主題有關(guān)的高質(zhì)量的數(shù)據(jù)或信息,然后自動(dòng)或人工參與使用具有分析功能的算法、工具或模型,幫助人們分析信息、得出結(jié)論、形成假設(shè)、驗(yàn)證假設(shè)。
數(shù)據(jù)挖掘?qū)嶒?yàn)室
知識(shí)發(fā)現(xiàn)層面:與數(shù)據(jù)分析層面一樣,是一系列算法、工具或模型。將數(shù)據(jù)轉(zhuǎn)變成信息,而后通過發(fā)現(xiàn),將信息轉(zhuǎn)變成知識(shí);或者直接將信息轉(zhuǎn)變成知識(shí)。 數(shù)據(jù)挖掘?qū)嶒?yàn)室
戰(zhàn)略層面:將信息或知識(shí)應(yīng)用在提高決策能力和運(yùn)營能力上;企業(yè)建模等。商業(yè)智能的戰(zhàn)略層面是利用多個(gè)數(shù)據(jù)源的信息以及應(yīng)用經(jīng)驗(yàn)和假設(shè)來提高企業(yè)決策能力的一組概念、方法和過程的集合。它通過對數(shù)據(jù)的獲取、管理和分析,為貫穿企業(yè)組織的各種人員提供信息,以提高企業(yè)戰(zhàn)略決策和戰(zhàn)術(shù)決策能力。
數(shù)據(jù)挖掘交友
總之,商業(yè)智能的目標(biāo)是將企業(yè)所掌握的信息轉(zhuǎn)換成競爭優(yōu)勢,提高企業(yè)決策能力、決策效率、決策準(zhǔn)確性。為完成這一目標(biāo),商業(yè)智能必須具有實(shí)現(xiàn)數(shù)據(jù)分析到知識(shí)發(fā)現(xiàn)的算法、模型和過程,決策的主題具有廣泛的普遍性。這個(gè)特點(diǎn)是本文定義商業(yè)智能時(shí)應(yīng)特別強(qiáng)調(diào)的。 數(shù)據(jù)挖掘論壇
基于以上定義的商業(yè)智能應(yīng)具有以下功能: 數(shù)據(jù)挖掘交友
數(shù)據(jù)管理功能: 數(shù)據(jù)挖掘論壇
從多個(gè)數(shù)據(jù)源ETL(抽取、轉(zhuǎn)換、轉(zhuǎn)貯)數(shù)據(jù)、清洗數(shù)據(jù)、數(shù)據(jù)集成能力;大量數(shù)據(jù)高效存儲(chǔ)與維護(hù)能力。
數(shù)據(jù)挖掘研究院
數(shù)據(jù)分析功能
具備OLAP,Legacy等多種數(shù)據(jù)分析功能;終端信息查詢和報(bào)表生成能力;數(shù)據(jù)可視化能力 數(shù)據(jù)挖掘研究院
知識(shí)發(fā)現(xiàn)功能 數(shù)據(jù)挖掘論壇
從大型數(shù)據(jù)庫中的數(shù)據(jù)中提取人們感興趣的知識(shí)的能力。這些知識(shí)是隱含的、事先未知的、潛在有用的信息,提取的知識(shí)表示為概念(concepts),規(guī)則(rules),規(guī)律(regulations),模式(patterns)等形式。 數(shù)據(jù)挖掘論壇
企業(yè)優(yōu)化功能
數(shù)據(jù)挖掘交友
輔助企業(yè)建模的能力。
數(shù)據(jù)挖掘交友
2.BI研究內(nèi)容、發(fā)展趨勢 數(shù)據(jù)挖掘?qū)嶒?yàn)室
商業(yè)智能為更好地制訂戰(zhàn)略和決策提供良好的環(huán)境,為特定的應(yīng)用系統(tǒng)(如客戶關(guān)系管理CRM、供應(yīng)鏈管理SCM、企業(yè)資源計(jì)劃ERP)提供數(shù)據(jù)環(huán)境和決策分析支持。當(dāng)面向特定應(yīng)用的特定戰(zhàn)略和決策問題,商業(yè)智能從數(shù)據(jù)準(zhǔn)備做起,建立或虛擬一個(gè)集成的數(shù)據(jù)環(huán)境。在集成的數(shù)據(jù)環(huán)境之上,利用科學(xué)的決策分析工具,通過數(shù)據(jù)分析、知識(shí)發(fā)現(xiàn)等過程,為戰(zhàn)略制訂和決策提供支持。最終,是如何解釋和執(zhí)行分析和發(fā)現(xiàn)結(jié)果的問題。整個(gè)過程中,集成的數(shù)據(jù)環(huán)境和決策分析工具是十分重要和不要缺少的。
數(shù)據(jù)挖掘工具
使用數(shù)據(jù)倉庫和數(shù)據(jù)集市建造集成的數(shù)據(jù)環(huán)境是逐漸走向成熟、也是目前最理想的做法。數(shù)據(jù)倉庫提供數(shù)據(jù)存貯環(huán)境,而且是面向特定主題的決策支持環(huán)境。來自各種數(shù)據(jù)源中的數(shù)據(jù)經(jīng)過清洗、ETL(抽取,轉(zhuǎn)換,上載),按某一主題存貯。數(shù)據(jù)集市是面向特定主題的小型數(shù)據(jù)倉庫,解決了企業(yè)級數(shù)據(jù)倉庫要存儲(chǔ)大量數(shù)據(jù)而帶來的建設(shè)周期長、造價(jià)高、可擴(kuò)展性差等缺陷。
數(shù)據(jù)挖掘論壇
OLAP是基于數(shù)據(jù)倉庫環(huán)境的數(shù)據(jù)分析工具。用戶首先提出自己的假設(shè),然后利用OLAP工具檢索查詢以驗(yàn)證或否定假設(shè),是用戶制動(dòng)式的分析方式。OLAP解決了基于OLTP分析效率低、不能進(jìn)行多維分析的缺點(diǎn)。相比較而言,知識(shí)發(fā)現(xiàn)(大多數(shù)人也稱數(shù)據(jù)挖掘)是較難理解的,它利用知識(shí)發(fā)現(xiàn)工具挖掘事先未知的、潛在有用的知識(shí)的過程,是一種主動(dòng)式自動(dòng)發(fā)現(xiàn)方法。圖2是文章總結(jié)的商業(yè)智能系統(tǒng)框架。 數(shù)據(jù)挖掘論壇
2.1.研究內(nèi)容
商業(yè)智能是利用當(dāng)今計(jì)算機(jī)前沿技術(shù)作支撐、運(yùn)用現(xiàn)代管理技術(shù)進(jìn)行指導(dǎo)的應(yīng)用系統(tǒng),它的研究熱點(diǎn)集中在三個(gè)方面:支撐技術(shù)的研究、體系結(jié)構(gòu)的研究、應(yīng)用系統(tǒng)的研究。
2.1.1.支撐技術(shù)的研究 數(shù)據(jù)挖掘論壇
商業(yè)智能作為一個(gè)在90年代末期出現(xiàn)的跨學(xué)科新興領(lǐng)域,必須借鑒兩方面的先進(jìn)成果,一是計(jì)算機(jī)技術(shù)的前沿技術(shù),一是企業(yè)管理方面的新理論、新觀點(diǎn)。企業(yè)管理方面的新理論、新觀點(diǎn)為戰(zhàn)略制訂和決策提供先進(jìn)的管理模式,幫助企業(yè)更好地運(yùn)營;先進(jìn)的計(jì)算機(jī)技術(shù)是提高系統(tǒng)性能的有力手段。
數(shù)據(jù)挖掘?qū)嶒?yàn)室
商業(yè)智能的支撐技術(shù)包括以下幾項(xiàng):一是計(jì)算機(jī)技術(shù),包括:數(shù)據(jù)倉庫、數(shù)據(jù)集市技術(shù);數(shù)據(jù)挖掘技術(shù);OLTP、OLAP、Legacy等分析技術(shù);數(shù)據(jù)可視化技術(shù);計(jì)算機(jī)網(wǎng)絡(luò)與WEB技術(shù)。二是企業(yè)管理,包括:統(tǒng)計(jì)、預(yù)測等運(yùn)籌學(xué)方法;客戶管理、供應(yīng)鏈管理、企業(yè)資源計(jì)劃等管理理論和方法;企業(yè)建模方法。 數(shù)據(jù)挖掘?qū)嶒?yàn)室
支撐技術(shù)的研究主要圍繞兩部分展開:決策支持工具研究和企業(yè)建模方法研究。企業(yè)建模是為解決如何建立特定企業(yè)模式的輔助工具。IDEF 等研究方法是較程式化的企業(yè)建模方法,比較新的建模方法包括基于UML的企業(yè)建模等方法。數(shù)據(jù)挖掘算法的研究是目前計(jì)算機(jī)界研究的熱點(diǎn)之一,它逐漸成為一個(gè)跨越人工智能、數(shù)據(jù)統(tǒng)計(jì)等多學(xué)科的研究領(lǐng)域。決策分析工具的研究還包括各種分析方法的研究。 數(shù)據(jù)挖掘?qū)嶒?yàn)室
2.1.2.體系結(jié)構(gòu)的研究
圖2描述了一個(gè)典型的商業(yè)智能體系結(jié)構(gòu)。面向特定應(yīng)用會(huì)有相應(yīng)改進(jìn)的體系結(jié)構(gòu),使商業(yè)具有良好的性能,例如:建立如何的數(shù)據(jù)存貯和數(shù)據(jù)模型能很好地支持主題和數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn)的需要;選擇何種決策分析工具,包括選擇實(shí)現(xiàn)何種任務(wù)、選擇實(shí)現(xiàn)這種任務(wù)的何種工具;將分析和發(fā)現(xiàn)的信息和知識(shí)通過何種接口達(dá)到需要的用戶等等。
2.1.3.應(yīng)用系統(tǒng)的研究
數(shù)據(jù)挖掘工具
對應(yīng)用系統(tǒng)的研究的重點(diǎn)在于對各個(gè)應(yīng)用領(lǐng)域所面臨的決策問題的分析。根據(jù)對各類問題的解決方式和解決方案來決定商業(yè)智能系統(tǒng)應(yīng)該提供的功能以及具體實(shí)現(xiàn)方法。目前,商業(yè)智能被廣泛應(yīng)用于與企業(yè)運(yùn)營過程相關(guān)的各個(gè)領(lǐng)域,并且在很多領(lǐng)域已經(jīng)形成其特有體系。目前具有代表性的應(yīng)用領(lǐng)域包括:企業(yè)資源計(jì)劃(ERP)、客戶關(guān)系管理(CRM)、企業(yè)性能管理(BPM)、人力資源管理(HRM)、供應(yīng)鏈管理(SCM)、電子商務(wù)(E-business)。 數(shù)據(jù)挖掘?qū)嶒?yàn)室
2.2.發(fā)展趨勢 數(shù)據(jù)挖掘研究院
與DSS、EIS系統(tǒng)相比,商業(yè)智能具有更美好的發(fā)展前景。近些年來,商業(yè)智能市場持續(xù)增長。IDC預(yù)測,到2005年,BI市場將達(dá)到118億$,平均年增長率為27%("Information Access Tools Market Forecast and Analysis: 2001-2005," IDC#24779, June 2001)。隨著企業(yè)CRM、ERP、SCM等應(yīng)用系統(tǒng)的引入,企業(yè)不停留在事務(wù)處理過程而注重有效利用企業(yè)的數(shù)據(jù)為準(zhǔn)確和更快的決策提供支持的需求越來越強(qiáng)烈,由此帶動(dòng)的對商業(yè)智能的需求將是巨大的。 數(shù)據(jù)挖掘工具
商業(yè)智能的發(fā)展趨勢可以歸納為以下幾點(diǎn): 數(shù)據(jù)挖掘交友
功能上具有可配置性、靈活性、可變化性
數(shù)據(jù)挖掘論壇
BI系統(tǒng)的范圍從為部門的特定用戶服務(wù)擴(kuò)展到為整個(gè)企業(yè)所有用戶服務(wù)。同時(shí),由于企業(yè)用戶在職權(quán)、需求上的差異,BI系統(tǒng)提供廣泛的、具有針對性的功能。從簡單的數(shù)據(jù)獲取,到利用WEB和局域網(wǎng)、廣域網(wǎng)進(jìn)行豐富的交互、決策信息和知識(shí)的分析和使用。 數(shù)據(jù)挖掘研究院
解決方案更開放、可擴(kuò)展、可按用戶定制,在保證核心技術(shù)的同時(shí),提供客戶化的界面
針對不同企業(yè)的獨(dú)特的需求,BI系統(tǒng)在提供核心技術(shù)的同時(shí),使系統(tǒng)又具個(gè)性化,即在原有方案基礎(chǔ)上加入自己的代碼和解決方案,增強(qiáng)客戶化的接口和擴(kuò)展特性;可為企業(yè)提供基于商業(yè)智能平臺(tái)的定制的工具,使系統(tǒng)具有更大的靈活性和使用范圍。 數(shù)據(jù)挖掘工具
從單獨(dú)的商業(yè)智能向嵌入式商業(yè)智能發(fā)展 數(shù)據(jù)挖掘論壇
這是目前商業(yè)智能應(yīng)用的一大趨勢,即在企業(yè)現(xiàn)有的應(yīng)用系統(tǒng)中,如財(cái)務(wù)、人力、銷售等系統(tǒng)中嵌入商業(yè)智能組件,使普遍意義上的事務(wù)處理系統(tǒng)具有商業(yè)智能的特性??紤]BI系統(tǒng)的某個(gè)組件而不是整個(gè)BI系統(tǒng)并非一件簡單的事,比如將OLAP技術(shù)應(yīng)用到某一個(gè)應(yīng)用系統(tǒng),一個(gè)相對完整的商業(yè)智能開發(fā)過程,如企業(yè)問題分析、方案設(shè)計(jì)、原型系統(tǒng)開發(fā)、系統(tǒng)應(yīng)用等過程是不可缺少的。
數(shù)據(jù)挖掘交友
從傳統(tǒng)功能向增強(qiáng)型功能轉(zhuǎn)變 數(shù)據(jù)挖掘研究院
增強(qiáng)型的商業(yè)智能功能是相對于早期的用SQL工具實(shí)現(xiàn)查詢的商業(yè)智能功能。目前應(yīng)用中的BI系統(tǒng)除實(shí)現(xiàn)傳統(tǒng)的BI系統(tǒng)功能之外,大多數(shù)已實(shí)現(xiàn)了圖2中數(shù)據(jù)分析層的功能。而數(shù)據(jù)挖掘、企業(yè)建模是BI系統(tǒng)應(yīng)該加強(qiáng)的應(yīng)用,以更好地提高系統(tǒng)性能。 數(shù)據(jù)挖掘研究院
3.BI與DSS、EIS的比較
商業(yè)智能作為一種新興的決策支持體系,與傳統(tǒng)的DSS、EIS相比,在以下方面存在明確的優(yōu)勢。
數(shù)據(jù)挖掘工具
3.1.使用對象范圍
商業(yè)智能的使用對象不再像DSS、EIS僅僅局限于企業(yè)的領(lǐng)導(dǎo)與決策、分析人員,而是擴(kuò)展到企業(yè)組織內(nèi)外的各類人員,為他們提供決策支持服務(wù),既有企業(yè)經(jīng)理一類的企業(yè)領(lǐng)導(dǎo)和高層決策者,又有企業(yè)內(nèi)部各部門的職能人員,還包括客戶、供應(yīng)商、合作伙伴等企業(yè)外部用戶。 數(shù)據(jù)挖掘研究院
3.2.具有的功能 數(shù)據(jù)挖掘交友
從以上分析看出,商業(yè)智能具有傳統(tǒng)DSS、EIS所不具有的強(qiáng)大的數(shù)據(jù)管理、數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)能力。 數(shù)據(jù)挖掘研究院
3.3.知識(shí)庫狀態(tài) 數(shù)據(jù)挖掘交友
傳統(tǒng)的DSS、EIS中的知識(shí)庫是在建立的系統(tǒng)中設(shè)置好的,庫中的知識(shí)很少發(fā)生變化。即使發(fā)生變化,采用定期人為更新的方法修改。而BI系統(tǒng)是一個(gè)閉合循環(huán)的動(dòng)態(tài)系統(tǒng)。圖2中的數(shù)據(jù)源部分來自各應(yīng)用系統(tǒng)的反饋,并且數(shù)據(jù)挖掘可以從現(xiàn)有的數(shù)據(jù)倉庫或數(shù)據(jù)集市中發(fā)現(xiàn)新知識(shí),隨時(shí)對知識(shí)庫中的內(nèi)容進(jìn)行自動(dòng)修正,所以BI中的知識(shí)庫是一種動(dòng)態(tài)結(jié)構(gòu)。
數(shù)據(jù)挖掘研究院
但商業(yè)智能也存在不足。商業(yè)智能的目標(biāo)與DSS一樣,是為了提高企業(yè)決策的效率和準(zhǔn)確性。但BI是通過數(shù)據(jù)分析、知識(shí)發(fā)現(xiàn)工具提供有價(jià)值的、輔助決策的信息和知識(shí),用戶必須根據(jù)這些信息和知識(shí),運(yùn)用現(xiàn)有的企業(yè)知識(shí)和經(jīng)驗(yàn)進(jìn)行判斷,做出決定,極少數(shù)具備智能決策的能力。不像專門的決策支持系統(tǒng)那樣提供方案生成、方案協(xié)調(diào)、方案評估等功能,更不具備群體決策的能力。
4.影響B(tài)I性能的因素 數(shù)據(jù)挖掘研究院
商業(yè)智能利用數(shù)據(jù)挖掘不斷發(fā)現(xiàn)新的知識(shí),擴(kuò)充到現(xiàn)有的企業(yè)知識(shí)中來。但就目前企業(yè)應(yīng)用現(xiàn)狀和算法實(shí)現(xiàn)上來看,制約知識(shí)發(fā)現(xiàn)的因素較多,同時(shí)也影響了BI的性能。
數(shù)據(jù)挖掘論壇
4.1.系統(tǒng)智能不能很好地實(shí)現(xiàn)
現(xiàn)有數(shù)據(jù)挖掘算法大多尚不成熟,效率較低。另外,作為BI數(shù)據(jù)基礎(chǔ)的數(shù)據(jù)倉庫或數(shù)據(jù)集市中數(shù)據(jù)量一般比較大,新知識(shí)形成的速度和準(zhǔn)確性比較低,致使現(xiàn)有的BI系統(tǒng)在知識(shí)發(fā)現(xiàn)方面的能力不能滿足用戶要求。
4.2.系統(tǒng)工具缺乏 數(shù)據(jù)挖掘論壇
目前大多數(shù)BI系統(tǒng)功能集中在數(shù)據(jù)分析方面,如數(shù)據(jù)查詢、報(bào)表、OLAP、數(shù)據(jù)可視化,很少有開發(fā)商在系統(tǒng)中配有知識(shí)發(fā)現(xiàn)工具。因此,功能比較集中,更深一層次的要求無法滿足。 數(shù)據(jù)挖掘論壇
5.結(jié)語 數(shù)據(jù)挖掘?qū)嶒?yàn)室
目前,對BI的研究與開發(fā)工作尚未處于起步階段。突出的問題在于數(shù)據(jù)分析、知識(shí)發(fā)現(xiàn)能力、效率低,或者缺乏知識(shí)發(fā)現(xiàn),而更像一個(gè)操作型應(yīng)用系統(tǒng)。很難在決策支持方面發(fā)揮BI應(yīng)有的作用。首先應(yīng)該認(rèn)識(shí)到BI發(fā)展、應(yīng)用的總體趨勢,其次多借鑒國外BI成熟的技術(shù)和方法,開發(fā)或不斷完善真正意義上的BI系統(tǒng)。相信本文對國內(nèi)BI的市場開發(fā)和研究會(huì)有啟發(fā)。