3年前,中國(guó)電信研究院工程師陳勇還是一家軟件公司的項(xiàng)目經(jīng)理,當(dāng)時(shí),他曾主持過(guò)一家德國(guó)輪軸制造企業(yè)在華分公司的知識(shí)管理系統(tǒng)的設(shè)計(jì)與實(shí)施。那時(shí),這家公司開(kāi)始加大對(duì)中國(guó)市場(chǎng)的投資力度,不僅千里迢迢把研發(fā)中心搬到了中國(guó),還一口氣實(shí)施了知識(shí)管理系統(tǒng)、ERP系統(tǒng)和產(chǎn)品數(shù)據(jù)管理(Product Data Management,PDM)系統(tǒng)。時(shí)隔3年,當(dāng)陳勇回訪那家企業(yè)時(shí),發(fā)現(xiàn)這家企業(yè)隨著業(yè)務(wù)量和數(shù)據(jù)量的增大,出現(xiàn)了一系列當(dāng)初大家始料未及的問(wèn)題:盡管它在IT建設(shè)上投入了大筆資金,但企業(yè)內(nèi)部卻出現(xiàn)了數(shù)據(jù)混亂的局面,誰(shuí)也不知道整個(gè)公司的信息系統(tǒng)中存放了多少數(shù)據(jù),這些數(shù)據(jù)又具體在哪個(gè)系統(tǒng)里,又有多少數(shù)據(jù)間存在沖突,至于是否存在未經(jīng)授權(quán)就使用數(shù)據(jù)的情況就更沒(méi)人知道了。 “現(xiàn)在,企業(yè)內(nèi)部的數(shù)據(jù)越來(lái)越多,每個(gè)信息系統(tǒng)里都有大量的數(shù)據(jù),但想從這些系統(tǒng)里尋找想要的數(shù)據(jù),簡(jiǎn)直像大海撈針一樣?!标愑抡f(shuō)。一個(gè)花了大價(jià)錢進(jìn)行信息化建設(shè)的企業(yè),并且還是一貫嚴(yán)謹(jǐn)?shù)牡聡?guó)企業(yè)竟然出現(xiàn)了這樣的情形,多少有些尷尬和無(wú)奈。 孤島效應(yīng) 其實(shí),這家德國(guó)企業(yè)碰到的尷尬,很多企業(yè)都正在面對(duì)。一家全球網(wǎng)絡(luò)安全軟件服務(wù)商的工程師Victor就為無(wú)法全文檢索公司內(nèi)部的信息而頭痛。“我們公司的文檔管理系統(tǒng)是自己研發(fā)的,全球各分公司和研究中心的文件、報(bào)告、會(huì)議記錄都由這個(gè)系統(tǒng)來(lái)統(tǒng)一管理。這個(gè)系統(tǒng)雖然可以提供文檔分類和資源檢索的功能,但只能提供文檔標(biāo)題的查詢,想全文檢索信息就無(wú)能為力了。”他說(shuō)。因此Victor所在的項(xiàng)目組每次接到新項(xiàng)目后,都要花相當(dāng)大的精力把公司文檔管理系統(tǒng)中所有的相關(guān)資料先下載到項(xiàng)目組的服務(wù)器上,然后再按工程師的不同需求分配到個(gè)人電腦上。“這樣,文檔管理系統(tǒng)、項(xiàng)目組服務(wù)器和個(gè)人電腦中就出現(xiàn)了一份文檔的多份拷貝,我們經(jīng)常不知道哪份文檔已經(jīng)更新了,需要重新下載。”Victor抱怨道:“如果項(xiàng)目中途出現(xiàn)人員變動(dòng),新的組員往往要重做一遍文檔下載工作。這不僅加大了時(shí)間成本,還使得工作效率大打折扣?!?/p> 美國(guó)全文檢索和智力資產(chǎn)服務(wù)公司Verity大中華區(qū)首席代表黃浩說(shuō):“如今,很多企業(yè)和機(jī)構(gòu)都有大量的信息資產(chǎn),它們以各種形式存儲(chǔ)在數(shù)據(jù)庫(kù)、文件服務(wù)器、Web服務(wù)器及CRM、ERP等各種應(yīng)用系統(tǒng)中,因?yàn)槿狈τ行У墓芾?,這些信息散落在大小‘信息孤島’上,不但沒(méi)有體現(xiàn)出其應(yīng)有的價(jià)值,有時(shí)反而會(huì)成為企業(yè)的一種負(fù)擔(dān)?!?/p> 上文提到的那家德國(guó)輪軸公司在信息化過(guò)程中,由于信息系統(tǒng)之間是相互孤立的,所以數(shù)據(jù)也被分割在不同的“信息孤島”上?!斑@樣,它就無(wú)法對(duì)公司信息資產(chǎn)進(jìn)行整體的掌控。” 百度企業(yè)軟件運(yùn)營(yíng)總監(jiān)王嘯認(rèn)為,這些企業(yè)中的信息存放在多個(gè)不同的信息源中,一旦查找起來(lái),就要不停地在各個(gè)系統(tǒng)中切換,不僅無(wú)法實(shí)現(xiàn)全文檢索,更做不到將檢索后的信息進(jìn)行自動(dòng)分類整理。“即使在那些十分重視數(shù)據(jù)管理的企業(yè)里,CIO要求員工們?cè)跈M跨多個(gè)業(yè)務(wù)平臺(tái)工作時(shí),時(shí)刻給文檔加上詳細(xì)的標(biāo)簽,以便日后檢索。但實(shí)際上這種做法收效甚微,難以滿足信息查找的要求?!?/p> 據(jù)IDC從2001到2004的調(diào)查表明,信息孤島使得海量的數(shù)據(jù)沉睡在無(wú)人知曉的角落,這給企業(yè)帶來(lái)了巨大的經(jīng)濟(jì)損失。以一個(gè)擁有1000個(gè)知識(shí)工作者的企業(yè)為例,其每年因?yàn)閱T工查找不到企業(yè)中已經(jīng)存在的信息所帶來(lái)的額外花費(fèi)可達(dá)600萬(wàn)美元之多。這無(wú)疑大大增加了企業(yè)的支出。 企業(yè)搜索 面對(duì)企業(yè)進(jìn)行信息資產(chǎn)查詢、管理的各種困難,如何將數(shù)據(jù)、信息有效地結(jié)合起來(lái),使這些數(shù)據(jù)、信息、知識(shí)、經(jīng)驗(yàn)發(fā)揮最大的價(jià)值,一個(gè)能夠?qū)ζ髽I(yè)內(nèi)各種信息進(jìn)行匯聚、分類、檢索、分析的搜索平臺(tái)顯得非常有意義。 黃浩希望企業(yè)搜索技術(shù)能幫助那家德國(guó)輪軸企業(yè)的CEO化解他在IT投入上的尷尬——“每天早上,他到達(dá)辦公室時(shí),按照他的需求,相關(guān)信息已經(jīng)從各個(gè)業(yè)務(wù)部門提取出來(lái)并整理分類,以報(bào)表的形式展示在他的電腦里。如果他想進(jìn)一步了解某個(gè)數(shù)據(jù)或分析結(jié)果,只需在電腦的搜索框里輸入關(guān)鍵字,就能把所有企業(yè)內(nèi)網(wǎng)中的關(guān)聯(lián)信息逐個(gè)找出來(lái)?!?/p> 企業(yè)搜索是一種面向組織的搜索技術(shù),它能幫助企業(yè)和各種機(jī)構(gòu)有效地管理信息資產(chǎn)。有了它的幫助,企業(yè)查找想要的數(shù)據(jù)就能像探囊取物一般容易。企業(yè)搜索還是一個(gè)可以整合企業(yè)中所有信息資源的平臺(tái),它構(gòu)建于原有的信息系統(tǒng)之上,既能夠準(zhǔn)確及時(shí)地找到已知的、存在的信息,還能揭示、發(fā)現(xiàn)未知的信息,并提供各種信息的分析和評(píng)估報(bào)告。 據(jù)統(tǒng)計(jì),目前大約85%的企業(yè)信息是非結(jié)構(gòu)化數(shù)據(jù),包括紙張文件、報(bào)告、傳真、視頻、音頻、圖片?!皞鹘y(tǒng)的信息處理技術(shù)無(wú)法對(duì)這么復(fù)雜的數(shù)據(jù)進(jìn)行有效處理?!蓖鯂[說(shuō)。企業(yè)搜索不同于人們熟知的互聯(lián)網(wǎng)搜索,特別是在文件的類型上,互聯(lián)網(wǎng)搜索所需要處理的文件類型一般只有十幾種,而企業(yè)搜索可能要面對(duì)幾百種數(shù)據(jù)類型。要對(duì)幾百種不同格式的文件進(jìn)行檢索,這就要依靠非結(jié)構(gòu)化搜索引擎(Unstructured Search Engine)。它有點(diǎn)類似于互聯(lián)網(wǎng)搜索引擎,不過(guò)是面向企業(yè)用戶中各種各樣的數(shù)據(jù)源,其最主要的功能是全文檢索Office文件、音頻、視頻、郵件、圖片等非結(jié)構(gòu)化數(shù)據(jù),并可以嵌入到OA系統(tǒng)或ERP等系統(tǒng)中,提供搜索服務(wù)。 整合原有信息系統(tǒng)是企業(yè)搜索的另一個(gè)技術(shù)難題,智能網(wǎng)關(guān)在這里就可以派上用場(chǎng)了。智能網(wǎng)關(guān)就如同一組接通各個(gè)系統(tǒng)數(shù)據(jù)庫(kù)的“橋”,利用這一組“橋”,企業(yè)搜索平臺(tái)可以直接訪問(wèn)數(shù)據(jù)庫(kù)、內(nèi)容管理、CRM、ERP、文件服務(wù)器、Web服務(wù)器以及各種應(yīng)用系統(tǒng)中的數(shù)據(jù)并加以提取。 不過(guò),僅具備了全文檢索和整合功能還不能稱為真正的企業(yè)搜索。黃浩指出:“在搜索框里輸入關(guān)鍵字,返回上千甚至上萬(wàn)個(gè)查詢結(jié)果,要使用者在其中分辨出有用的信息是一個(gè)繁重的工作。”企業(yè)搜索必須對(duì)查詢結(jié)果具有分析功能——信息歸類功能,它可以對(duì)各種信息進(jìn)行整理和歸類,既可以按照部門、地域、內(nèi)容來(lái)進(jìn)行人工分類,也可以通過(guò)語(yǔ)義聚類的方式對(duì)雜亂無(wú)章的數(shù)據(jù)進(jìn)行智能識(shí)別。“CEO、CIO、CFO以及其他職員希望看到的信息側(cè)重點(diǎn)不一樣,企業(yè)搜索技術(shù)可以按照不同的需求來(lái)進(jìn)行人工分類。在每個(gè)分類下,還可以利用語(yǔ)義聚類的智能識(shí)別功能讓計(jì)算機(jī)整理資料?!边@樣,人工分類的靈活性和機(jī)器識(shí)別的高效性都同時(shí)得到了使用。 目前,已經(jīng)有不少組織部署了企業(yè)搜索技術(shù)來(lái)解決信息資產(chǎn)的管理問(wèn)題。美國(guó)國(guó)務(wù)院就有一個(gè)這樣的搜索系統(tǒng),工作人員只要登錄系統(tǒng)就可以從2500多萬(wàn)份檔案中查找并檢索信息。這些檔案包括1973年以來(lái)美國(guó)國(guó)務(wù)院與其在世界各地的辦事機(jī)構(gòu)之間的來(lái)往電報(bào)和電子郵件。 中國(guó)新華通訊社也部署了一個(gè)多媒體數(shù)據(jù)庫(kù)。現(xiàn)在,每位新華社記者在采訪前或?qū)懜鍟r(shí),都有一個(gè)龐大的數(shù)據(jù)平臺(tái)做支撐,各種新聞背景、各地法規(guī)、人物、公報(bào)、最新事件、文獻(xiàn)資料、新華社及各類報(bào)刊發(fā)稿情況等都可以從這個(gè)平臺(tái)中查詢到,記者既可以從分類項(xiàng)目中找到,也可以通過(guò)關(guān)鍵詞全文檢索獲得,而且這些資料隨時(shí)處于變動(dòng)更新?tīng)顟B(tài)。 技術(shù)背后 根據(jù)英國(guó)咨詢顧問(wèn)公司Ovum的預(yù)測(cè),2006年全球企業(yè)搜索平臺(tái)的市場(chǎng)將達(dá)10億美元。雖然IT廠商為企業(yè)搜索應(yīng)用描繪了一幅美好的藍(lán)圖,然而實(shí)現(xiàn)企業(yè)級(jí)搜索應(yīng)用并不是一件輕而易舉的事,不愿共享信息是實(shí)施企業(yè)搜索系統(tǒng)的組織遇到的最大阻力。一位電子商務(wù)網(wǎng)站技術(shù)總監(jiān)對(duì)企業(yè)搜索技術(shù)的憂慮便來(lái)自這個(gè)阻力——“我們的市場(chǎng)人員都有自己的客戶群,那是他們個(gè)人長(zhǎng)期積累的資源,怎么可能輕易拿出來(lái)和同事們共享呢?” 一家全球移動(dòng)通信網(wǎng)絡(luò)供應(yīng)商在華研究機(jī)構(gòu)的工程師同時(shí)碰上了同事“獨(dú)享”技術(shù)帶來(lái)的困擾:有時(shí),中國(guó)工程師遇上解決不了的問(wèn)題時(shí),不得不請(qǐng)美國(guó)的工程師來(lái)現(xiàn)場(chǎng)指導(dǎo),但是問(wèn)題解決了,知識(shí)卻沒(méi)有共享。“不少工程師都有一個(gè)筆記本,上面記滿了‘獨(dú)門秘籍’,不愿意公開(kāi),如果別的工程師遇上了同樣的問(wèn)題,只有再讓美國(guó)工程師來(lái)現(xiàn)場(chǎng)?!?/p> 另外,安全性也是企業(yè)搜索技術(shù)要面對(duì)的一個(gè)很重要的挑戰(zhàn)。和互聯(lián)網(wǎng)搜索相比,企業(yè)內(nèi)部的數(shù)據(jù)資源一般都必須有相應(yīng)的授權(quán)才可以訪問(wèn),如果任何人都可以無(wú)限制地訪問(wèn)所有的信息資源,“那就亂套了”?!捌鋵?shí),安全性在技術(shù)上是可以保證的,企業(yè)只要有嚴(yán)格的信息授權(quán)就可以解決安全問(wèn)題?!秉S浩說(shuō)。 對(duì)企業(yè)的信息資產(chǎn)而言,企業(yè)搜索技術(shù)的確非常有效,但如果沒(méi)有良好的信息管理機(jī)制和信息共享文化,再?gòu)?qiáng)有力的技術(shù)也解決不了信息資產(chǎn)“閑置”的現(xiàn)狀,想探囊取物般輕松查找數(shù)據(jù)的夢(mèng)想也無(wú)法實(shí)現(xiàn)。 |
|