文/陳根 比爾·蓋茨曾說(shuō):“語(yǔ)言理解是人工智能皇冠上的明珠”。 其中,自然語(yǔ)言處理(NaturalLan-guageProcessing,NLP)是將人類交流溝通所用的語(yǔ)言經(jīng)過(guò)處理轉(zhuǎn)化為機(jī)器所能理解的機(jī)器語(yǔ)言,是一種研究語(yǔ)言能力的模型和算法框架,是語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科,是實(shí)現(xiàn)人機(jī)間的信息交流,是人工智能、計(jì)算機(jī)科學(xué)和語(yǔ)言學(xué)所共同關(guān)注的重要方向。 顯然,誰(shuí)掌握了更高級(jí)的自然語(yǔ)言處理技術(shù),誰(shuí)在自然語(yǔ)言處理的技術(shù)研發(fā)中取得了實(shí)質(zhì)突破,誰(shuí)就將在日益激烈的人工智能軍備競(jìng)賽中占得先機(jī)。一直以來(lái),讓計(jì)算機(jī)對(duì)自然語(yǔ)言的理解和處理能力接近人類,也是科學(xué)家們的終極愿景。 近日,來(lái)自IBM的AI研究團(tuán)隊(duì)就報(bào)告了Project Debater(“辯手項(xiàng)目”)的最新進(jìn)展,研究團(tuán)隊(duì)表示,該系統(tǒng)已可以與人類專家選手進(jìn)行體面且有意義的現(xiàn)場(chǎng)辯論,它能通過(guò)儲(chǔ)存了4億篇新聞報(bào)道和維基百科頁(yè)面的知識(shí)庫(kù),自行組織開(kāi)場(chǎng)白和反駁論點(diǎn)。 從演示成果來(lái)看,研究人員定義了一種辯論形式,它是學(xué)術(shù)競(jìng)爭(zhēng)性辯論中常用的辯論風(fēng)格簡(jiǎn)化版,即一旦被稱為 “辯論動(dòng)議” 的主題宣布,Project Debater 和人類選手都各有 15 分鐘的準(zhǔn)備時(shí)間。準(zhǔn)備就緒后,雙方就開(kāi)始輪流發(fā)言。 研究人員選擇了 78 個(gè)動(dòng)議來(lái)評(píng)估當(dāng)一個(gè)新的辯題出現(xiàn)時(shí),各種 AI 系統(tǒng)以及人類專家的表現(xiàn),每一次演講都由 15 位評(píng)審員進(jìn)行了回顧評(píng)分,以判斷此演講是否能作為支持辯題立場(chǎng)的良好開(kāi)場(chǎng)白,其中 5 分表示高度一致。評(píng)估結(jié)果顯示,Project Debate明顯優(yōu)于其他系統(tǒng),并且非常接近人類專家的得分。 在開(kāi)場(chǎng)白之后的評(píng)估中,研究人員使用了相同的 78 個(gè)動(dòng)議,再次要求被選中的一組人群想象自己是辯論聽(tīng)眾,在這種情況下,讓他們閱讀三篇辯論演講,但不告知演講的來(lái)歷。 結(jié)果顯示,所有辯題 Project Debater 的平均得分均高于中立 3 分,78 個(gè)動(dòng)議中有 50 次表現(xiàn)的平均得分≥4 分,這表明,在至少 64% 的動(dòng)議中,群眾評(píng)論員認(rèn)為 Project Debater 在辯論中表現(xiàn) “良好”。不過(guò),雖然Project Debater 得分顯著高于所有對(duì)比基線和對(duì)照組的得分,但距離人類專家的得分還有明顯差距。 當(dāng)然,作為一門包含著計(jì)算機(jī)科學(xué)、人工智能以及語(yǔ)言學(xué)的交叉學(xué)科,自然語(yǔ)言處理的發(fā)展也經(jīng)歷了曲折中發(fā)展的過(guò)程。但現(xiàn)在,在圖像識(shí)別和語(yǔ)音識(shí)別領(lǐng)域的成果激勵(lì)下,人工智能理解人類語(yǔ)言已經(jīng)展現(xiàn)出了過(guò)去不曾想像的可能。 |
|