原標(biāo)題:別輕易相信AI顛覆人類,做高考題它們還是輸給了中國考生
當(dāng) Alpha Go 又一次出招,三連勝中國圍棋天才柯潔之后,或許人們擔(dān)心的可能是,人工智能下一步又要在哪個(gè)領(lǐng)域干掉人類。 不過,在考試這件事兒上,經(jīng)過了大量“學(xué)習(xí)”的機(jī)器人,也還是沒能超越人類。 昨天是2017年全國高考第一天,在當(dāng)天的數(shù)學(xué)考試結(jié)束之后,一場人機(jī)高考大戰(zhàn)的對(duì)決上演了:在線教育公司“學(xué)霸君”自主研發(fā)的智能教育機(jī)器人“Aidam”首次公開亮相,通過現(xiàn)場直播的方式,與六名高考狀元同臺(tái)競技今年全國卷文科數(shù)學(xué)試題,完成包括客觀題和主觀題在內(nèi)的整張?jiān)嚲?,并按照評(píng)分標(biāo)準(zhǔn)得出最終成績。 不過,出人意料的是,這一次AI并沒有全面碾壓人類。閱卷結(jié)果顯示,三組高考狀元分別得分為146分,140分,119分,而Aidam為134分。 在考試結(jié)束后的對(duì)話環(huán)節(jié)中,小組得分為119的2015年新疆理科狀元多力崗表示,對(duì)Aidam的成績有點(diǎn)意外,稱“這個(gè)比賽結(jié)果和我們的預(yù)期還是有一定的差距,我們在比賽之后分析了一下,自己在一些細(xì)節(jié)或者在一些計(jì)算方面出了一些問題”。 當(dāng)然,從接近的分?jǐn)?shù)來看,這次Aidam雖然沒有完勝,然而其在10分鐘解題,獲得了134分的成績,也足夠超越一大批考生。 學(xué)霸君首席科學(xué)家陳銳鋒在考試比賽的現(xiàn)場解釋說,Aidam解題主要分為三大步驟: 第一,把試卷題目變成機(jī)器可以理解的形式語言。 第二,在用形式語言完整描述了一系列環(huán)境之后,計(jì)算機(jī)就會(huì)在知識(shí)網(wǎng)絡(luò)里啟動(dòng)搜索,確認(rèn)題目觸發(fā)了哪些知識(shí)點(diǎn),然后進(jìn)行一系列的推理,找出最佳解題路徑。 第三,把解題的過程和答案,從形式語言轉(zhuǎn)化為自然語言,完成解題過程。 而要實(shí)現(xiàn)這些,基礎(chǔ)是龐大的數(shù)據(jù)庫和人工智能領(lǐng)域多年技術(shù)的積累。從學(xué)霸君官方披露的數(shù)據(jù)來看,截至2017年5月,“學(xué)霸君”App已經(jīng)積累超過7000萬學(xué)生用戶,累計(jì)已經(jīng)解決問題100億道,答疑命中率為93%。 那么,為何PK高考狀元選擇的是數(shù)學(xué)學(xué)科? 學(xué)霸君創(chuàng)始人兼CEO張凱磊說,“一千個(gè)人有一千個(gè)哈姆雷特,但是世界上只有一個(gè)勾股定理”。 數(shù)學(xué)、物理等理科類科目是強(qiáng)邏輯鏈路的,考點(diǎn)基本穩(wěn)定,容易判定對(duì)錯(cuò)。同時(shí),數(shù)學(xué)試卷中包括簡單的選擇題,也有復(fù)雜的需要解題過程的大題,非常適合測試AI。
學(xué)霸君創(chuàng)始人兼 CEO 張凱磊,他本人以高考和物理滿分考入南開大學(xué)數(shù)學(xué)基地班 對(duì)于機(jī)器人來說,形式化語言是自動(dòng)解題的一大挑戰(zhàn),而目前數(shù)學(xué)學(xué)科最大的難點(diǎn)在于應(yīng)用題的解題上,期間涉及到一些社會(huì)常識(shí)和文字性表述等。 在業(yè)內(nèi)人士看來,讓機(jī)器人參加高考,并不是項(xiàng)目的根本目標(biāo),只是其對(duì)于人類智能的一種模擬、擴(kuò)展和延伸。目前來說,高考是一種衡量人的知識(shí)水平、理解能力、推理能力等相關(guān)智力水平的測試工具,其包含了對(duì)題目的理解、知識(shí)表現(xiàn)、邏輯推理等方式獲得知識(shí)。 在接受鈦媒體等多家媒體采訪時(shí),張凱磊表示,“實(shí)現(xiàn)個(gè)性化學(xué)習(xí),大幅度提升學(xué)習(xí)效率和成果是學(xué)霸君研發(fā)智能教育機(jī)器人的初衷”。 張凱磊告訴鈦媒體,中學(xué)期間大概有3529個(gè)考點(diǎn)、平均每個(gè)做3-4道題就夠了,寫1萬道題目可以做完,但目前絕大部分學(xué)生面對(duì)的練習(xí)題有3萬—4萬,其中3/4的題目是不需要寫的,75%的寶貴時(shí)間都被浪費(fèi)掉了。 學(xué)霸君構(gòu)建于深度神經(jīng)網(wǎng)絡(luò)的句法和語義分析器,在海量題庫中不斷強(qiáng)化和擴(kuò)充訓(xùn)練。在K12中,有大部分的數(shù)學(xué)應(yīng)用題,需要知識(shí)圖譜和常識(shí)才能解決,學(xué)霸君構(gòu)建的是一個(gè)真實(shí)題目海洋的模擬器,逐步提升其對(duì)于真實(shí)世界的接近程度。 基于人工智能的專家系統(tǒng)成就了精準(zhǔn)推理。學(xué)霸君推進(jìn)圖像識(shí)別、自然語言理解、深度學(xué)習(xí)等人工智能領(lǐng)域的研究,并整合成為智能教育機(jī)器人。其在現(xiàn)有教育環(huán)境下,使機(jī)器判卷、個(gè)性化指導(dǎo)、個(gè)性化作業(yè)、教案改進(jìn)等變成可能。 盡管如此,陳銳鋒認(rèn)為,即便是刷題,AI也并不能代替老師。因?yàn)?,任何時(shí)候機(jī)器人都沒有辦法代替老師講解。比如說,這道題為什么對(duì),為什么錯(cuò),解題思路為什么這么想不對(duì),為什么那樣想又是對(duì)的。但是,AI可以告訴老師說,這個(gè)學(xué)生的哪些知識(shí)點(diǎn)有問題,應(yīng)該花更多時(shí)間在哪些知識(shí)點(diǎn)訓(xùn)練,而不是浪費(fèi)在其他已經(jīng)掌握的知識(shí)上。 值得注意的是,無論是作業(yè)幫、猿輔導(dǎo)還是阿凡提,目前市面上大部分工具屬性偏強(qiáng)的題庫類在線教育產(chǎn)品,一直都沒找到盈利爆發(fā)點(diǎn)。張凱磊也向鈦媒體透露,目前學(xué)霸君暫未實(shí)現(xiàn)盈利,但是已經(jīng)開始實(shí)現(xiàn)了規(guī)?;杖搿?/p> 據(jù)鈦媒體記者了解,除了學(xué)霸君之外,“國家隊(duì)” 也將在2019年和2020年參加高考。 由國家863計(jì)劃 “超腦計(jì)劃”牽頭研制的“高考機(jī)器人”, 是 “基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”項(xiàng)目的重要研究目標(biāo)之一。該“類人智能”項(xiàng)目于2015年7月21日由國家科技部正式啟動(dòng),成為我國在人工智能技術(shù)領(lǐng)域新一輪創(chuàng)新的重要起點(diǎn)。(本文首發(fā)鈦媒體,記者/李程程) 責(zé)任編輯:李年茜 UN899 |
|