隨著人工智能的崛起,一個叫ImageNET視覺識別的挑戰(zhàn)賽(ILSVRC)在近幾年里備受矚目。 這個挑戰(zhàn)賽要求參賽團隊使用ImageNet——全球最大的圖像識別數(shù)據(jù)庫,測試他們系統(tǒng)的運行情況。
ILSVRC 而這個計算機視覺領(lǐng)域的“奧賽”,也一直吸引著該領(lǐng)域的頂級研究機構(gòu)(包括微軟、谷歌、百度等)為之爭得頭破血流。 在2015年,百度還涉嫌在測試過程中作弊,被ImageNet挑戰(zhàn)賽提出禁賽一年。
而提起ImageNet,就不得不說它的背后的締造者——李飛飛。 她不但是這場挑戰(zhàn)賽背后的“美女考官”,還是ImageNet這個全球最大圖像識別數(shù)據(jù)庫的主創(chuàng)者。
李飛飛 李飛飛,這三個字幾乎是AI(人工智能)界無人不曉的名字。 她不僅是斯坦福AI實驗室主任,還是斯坦福大學的終身教授。 在頂級期刊上,她的高質(zhì)量文章就有100篇以上,引用量更是高達33215-44773次。 2015年入選“世界百大思想者”,2016年她還被美國評為“年度杰出移民”之一,以前獲此殊榮的還有愛因斯坦、基辛格等
前一陣子,谷歌宣布李飛飛成為谷歌云計算首席科學家,也在業(yè)界更是引起了不少轟動。 此前,李飛飛一直都專注于實驗室,與業(yè)界聯(lián)系不深。 她現(xiàn)在走出實驗室的舉動,讓許多人都對人工智能的發(fā)展了充滿信心。
然而,這位站在金字塔頂端的女科學家背后,卻有著一段鮮為人知的勵志人生。 早年的她竟然還有過清潔工、中餐館收銀員、幫人遛狗、開干洗店等工作經(jīng)驗。
... 1976年出生的李飛飛在四川長大。 16歲時,她便隨父母遠渡重洋來到充滿希望的美國,落戶在新澤西洲的Parsippany小鎮(zhèn)。 但李飛飛并不是富二代,父母都是清貧的知識分子。 初到美國,對英語一竅不通更是全家最大的阻力。 光是擇校問題,她就奔波了好幾個月,費了九牛二虎之力才得以在當?shù)匾凰琶杏蔚膶W校上學。 李飛飛一家
那時,爸爸去幫別人修相機,媽媽就去當收銀員。 但這類工作的收入,完全不足維持生活和支付她的學費。 所以到美國后的很長一段時間,李飛飛生活的關(guān)鍵詞就是“謀生”二字。 在唐人街附近的很多零工,包括收銀員、清潔工、服務生等她都做過。
高中時期的李飛飛 然而在打工之余,李飛飛卻還要應對兩年后的美國大學入學。 作為新一代移民學子,她不但要迅速掌握英語,還要拿出一份極其優(yōu)秀的成績單,才能考上好的大學。 那時候,打工和學習幾乎占滿了她的全部生活。 最辛苦時,一天只睡不到4個小時。
1995年,Parsippany鎮(zhèn)上關(guān)于李飛飛的報道 只要你想,全世界都會為你讓路。 憑著這股毅力,這位華裔少女收到了普林斯頓大學計算機系的offer,還是提供全額獎學金的那種。 當時這個消息在小鎮(zhèn)上算是個大新聞,還有報紙專門刊登了她奮斗的故事,稱她的“美國夢”成真啦!
李飛飛在普林斯頓大學 在普林斯頓大學她接觸到了大量優(yōu)秀的人才,這對她而言更是莫大的鼓舞。 然而,在大學她依然不改拼命三郎的性格。 看著父母還是做著入不敷出的零工,李飛飛決意借錢買下了一家洗衣店,交給父母經(jīng)營。 從此,她也就過上了周一到周五在普林斯頓拼命學習,周六日則趕回家中,繼續(xù)當洗衣妹的日子。
她不但獨立,渾身上下更是散發(fā)著對生活的熱愛。 “我愛普林斯頓,也非常愛我的洗衣店” “我覺得辛苦不算什么,因為我父母也同樣在努力工作。我們一家人只是為了好好地生活?!?/strong> 1999年,李飛飛從普林斯頓大學畢業(yè)。 然而,那時的她卻拒絕了多家金融公司的工作邀請。 在父母的支持下,開始追隨自己的內(nèi)心,毅然踏上一年的西藏之路研究藏醫(yī)。
李飛飛在西藏的日子 完成了這一夢想后,她再次拒絕了華爾街的高薪工作,開始了下一個夢想——讀博士。 然而,在讀博期間,她的母親卻不幸得了癌癥,之后又中風。 生活的重擔幾乎壓得她喘不過氣來。 “人生最難的不就是,如何發(fā)揮自己最大的潛能,同時兼顧自己所身負的責任,然后又必須忠于自己的內(nèi)心嗎?” 而李飛飛用自己的行動告訴我們,她做到了! ... 在博士畢業(yè)后,她進入了斯坦福大學AI實驗室,選擇了當時不被看好的研究方向——計算機視覺識別領(lǐng)域。 通俗的說,就是拿一張圖片,讓計算機認出來這張圖片所包含的內(nèi)容。 比如,你告訴計算機,“貓”是由圓臉、胖身子、兩只尖耳朵和一條長尾巴組成的東西。
然而在現(xiàn)實生活中,貓就有成千上萬個品種,就算是同一只貓,也能擺出上百種姿勢。 如果遇到一些骨骼清奇的貓,換個姿勢計算機估計就懵逼了。 那個時候,圖像識別已經(jīng)走過了20個年頭。 但全世界能夠識別的物體也不過4到20種。 然而大千世界這么多的物品,如果計算機只能識別豹子、飛機、人臉和汽車這幾樣是遠遠不夠的。 面對圖像識別如此匱乏的“詞匯量”,李飛飛產(chǎn)生了一個瘋狂的想法。 她拿出一本字典,決定要讓圖像識別涵蓋到字典里的每一個詞條。 李飛飛與丈夫 當她把這個想法告訴其他教授時,大家都紛紛勸她換個方向,因為研究這個是“拿不到終生教授”的。 她還找了好幾個教授想要尋求合作,也全然被拒絕了,都認為“看不到結(jié)果”,“不值得”。 但是李飛飛卻沒有想那么多,先別管“終生教授”的事,首先要做好自己認為重要的事情。
李飛飛在斯坦福大學授課 剛開始時,李飛飛將很大部分的精力都放在算法的優(yōu)化上,然而這并沒有帶來太大的突破。 突然有一天,一個非常簡單但卻非常有沖擊力的想法,使李飛飛找準了方法。 她想,沒人教嬰兒怎么“看”,也沒有人告訴他們“貓”的特征。 但是他們卻能夠很快的知道這就是貓,無論什么品種或什么形態(tài)。
因為人類的眼睛就好像一個生物照相機,每200毫秒就能獲取一幅圖片。 一個三歲的孩子就已經(jīng)見過上億副圖片了,能分辨圖片當然不在話下。 所以要讓計算機學會“識圖”,關(guān)鍵是在于訓練量——讓計算機看更多的圖片。
從2007起,李飛飛與團隊便從互聯(lián)網(wǎng)上下載了近10億幅圖片。 在這之后便是對這些圖片進行分類、打上標簽,為計算機提供學習用的“題庫”,而這個“題庫”就是現(xiàn)在的ImageNet。
然而,當他們給圖片打標簽打了幾個月后,研究經(jīng)費很快用完了。 而且按照這個速度,至少得十幾年才能完成目標,因為圖片實在是太多了。 但李飛飛卻從來沒想過放棄,在最困難時,她甚至還想重操舊業(yè)開洗衣店,為研究籌集經(jīng)費呢。
正當大家一籌莫展時,他們遇到了美國最大電商平臺——亞馬遜。 當然不是在上面買書,而是和亞馬遜的眾包平臺合作。 通過眾包平臺,李飛飛在網(wǎng)上雇傭到了來自167個國家的5萬人,為這十億張備選圖片篩選、排序、打標簽。 當時的李飛飛,一度是這個眾包平臺上最大雇主。 到2009年,ImageNet數(shù)據(jù)庫就包含了1500萬張照片,涵蓋了2000多種物品。 回想在2006年那4到20種物品,ImageNet數(shù)據(jù)庫無論在質(zhì)量還是數(shù)量上,都是空前的。
然而,最重要的是,ImageNet這個如此龐大的圖片數(shù)據(jù)庫竟然是免費的。 這就意味著,全球所有致力于計算機視覺識別的團隊,都能從這個題庫里面拿“試題”,來測試自家算法的準確率。
ImageNet挑戰(zhàn)賽的機器錯誤率, 七年來從28%降到了3.6% ,比人眼識別的錯誤率5.1%還要低。 為了激發(fā)各界對計算機視覺研究的熱情,李飛飛每年都會舉行一場ImageNet視覺識別挑戰(zhàn)賽。 在這場考試中,無論挑戰(zhàn)者的輸與贏都代表著一次新的發(fā)展。 如果考生能輕易答對“試題”,這就說明了視覺識別技術(shù)的更上一層樓。 但如果“試題”難倒了考生,也不用擔心,這也意味著算法的突破口就在這。
不過,對于現(xiàn)在一度“過熱”的人工智能,李飛飛也一直在強調(diào)“人工智能現(xiàn)在越火,越需要有冷靜做研究的人” 她說“我做研究的心得就是,眼睛看到的前方應該是比較空曠的。如果你眼睛看到的前方是熱鬧的,那這個方向就不是最好的研究方向。而空曠的地方一般都不是熱點,因此你必須找準自己的焦點” 李飛飛首度亮相谷歌云大會 關(guān)于未來的AI開發(fā),李飛飛認為不但要在學術(shù)上還要結(jié)合工業(yè)上的開發(fā)。 因為AI的最終目的就是服務于人類,這也是李飛飛加入谷歌的原因。 為的就是拉近AI與人類日常生活的距離,使AI'更接地氣'。
谷歌街景搜集的車輛數(shù)據(jù) 在今年2月末,李飛飛又發(fā)表了最新的論文:《用深度學習和谷歌街景估算美國人口結(jié)構(gòu)》。 文章主要論述了如何將谷歌街景搜集來的機動車輛數(shù)據(jù),結(jié)合機器學習算法。 從而估算出本地區(qū)人口的特征和組成,甚至這一地區(qū)居民的政治傾向。 在李飛飛看來,目前的圖像識別和人工智能,還相當于一個牙牙學語的3歲孩童。 而3歲到10歲的過程,才是人工智能的難點和關(guān)鍵。 就算李飛飛說圖像識別的路還有很遠,但也完全不妨礙我們暢想未來。 去超市買東西,直接“刷臉”付款; 在追擊違法分子上,可能罪犯剛一上街就已經(jīng)被一雙神秘的眼睛鎖定; 完全不用看紅綠燈的“未來式過馬路” 在未來交通上,人們不用自己抓方向盤,也有“老司機”帶你飛; 在醫(yī)療上,醫(yī)生和護士會多了一雙永遠不用休息的眼睛,幫忙診斷和照顧病人; 在TED演講的結(jié)尾,李飛飛表示: 她現(xiàn)在所有的追求,就是賦予計算機視覺智能, 并為Leo(他的兒子)和這個世界, 創(chuàng)造出更美好的未來。 這個集才華與美貌于一身的女子,能把人類帶到哪個未知領(lǐng)域,我們也翹首以待。 _____________ |
|