一個(gè)人可以多久不睡? 世界紀(jì)錄是11天。 然而,當(dāng)Randy Gardner在1965年創(chuàng)下這一紀(jì)錄時(shí),他可能在此期間雖然是醒著的,但他基本上已經(jīng)處于“認(rèn)知功能障礙”狀態(tài)。 如果Randy Gardner不睡眠超過兩周,他可能會(huì)死亡。 有些動(dòng)物似乎一直清醒。 鯨魚和海豚(即鯨類動(dòng)物)需要保持清醒,因?yàn)樗鼈冃枰ㄆ诘剿婧粑鯕狻?鯨類只有一半的大腦在任何時(shí)候都能入睡,從而保持清醒。 睡眠的認(rèn)知目的是一個(gè)開放的問題。 然而,最近科學(xué)家們對(duì)睡眠的兩個(gè)重要階段的目的有了一個(gè)新的猜想(“睡眠中的記憶重現(xiàn)如何促進(jìn)創(chuàng)造性解決問題”)。 根據(jù)研究,大腦經(jīng)歷了90分鐘的REM和Non-REM睡眠周期。 非REM睡眠涉及獲取的記憶的順序重放。 相比之下,快速眼動(dòng)睡眠涉及更多隨機(jī)關(guān)聯(lián)游戲,涉及不同的記憶。 在深度學(xué)習(xí)中,這分別類似于優(yōu)化和探索的搜索算法。 也就是說,我們?cè)诜强焖傺蹌?dòng)睡眠期間強(qiáng)化了我們的記憶,并且我們?cè)诳焖傺蹌?dòng)睡眠期間想象新的關(guān)聯(lián)。 當(dāng)我們睡覺時(shí),我們的大腦在優(yōu)化和探索之間交替。 實(shí)際上,我們?cè)谒X時(shí)進(jìn)行學(xué)習(xí)。 巧合的是,有人建議,少于45分鐘的小睡會(huì)增強(qiáng)“創(chuàng)造性思維”。這些小睡可以讓REM睡眠起作用,并避免慢波睡眠,從而導(dǎo)致頭昏眼花和迷失方向。黑客在午睡前喝一杯咖啡,以便咖啡因在45分鐘的時(shí)間內(nèi)起作用。 這種在我們睡眠時(shí)進(jìn)行學(xué)習(xí)的觀點(diǎn)對(duì)許多人來說可能是一個(gè)驚喜。 通過睡眠學(xué)習(xí),這是許多受過音樂訓(xùn)練的人的共同經(jīng)歷。 某一個(gè)技巧在一天的訓(xùn)練中沒有改善,但第二天卻突然得到了改善。 在一項(xiàng)西北大學(xué)的研究中(“在睡眠中學(xué)習(xí)某首曲子”),在慢波睡眠期間播放了一首音樂曲調(diào),表現(xiàn)出對(duì)曲調(diào)的更好記憶。 在德國(guó)的一項(xiàng)研究中(“在睡眠中通過口頭提示促進(jìn)詞匯學(xué)習(xí)”),受試者在非REM睡眠期間暴露時(shí)會(huì)改善德荷語翻譯。 這種“睡眠學(xué)習(xí)”可能是解決現(xiàn)有深度學(xué)習(xí)架構(gòu)相對(duì)較差泛化能力的關(guān)鍵思路。 David Ha和Jurgen Schmidhuber最近發(fā)表了一篇名為“世界模型”的論文,他們描述了一種通過前期獲得的記憶進(jìn)行“夢(mèng)想”或“幻覺”來學(xué)習(xí)的系統(tǒng)。 在該論文中,作者描述了學(xué)習(xí)一個(gè)世界的緊湊表示(通過一個(gè)自動(dòng)編碼器),然后重建這個(gè)壓縮環(huán)境,以學(xué)習(xí)改進(jìn)驅(qū)動(dòng)未來行為所需的策略功能。論文的一個(gè)缺點(diǎn)是從先前獲得的觀察的粗略近似中學(xué)習(xí)行為的有效性。 由于昂貴的采樣成本,強(qiáng)化學(xué)習(xí)難以擴(kuò)展。 換句話說,學(xué)習(xí)代理必須多次與世界(即環(huán)境)進(jìn)行交互,才能獲得適當(dāng)?shù)膹?qiáng)化來學(xué)習(xí)。 然而,如果一個(gè)代理人能夠創(chuàng)造一個(gè)“心理模型”或世界的“模擬”,那么它應(yīng)該能夠以更具成本效益的方式進(jìn)行這種抽樣。 要實(shí)現(xiàn)這個(gè)目標(biāo),需要一個(gè)重播記憶,一個(gè)好的生成模型或兩者兼?zhèn)洹?/span> 最終,人們可以將智能視為不僅僅是壓縮世界模型并進(jìn)行預(yù)測(cè)的能力。 但是,情報(bào)的度量應(yīng)該是“抽樣效率”,而不僅僅是壓縮。 僅依靠壓縮思想的問題在于,它在喬姆斯基層次結(jié)構(gòu)的更高層次上刷新了自動(dòng)化的要求。 也就是說,人們可以用有限自動(dòng)機(jī)來創(chuàng)建好的壓縮算法。 然而,智能可能需要一個(gè)圖靈機(jī),而作為世界良好表征的模型也需要圖靈機(jī)來構(gòu)造和解釋。 深度學(xué)習(xí)領(lǐng)域的最新發(fā)展現(xiàn)在開始探索內(nèi)部“想象世界”的創(chuàng)造。 這與我之前聲稱的體現(xiàn)式學(xué)習(xí)對(duì)人工智能至關(guān)重要。 然而,擴(kuò)大'感知'和'感知破壞'的唯一真正方法是在白天預(yù)留足夠的時(shí)間來睡覺。 傳統(tǒng)強(qiáng)化學(xué)習(xí)中的盲點(diǎn)是生物系統(tǒng)只有在清醒時(shí)才能學(xué)習(xí)的錯(cuò)誤假設(shè)。 來源:深度學(xué)習(xí)實(shí)驗(yàn)室 編輯:格格 |
|