最新一期的《自然》封面展示了一排歪歪扭扭的英文字母。這些字母的來(lái)歷相當(dāng)特殊——一位脖子以下癱瘓的患者借助最新的腦機(jī)接口技術(shù),寫下了這些文字。只需在腦中想象寫下字母的過(guò)程,神經(jīng)算法就能復(fù)現(xiàn)自己所想的文字,并且最后轉(zhuǎn)化成打字的速度可能比你還快。 撰文丨楊心舟 “腦機(jī)接口”的概念在最近幾年逐漸走進(jìn)了公眾的視野,一部分要?dú)w功于馬斯克為自己旗下的腦機(jī)接口公司Neuralink所作的宣傳。他們展示的那些畫面令很多觀眾都印象深刻,例如去年他在發(fā)布會(huì)上用三只小豬展示了新一代腦機(jī)接口技術(shù),研究者只需將一枚尺寸極小的芯片植入大腦,就能實(shí)時(shí)記錄豬的腦電信號(hào)。當(dāng)飼養(yǎng)員給小豬喂食,它的一部分神經(jīng)元就能發(fā)出腦電信號(hào),預(yù)示著這是小豬大腦響應(yīng)喂食的腦電模式。 而通過(guò)連接計(jì)算機(jī)和算法分析,研究者就能根據(jù)腦電模式來(lái)推測(cè)使用對(duì)象的意圖。這也是腦機(jī)接口的主力發(fā)展方向:為那些肢體無(wú)法完成意圖的人,實(shí)現(xiàn)腦中所想。當(dāng)然,馬斯克有時(shí)在宣傳時(shí)也會(huì)用力過(guò)度,提出一些類似心靈感應(yīng)、永生等比較玄幻的概念。這一點(diǎn)在腦機(jī)接口創(chuàng)始人之一米格爾·尼可拉斯(Miguel Nicolelis)看來(lái),就屬于不靠譜的地方了。 在他眼中,腦機(jī)接口創(chuàng)立的目的是幫助那些腦部受到損傷、用常規(guī)方法已經(jīng)無(wú)法治愈的人們,實(shí)現(xiàn)一定程度的功能。他曾給下半身癱瘓的巴西少年設(shè)計(jì)了一款以腦機(jī)接口為基礎(chǔ)的機(jī)械外骨骼,經(jīng)過(guò)持久的訓(xùn)練,腦機(jī)接口便能根據(jù)少年的腦電信號(hào)預(yù)測(cè)他的運(yùn)動(dòng)意圖,并推動(dòng)外骨骼運(yùn)動(dòng),這也讓他在巴西世界杯開幕式上踢動(dòng)了足球。 《環(huán)球科學(xué)》也曾對(duì)該類型的腦機(jī)接口有過(guò)多次報(bào)道,更多閱讀: 重建聯(lián)系 除了幫助人行走,腦機(jī)接口還能幫到一些連最基本的語(yǔ)言表達(dá)都存在問(wèn)題的病人。許多閉鎖綜合征或漸凍癥患者幾乎所有的自主控制肌肉都已經(jīng)癱瘓,他們因此無(wú)法發(fā)聲,有的僅能靠眼球移動(dòng)來(lái)交流。更殘酷的是,他們的意識(shí)沒有問(wèn)題,只是被困在了一副不能移動(dòng)、不能發(fā)聲的軀殼里。 如何讓他們重建與世界的聯(lián)系?目前有一些眼球追蹤的設(shè)備,在屏幕提供一個(gè)鍵盤的條件下,通過(guò)計(jì)算機(jī)識(shí)別瞳孔注視的位置,就能確定使用者想選取的字符。這種技術(shù)能讓癱瘓患者每分鐘輸入45個(gè)字符,而正常人打字的字符數(shù)在每分鐘115個(gè)左右。不過(guò),這種技術(shù)對(duì)于眼球無(wú)法移動(dòng)的人就派不上用場(chǎng)了。 而更普適的技術(shù)則非腦機(jī)接口莫屬了。最早在2017年,霍華德·休斯醫(yī)學(xué)研究所和斯坦福大學(xué)的聯(lián)合團(tuán)隊(duì)就招募了3名四肢癱瘓的志愿者,并在他們的運(yùn)動(dòng)皮層上植入了腦機(jī)接口。這些志愿者需要想象使用手臂或手移動(dòng)光標(biāo),利用計(jì)算機(jī)記錄此刻的腦電信號(hào)并進(jìn)行分析處理。這樣,他們就能自如地在屏幕上移動(dòng)光標(biāo),選取想要的字符。在當(dāng)時(shí),志愿者的測(cè)試結(jié)果大約是每分鐘打40個(gè)字符。 如果說(shuō)當(dāng)年的技術(shù)讓他們實(shí)現(xiàn)了打字,那么時(shí)隔4年,這一技術(shù)已經(jīng)進(jìn)步到了讓癱瘓患者寫字的水平。《自然》今日發(fā)表的論文就展示了一種全新的腦機(jī)接口,癱瘓患者僅憑意念就能在屏幕上書寫字符。 這次參與實(shí)驗(yàn)展示的是4年前那項(xiàng)研究的志愿者之一,被稱作T5,他因?yàn)榧顾枋軅i部以下都已經(jīng)癱瘓。在此次新研究中,他大腦控制右手和右臂運(yùn)動(dòng)的腦區(qū)被植入了兩片微小的電極,大小和阿司匹林相當(dāng)。 實(shí)驗(yàn)中使用的電極大小。圖片來(lái)源:BrainGate.org T5要做的就是在大腦中想象自己在寫字,此時(shí)電極會(huì)接收神經(jīng)元發(fā)出的信號(hào),并傳輸?shù)接?jì)算機(jī)中。研究者首先需要驗(yàn)證的就是,這么多年沒有握筆寫字,大腦的神經(jīng)活動(dòng)信號(hào)是否還能表征寫字過(guò)程。 我們知道,英文的每個(gè)字符形狀不一,書寫的方式和速度也因此具有差異。于是作者比對(duì)了虛擬筆尖的運(yùn)行速度與神經(jīng)活性,并引入了非線性降維方法(t-SNE)對(duì)每個(gè)試驗(yàn)的神經(jīng)活動(dòng)進(jìn)行二維可視化。這種方法能清晰地展示每一個(gè)字符的神經(jīng)活動(dòng)簇,以及運(yùn)動(dòng)編碼過(guò)程。根據(jù)預(yù)測(cè),研究者根據(jù)神經(jīng)活動(dòng)判斷字符的準(zhǔn)確率有 94.1%。 這一結(jié)果說(shuō)明,大腦沒有忘記寫字,它們可以正確地表征字符信息。 下一步,需要的就是讓算法破解這些信息,還原出真實(shí)場(chǎng)景下T5所寫的不同字符拼湊的長(zhǎng)句子。研究者引入了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)來(lái)完成這一任務(wù),RNN需要做的就是將神經(jīng)活動(dòng)轉(zhuǎn)化成描述字符的概率。 T5需要完成的字符包括26個(gè)小寫字母和逗號(hào)、問(wèn)號(hào)等符號(hào)。每當(dāng)T5嘗試自己寫出一個(gè)句子時(shí),計(jì)算機(jī)就會(huì)實(shí)時(shí)收集神經(jīng)活動(dòng)數(shù)據(jù)并用來(lái)訓(xùn)練RNN。T5花了大概5天時(shí)間在頭腦中想象書寫,每天需要臨摹系統(tǒng)給出的7~10個(gè)句子,最終形成了7.6個(gè)小時(shí),3.1萬(wàn)多個(gè)字符的數(shù)據(jù)集。 在這一過(guò)程中,RNN將逐漸“學(xué)會(huì)”區(qū)分不同字母對(duì)應(yīng)的腦電信號(hào)。除了這些數(shù)據(jù)訓(xùn)練,RNN還要額外接受自己從未接觸過(guò)的句子,以此來(lái)評(píng)估它的表現(xiàn)。 和正常人一樣 經(jīng)過(guò)這些訓(xùn)練,RNN的表現(xiàn)究竟如何呢?在實(shí)際測(cè)試中,T5會(huì)根據(jù)屏幕提示中重寫每個(gè)句子,算法會(huì)將自己破解的字符同步地展示在屏幕上。通過(guò)這種方式,T5每分鐘能大約打出18個(gè)詞,也就是90個(gè)字符。而4名志愿者玩手機(jī)打字的速度在每分鐘115個(gè)字符左右。即使是自由回答問(wèn)題,T5的輸入也能達(dá)到每分鐘15個(gè)詞(約73.8個(gè)字符)。這比4年的技術(shù)翻了1倍。 |
|
來(lái)自: wenxuefeng360 > 《環(huán)球科學(xué)》