圍繞在我們身邊的信息數(shù)量龐大、類型復雜,每個人所處的圈層不同,接受到的信息也有很大差異,看似好像很難劃分。作者將我們的感官系統(tǒng)進行劃分形成“感官象限”,通過分析當下互聯(lián)網(wǎng)產(chǎn)品做出對人類信息接收的5個判斷。深度好文,值得和大家一起分享。 作者 | 徐邦睿 來源 | 以夢為馬 編輯 | 李姝婧 正文共6967字 25圖 | 預計閱讀時間18分鐘 圍繞在我們身邊的信息,數(shù)量龐大、類型復雜,每個人所處的圈層不同,接受到的信息也有很大差異,看似好像很難劃分。但如果從另一個角度來看,我們大部分人的身體結構是相同的,于是我們可以按照接收信息的感覺器官來劃分,就會比較明確。 我們的眼、耳、鼻、口、皮膚為我們提供了:視覺、聽覺、嗅覺、味覺、觸覺。 視覺讓我們能夠看見圖像和文字,我們用聽覺接收語言和自然界的聲音,嗅覺和味覺提供了很多奇妙體驗的可能,觸覺是我們出生后第一次感知世界的方式。從生物學上來講,這些感官很多動物都有,人類并沒有在這方面顯得多么出眾;但人類卻創(chuàng)造了其他任何一種動物都無法創(chuàng)造的輝煌成就,并成為“地球的主人”。這主要歸功于人類所特有的一種杰出能力——保存并傳遞信息的能力。
人類文明發(fā)展萬年以來,科學技術的進步令信息保存和傳遞的方式發(fā)生了天翻地覆的變化,然而我們接收信息的方式只是效率的提高,而這一現(xiàn)象在數(shù)字化碎片的時代會加速傳染開來。 要想知道為什么只是效率的提高,就得先弄清楚從古至今,信息的保存和傳遞方式是如何變化的? 一、視頻是最易消費的媒介 現(xiàn)代人類的祖先“智人”進化出新語言是在大約距今7萬到3萬年前,這種新語言不同于其他動物通過不同喊叫的方式,傳達不同的信息。而是能通過發(fā)出的有限聲音,組合起來產(chǎn)生無限多的句子,各有不同的含義。于是,我們就能夠吸收、儲存和溝通驚人的信息量,并了解我們周遭的世界。 人類最早開始進行圖像類型的記錄,產(chǎn)生于舊石器時代的晚期,距今約3萬到1萬多年之間。記錄類型包括了洞窟壁畫、巖畫、雕刻、建筑等。而文字的出現(xiàn)要晚得多——文字幾乎與農(nóng)耕相伴而生,從最早的刻符、結繩和巖畫算起,人類文字的歷史不過5000多年。 從時間線的角度,我們很容易看出:語言的出現(xiàn)早于壁畫,早于文字。 人類從蠻荒步入文明,有三次偉大的跨越:第一次是語言,第二次是農(nóng)耕,第三次是文字。語言是人類的開始,農(nóng)耕是文明的開始,文字則是現(xiàn)代的開始。文字的出現(xiàn)雖然讓人類社會進入了一個新的紀元,但千百年來,很多時候文字只是少數(shù)人享有的權利,不論是從創(chuàng)造、學習、使用等各個角度來看,都是如此。也就是說:同樣的信息,我用語言、圖畫、文字三種形式傳達的時候,大部分人可以聽懂語言所表述的內(nèi)容,其次是圖畫,文字的效果最差。語言是人聲帶振動的結果,所以它本質上是一種聲音。 這樣,以上的三種形式就可以抽象為聲音、圖像和文字,我們初步推斷,在人類接收信息的容易程度上,聲音的效果最好,文字最次。即:聲音>圖像>文字 除了以上三種信息的傳遞方式,其實還有一種很重要的信息傳遞方式——視頻,只不過這種方式一直到近代才出現(xiàn)。 記錄文字和圖像的方式人類在遠古時期就學會了,并且持續(xù)探索更簡單的實現(xiàn)方式。 大規(guī)模的文字記錄方式,是因為雕版印刷術的出現(xiàn),于公元7世紀左右的隋唐時期。圖像的便捷記錄方式出現(xiàn)在1839年,法國的達蓋爾制成第一個臺實用的照相機。人類的科技發(fā)展,總是傾向于讓人變得越來越懶。出現(xiàn)的時間越晚的信息載體,才越易于我們感知和理解。聲音和影像的的記錄一直到第一次工業(yè)革命以后才出現(xiàn)。1877年愛迪生發(fā)明了留聲機,讓聲音的再現(xiàn)有了可能。1895年愛迪生和迪克森制作的“有聲活動電影機”,這項能夠記錄我們所處現(xiàn)實世界的發(fā)明,為后來視頻成為現(xiàn)存的覆蓋面最廣泛的媒介,奠定了基礎。 從遠古跨入現(xiàn)代,人類保存和傳遞信息的方式,已經(jīng)從呆板枯燥的文字,上升為能夠聽得見、看得到地重演現(xiàn)實世界情景的視頻,視頻成為了最容易能夠讓人看懂的媒介。 所以我們可以進一步確定我們的推斷,在人類接收信息的容易程度上,視頻的效果要優(yōu)于聲音,也就是視頻>聲音>圖像>文字。 對此,我們從另一個角度重新審視,會得到更有說服力的解釋。 文字是最早能夠記錄,但是消費門檻最高的媒介。想象文字的閱讀過程:首先我們得識字,知道一系列圖形符號和他們的組合所代表的意義;然后通過句子,我們要在大腦中映射出感覺和意向,有一些要圖像化處理后才能理解。再思考文字的寫作過程:我們要知道這些感覺和意義如何通過一系列的符號落到紙面。所以文字的過程是個壓縮和解壓的過程。這個行為相比于其他的內(nèi)容消費形式,門檻是比較高的。這也是文盲那么多的原因。 圖像是對視頻生活的抽象化反映,理解起來會有一點難度。比如有一些人是看不懂漫畫的。聲音比圖像更容易理解,因為畢竟沒有這么多復雜的千奇百怪的圖形,只有有限個聲音。 視頻所展示的世界和我們睜眼第一天看世界的就是相同的。而直播是現(xiàn)實生活最生動的克隆。而視頻最容易被接收、門檻最低的原因,還有另外一個原因:視頻調動了更多的感官。 二、如何用“感官象限”作判斷 我們把視頻、聲音、圖像、文字和人的感官結合起來,能夠發(fā)現(xiàn),圖像和文字是需要用眼睛來看的,耳朵可以聽到聲音。而視頻則需要同時調動聽覺和視覺這兩種感覺。 也就是說,同等信息量的時候,視頻需要調動兩種感官的特性,讓我們更易于去接收這些信息。而在同等時間的條件下,視頻能夠傳遞的信息量更多,信息密度更大,而人天然喜歡信息密度更大的東西。 從這個角度,我們再看互聯(lián)網(wǎng)世界里,和信息相關的產(chǎn)品,我們就能逐漸探索出資訊類、聽書類、視頻類產(chǎn)品他們之間的本質差異,以及用戶量一路飆升的短視頻,為什么會讓各巨頭公司產(chǎn)生恐慌。
通過互聯(lián)網(wǎng)傳播的信息,主要借助手機、電腦這樣的終端設備,這類設備主要傳遞的是視頻、聲音、圖像、文字信息,我們接收主要是通過視覺、聽覺和部分觸覺。 我們按感官系統(tǒng)進行劃分:
由于目前對觸覺的使用僅在提供反饋的層次,信息量遠不及其他形式,我們把它放在后面單獨來講。 那么,我們以聽覺系為X軸、視覺系為Y軸,建立二維直角坐標系。聽覺系的兩端為人的聲音(以語言為主)、自然聲音;視覺系的兩端則是文字和圖像。這樣我們就得到了四個象限,我將其命名為“感官象限”。 我們進一步將聽覺系和視覺系細分,離O點越近的部分,是人類天生易于感知的,比如口語、口述的文字、肉眼所見等;越靠近坐標軸的頂端,代表理解難度越高、越需要后天學習的方式。 我們再將易于感知的部分向復雜的部分的過渡也進行劃分。比如,聽覺系在第一象限的劃分方式就是口語、書面語、專業(yè)術語、第二語言,同理也對其他象限的坐標軸進行劃分。 按這樣的形式,我們可以把互聯(lián)網(wǎng)中主要功能為信息傳遞的產(chǎn)品(以某個特定的產(chǎn)品來代表其類型的產(chǎn)品),填入感官象限中(為了區(qū)分產(chǎn)品需要的是單一感官和兩種感官,我用 O’ 和 O’’ 將需要兩種感官的象限重新作了劃分)。 可以得出以下判斷:
前兩點中有個很有趣的現(xiàn)象,就是以聽覺為主的產(chǎn)品需要視覺輔助,也就意味著這類產(chǎn)品在某些時候是需要兩類感官同時參與的。而單獨以視覺為主的產(chǎn)品,則幾乎沒有這樣的情況。 比如同樣都是傳遞知識的產(chǎn)品,在大家的心理感知上,知乎是用來“看”的,而得到是用來“聽”的??吹臅r候視覺很容易疲勞,注意力分散跳出,聽要比看的情況稍微好一些,但聽的時候如果再看到對應的文字,就要比單純聽更容易抓住聽的內(nèi)容。 第三點中,多感官產(chǎn)品向單一感官產(chǎn)品過渡的這件事,怎么來理解呢?比如貼吧這類以文字為主的社區(qū),要想發(fā)展視頻業(yè)務是很難的。但像愛奇藝這樣的視頻平臺,做的泡泡社區(qū)很快就起來了,日活已經(jīng)到了4500萬,差不多是它總日活的1/4。原因就在于:從多感官向單一感官轉是很容易的,只需要減少調用的感官數(shù)量就好了;可反過來的話,增加的成本就很高了。 整體來說,印證了我之前提到的:從信息接收難易程度來看,視頻類產(chǎn)品最容易被接受;其次是音頻類產(chǎn)品,最后才是圖像、文字類產(chǎn)品。 那么四個象限中的各個產(chǎn)品的位置是如何確定的?
看似同類的產(chǎn)品,其實從人接收信息的角度看,其實差異很大:越貼近人類日常生活的圖像、文字、聲音,越易于人類理解和接受。比如直接的對話、肉眼所見的場景、自然界的各種聲音。當然也有些人的和這個會不太一樣,比如對從小熱愛器樂的孩子來說,樂器振動發(fā)出的聲音可能更會讓他有感觸。 越遠離人類日常生活的東西,越需要大腦的思考、后天的學習,相對來說是一個比較痛苦的過程。比如學英語的要比看電影痛苦的多。人的天性是懶的,在不受場景制約的情況下,大部分人更愿意使用貼近自己生活的、能調動更多感官接收的信息產(chǎn)品,避免大腦思考。即更愿意看直播或短視頻。 從接收信息的容易度上進行排序:第四象限>第一象限>第三象限>第二象限 在第一象限中,從微博類產(chǎn)品到 Github 類產(chǎn)品,屬于文字類型的難度逐漸上升的結果,看的人會逐漸減少。 微信其實還是個主要以視覺傳遞信息的產(chǎn)品,但其語音功能的重要程度,讓我把它放在了這個位置,且其語音消息占了總消息數(shù)的16%。社交產(chǎn)品的天然屬性就是把線下面對面的場景搬到了線上,雖然還是略有差異,但在以文字為載體的情況下,已經(jīng)是最自然的信息傳遞方式了。 最新的數(shù)據(jù)中,喜馬拉雅活躍用戶數(shù)為4000多萬,而網(wǎng)易云的則為6700萬,音樂類 App 活躍用戶數(shù)最高的酷狗音樂為2.2億,從數(shù)據(jù)上看好像有聲書類的產(chǎn)品好像沒有音樂類產(chǎn)品的用戶數(shù)高,這和有聲書產(chǎn)業(yè)發(fā)展的時間短有關。長期來看,只要下沉做得好,有聲書類產(chǎn)品的用戶規(guī)模一定會超越音樂類產(chǎn)品。 第四現(xiàn)象中,首當其沖的是短視頻和直播,這兩類產(chǎn)品其實是在同一位置的,只不過直播近幾年的發(fā)展越來越專業(yè)化、秀場化,讓人很難有貼近身邊的感覺。 短視頻其實也有同樣的問題,但同樣的時長內(nèi),其信息密度更大,所以更受人喜愛。長視頻類的產(chǎn)品中,B站因豐富的彈幕、眾多UGC的緣故,會讓人覺得更親近,但其主要做二次元的細分領域,所以整體的用戶規(guī)模必然沒有愛奇藝大。2017年B站的活躍用戶數(shù)7000多萬,而愛奇藝的則是4.21億。 然后我們再第四象限的網(wǎng)易公開課和第一象限的得到來做個比較。 網(wǎng)易公開課在16年的時候移動端用戶數(shù)為4300萬,得到在18年的數(shù)據(jù)是2000萬用戶,因為發(fā)展的時長不同,很難做結論。但是從信息接收的難易程度來講,網(wǎng)易公開課的用戶規(guī)模就是要比得到高的。如果最后被得到超過了,肯定是因為網(wǎng)易公開課在內(nèi)容水平上僅到達了及格線,而得到做到了120分。 第二、三象限中,我并沒有找到太多合適的產(chǎn)品,可能大家都還在競爭更好做的一、四象限內(nèi)的空間。有很多語言無法表述的信息,器樂、自然聲音等方式傳遞會更合適,而且不受語言差異的限制,通過學歌曲的形式學會說另一種語言更容易,可能和這個也有關系。從感官象限上來看,同樣需要兩個感官接收信息的情況下,離原點越遠的產(chǎn)品,受眾群體的總數(shù)就會越少。 如果再把“細分領域”作為第三個坐標軸,二維坐標系變?yōu)槿S,原有產(chǎn)品的二維圖標將變?yōu)橐粋€個有厚度的小方塊,這些小方塊的厚度就是他們所處細分領域的總體用戶規(guī)模。 所以,我們在借助感官象限對信息傳遞類產(chǎn)品做判斷的時候,想知道該產(chǎn)品的賽道有多大,除了要看他們在感官象限內(nèi)所處的位置,還要看各個產(chǎn)品“塊”的體積大小。也就意味著越是貼近人生活狀態(tài)的、平臺性質的產(chǎn)品,賽道越大,潛在用戶數(shù)越多。比如現(xiàn)階段的短視頻、直播平臺的產(chǎn)品。 那么,手機作為現(xiàn)階段最廣泛的信息傳遞載體,在視覺和聽覺上信息傳遞效率或體驗還有提升的空間么?這個問題同等于,還有比短視頻或直播更能貼近人們?nèi)粘I钚畔⒈憩F(xiàn)方式么? 當然有,想想看 IMAX 電影時候的感受。 三、3D聲音提升視頻體驗 IMAX 電影把視覺和聽覺都做了3D化,你看到的人物、建筑是立體的,聽到的聲音是有遠近、左右的。這就和我們現(xiàn)實的感受更近了。 視覺的3D在手機這個尺寸的屏幕上其實并不能產(chǎn)生很好的體驗,比如之前有段時間出現(xiàn)的裸眼3D手機無疾而終。如果技術允許,降低3D聲音的制作成本,將會為聽覺系產(chǎn)品(音樂、聽書、直播、短視頻、長視頻等)帶來體驗上的提升。 但3D聲音的局限性在于需要耳機作為支持,而大部分手機用戶其實是不用耳機的。但對于使用耳機的用戶來說,在生活化的短視頻和直播領域會有很獨特的體驗。想象一下在刷短視頻的時候,能聽到小哥哥/小姐姐在你的左耳后說話,就會有一種這個人在你身后的感覺。 因為有了“身后”這樣的位置信息,這就比原有的聲音傳遞了更多的信息,提升了信息密度,讓人有了更好的感官體驗。 B站有類叫ASMR的直播節(jié)目,中文譯稱“自發(fā)性知覺經(jīng)絡反應”,俗稱“顱內(nèi)高潮”,是通過各類模擬音效緩解人的精神壓力,其聲音效果就可以模擬出有人在你身邊的感覺。其實聰明一點的讀者能夠發(fā)現(xiàn):我提到的在視覺和聽覺上的提升,VR(虛擬現(xiàn)實)做的就是這件事。 VR 當初引起資本的狂熱也是這個原因,資本賭的并不是 VR 這個設備有多少價值,而是 VR 有可能革新信息傳遞的效率,與視頻相比,VR 能夠傳遞的信息密度更高、更容易讓人類接受,只不過 VR 目前從體驗到設備體積,都沒有取代手機的優(yōu)勢。 所以最終不論是 VR、AR、或是 MR,誰能夠讓人類在同等條件下接受到更多的信息,調動更多的感官來接受,誰就能創(chuàng)造下一個時代。相應的,屆時整個內(nèi)容產(chǎn)業(yè)也會因此作出調整,一定會有很多人涌入去做新的媒介平臺。大家都愛談媒介升級,現(xiàn)實是做媒介聯(lián)合可能更為恰當。 就像如今的短視頻,并不一定都要去做平臺,短視頻作為一種媒介形式,可以作為原有的圖文形式的補充,大眾點評可以做美食類短視頻,豆瓣可以做電影類的,愛奇藝可以做愛豆類的。所以未來出現(xiàn)新的媒介形式的時候,考慮清楚這種媒介形式和自己現(xiàn)有業(yè)務的關系,可能比直接沖進這個戰(zhàn)場重要的多。 除了 VR ,我們再向前邁一步,未來的信息接收的載體還可能出現(xiàn)哪些變化? 四、更多維度的感官參與 回到文章最初提到的:信息雖然煩擾紛雜,但人類接收信息的感官是相同的。眼、耳、鼻、口、皮膚為我們提供了:視覺、聽覺、嗅覺、味覺、觸覺。而手機主要是圍繞視覺、聽覺展開的,觸覺在手機中主要是一種完成執(zhí)行的方式,用電容筆就可以替代。 到 VR 設備中,觸覺開始有了部分接收信息的功能,特別是在游戲的體驗提升了一個臺階,也就是說,游戲借助 VR 的設備,有了更豐富的信息傳遞通道,可傳遞的信息密度也就更高,本質上提高了信息傳遞的效率。 所以未來的信息傳遞載體升級的方向,就是提升信息接收調動感官數(shù)量。在原有的視覺、聽覺基礎上增加味覺、嗅覺等。味覺和嗅覺的增加貌似比較難,所以我猜測下一階段的創(chuàng)新,更有可能出現(xiàn)在由皮膚接收信息的方向。 皮膚作為人身體最大的器官,能夠提供的感覺至少有溫覺、冷覺、濕覺、壓覺、痛覺、觸覺等六種感覺。所以,接觸到皮膚這一個器官,就能至少擁有六種不同的感知結果。 感官象限原有的二維坐標系中,每增加一種感覺,就意味著增加一個維度,變成三位、四維的坐標軸,當然這和空間的維度并非同一個概念。 更準確的說,這種感官維度的增加指的是,人類通過電子設備接收的信息,通過維度的不斷增加,能夠更加全面和立體地被感知,更加趨近于真實生活中接觸信息的感受。 比如電影《頭號玩家》里的主人公穿戴的 VR 設備,就覆蓋了人的視覺、聽覺、嗅覺、以及整個皮膚的各種感覺,整個場景創(chuàng)造出的真實感,讓大部分人放棄了現(xiàn)實世界的生活。到時候整個內(nèi)容產(chǎn)品也依然可以按照感官象限的劃分方法,去判斷自己產(chǎn)品的位置或是選擇合適的賽道。 五、人類信息接收的5個判斷 人類文明發(fā)展萬年,視頻媒介傳播百年,互聯(lián)網(wǎng)產(chǎn)品出現(xiàn)數(shù)十年,未來媒介誕生在人們腦海里幾載。從過去到未來,縱觀全文,我一共作了5個判斷:
在人類信息接收的這件事上,我一方面觀察歷史是如何演進的,為什么會出現(xiàn)這些變化,另一方面也思考現(xiàn)階段的解決方案中,還有哪些不足,未來還有哪些發(fā)展的空間。希望以上內(nèi)容對大家在思考不同媒介間的差異,以及內(nèi)容產(chǎn)品的發(fā)展方向上能有些許的靈感和啟發(fā)。 同樣也希望,這篇文章在10年后翻出來,仍然能在其當下找到回應。 |
|
來自: 平常心 > 《新興產(chǎn)業(yè)》