內(nèi)容產(chǎn)業(yè)的本質判斷：信息接收的過去、現(xiàn)在與未來

平常心 2018-08-16

展開全文

圍繞在我們身邊的信息數(shù)量龐大、類型復雜，每個人所處的圈層不同，接受到的信息也有很大差異，看似好像很難劃分。作者將我們的感官系統(tǒng)進行劃分形成“感官象限”，通過分析當下互聯(lián)網(wǎng)產(chǎn)品做出對人類信息接收的5個判斷。深度好文，值得和大家一起分享。

作者 | 徐邦睿

來源 | 以夢為馬

編輯 | 李姝婧

正文共6967字 25圖 | 預計閱讀時間18分鐘

圍繞在我們身邊的信息，數(shù)量龐大、類型復雜，每個人所處的圈層不同，接受到的信息也有很大差異，看似好像很難劃分。但如果從另一個角度來看，我們大部分人的身體結構是相同的，于是我們可以按照接收信息的感覺器官來劃分，就會比較明確。

我們的眼、耳、鼻、口、皮膚為我們提供了：視覺、聽覺、嗅覺、味覺、觸覺。

視覺讓我們能夠看見圖像和文字，我們用聽覺接收語言和自然界的聲音，嗅覺和味覺提供了很多奇妙體驗的可能，觸覺是我們出生后第一次感知世界的方式。從生物學上來講，這些感官很多動物都有，人類并沒有在這方面顯得多么出眾；但人類卻創(chuàng)造了其他任何一種動物都無法創(chuàng)造的輝煌成就，并成為“地球的主人”。這主要歸功于人類所特有的一種杰出能力——保存并傳遞信息的能力。

人類文明發(fā)展萬年以來，科學技術的進步令信息保存和傳遞的方式發(fā)生了天翻地覆的變化，然而我們接收信息的方式只是效率的提高，而這一現(xiàn)象在數(shù)字化碎片的時代會加速傳染開來。

要想知道為什么只是效率的提高，就得先弄清楚從古至今，信息的保存和傳遞方式是如何變化的？

一、視頻是最易消費的媒介

現(xiàn)代人類的祖先“智人”進化出新語言是在大約距今7萬到3萬年前，這種新語言不同于其他動物通過不同喊叫的方式，傳達不同的信息。而是能通過發(fā)出的有限聲音，組合起來產(chǎn)生無限多的句子，各有不同的含義。于是，我們就能夠吸收、儲存和溝通驚人的信息量，并了解我們周遭的世界。

人類最早開始進行圖像類型的記錄，產(chǎn)生于舊石器時代的晚期，距今約3萬到1萬多年之間。記錄類型包括了洞窟壁畫、巖畫、雕刻、建筑等。而文字的出現(xiàn)要晚得多——文字幾乎與農(nóng)耕相伴而生，從最早的刻符、結繩和巖畫算起，人類文字的歷史不過5000多年。

從時間線的角度，我們很容易看出：語言的出現(xiàn)早于壁畫，早于文字。

人類從蠻荒步入文明，有三次偉大的跨越：第一次是語言，第二次是農(nóng)耕，第三次是文字。語言是人類的開始，農(nóng)耕是文明的開始，文字則是現(xiàn)代的開始。文字的出現(xiàn)雖然讓人類社會進入了一個新的紀元，但千百年來，很多時候文字只是少數(shù)人享有的權利，不論是從創(chuàng)造、學習、使用等各個角度來看，都是如此。也就是說：同樣的信息，我用語言、圖畫、文字三種形式傳達的時候，大部分人可以聽懂語言所表述的內(nèi)容，其次是圖畫，文字的效果最差。語言是人聲帶振動的結果，所以它本質上是一種聲音。

這樣，以上的三種形式就可以抽象為聲音、圖像和文字，我們初步推斷，在人類接收信息的容易程度上，聲音的效果最好，文字最次。即：聲音>圖像>文字

除了以上三種信息的傳遞方式，其實還有一種很重要的信息傳遞方式——視頻，只不過這種方式一直到近代才出現(xiàn)。

記錄文字和圖像的方式人類在遠古時期就學會了，并且持續(xù)探索更簡單的實現(xiàn)方式。

大規(guī)模的文字記錄方式，是因為雕版印刷術的出現(xiàn)，于公元7世紀左右的隋唐時期。圖像的便捷記錄方式出現(xiàn)在1839年，法國的達蓋爾制成第一個臺實用的照相機。人類的科技發(fā)展，總是傾向于讓人變得越來越懶。出現(xiàn)的時間越晚的信息載體，才越易于我們感知和理解。聲音和影像的的記錄一直到第一次工業(yè)革命以后才出現(xiàn)。1877年愛迪生發(fā)明了留聲機，讓聲音的再現(xiàn)有了可能。1895年愛迪生和迪克森制作的“有聲活動電影機”，這項能夠記錄我們所處現(xiàn)實世界的發(fā)明，為后來視頻成為現(xiàn)存的覆蓋面最廣泛的媒介，奠定了基礎。

從遠古跨入現(xiàn)代，人類保存和傳遞信息的方式，已經(jīng)從呆板枯燥的文字，上升為能夠聽得見、看得到地重演現(xiàn)實世界情景的視頻，視頻成為了最容易能夠讓人看懂的媒介。

所以我們可以進一步確定我們的推斷，在人類接收信息的容易程度上，視頻的效果要優(yōu)于聲音，也就是視頻＞聲音＞圖像＞文字。

對此，我們從另一個角度重新審視，會得到更有說服力的解釋。

文字是最早能夠記錄，但是消費門檻最高的媒介。想象文字的閱讀過程：首先我們得識字，知道一系列圖形符號和他們的組合所代表的意義；然后通過句子，我們要在大腦中映射出感覺和意向，有一些要圖像化處理后才能理解。再思考文字的寫作過程：我們要知道這些感覺和意義如何通過一系列的符號落到紙面。所以文字的過程是個壓縮和解壓的過程。這個行為相比于其他的內(nèi)容消費形式，門檻是比較高的。這也是文盲那么多的原因。

圖像是對視頻生活的抽象化反映，理解起來會有一點難度。比如有一些人是看不懂漫畫的。聲音比圖像更容易理解，因為畢竟沒有這么多復雜的千奇百怪的圖形，只有有限個聲音。

視頻所展示的世界和我們睜眼第一天看世界的就是相同的。而直播是現(xiàn)實生活最生動的克隆。而視頻最容易被接收、門檻最低的原因，還有另外一個原因：視頻調動了更多的感官。

二、如何用“感官象限”作判斷

我們把視頻、聲音、圖像、文字和人的感官結合起來，能夠發(fā)現(xiàn)，圖像和文字是需要用眼睛來看的，耳朵可以聽到聲音。而視頻則需要同時調動聽覺和視覺這兩種感覺。

也就是說，同等信息量的時候，視頻需要調動兩種感官的特性，讓我們更易于去接收這些信息。而在同等時間的條件下，視頻能夠傳遞的信息量更多，信息密度更大，而人天然喜歡信息密度更大的東西。

從這個角度，我們再看互聯(lián)網(wǎng)世界里，和信息相關的產(chǎn)品，我們就能逐漸探索出資訊類、聽書類、視頻類產(chǎn)品他們之間的本質差異，以及用戶量一路飆升的短視頻，為什么會讓各巨頭公司產(chǎn)生恐慌。

“感官象限”里的4個判斷

通過互聯(lián)網(wǎng)傳播的信息，主要借助手機、電腦這樣的終端設備，這類設備主要傳遞的是視頻、聲音、圖像、文字信息，我們接收主要是通過視覺、聽覺和部分觸覺。

我們按感官系統(tǒng)進行劃分：

視覺接收到文字、圖像信息；
聽覺接收到聲音信息（語音、音樂、配音等）；
觸覺接收的大部分是由“振動”完成的（來電提示、觸摸反饋等）。

由于目前對觸覺的使用僅在提供反饋的層次，信息量遠不及其他形式，我們把它放在后面單獨來講。

那么，我們以聽覺系為X軸、視覺系為Y軸，建立二維直角坐標系。聽覺系的兩端為人的聲音（以語言為主）、自然聲音；視覺系的兩端則是文字和圖像。這樣我們就得到了四個象限，我將其命名為“感官象限”。

我們進一步將聽覺系和視覺系細分，離O點越近的部分，是人類天生易于感知的，比如口語、口述的文字、肉眼所見等；越靠近坐標軸的頂端，代表理解難度越高、越需要后天學習的方式。

我們再將易于感知的部分向復雜的部分的過渡也進行劃分。比如，聽覺系在第一象限的劃分方式就是口語、書面語、專業(yè)術語、第二語言，同理也對其他象限的坐標軸進行劃分。

按這樣的形式，我們可以把互聯(lián)網(wǎng)中主要功能為信息傳遞的產(chǎn)品（以某個特定的產(chǎn)品來代表其類型的產(chǎn)品），填入感官象限中（為了區(qū)分產(chǎn)品需要的是單一感官和兩種感官，我用 O’ 和 O’’ 將需要兩種感官的象限重新作了劃分）。

可以得出以下判斷：

以視覺為主的產(chǎn)品，僅靠視覺就能完成信息傳遞。
以聽覺為主的產(chǎn)品，多需要視覺對其信息內(nèi)容進行補充。
從多感官產(chǎn)品向單一感官產(chǎn)品過渡容易，反之則較難。
多感官同時進行信息接收，要比單一感官接收信息更容易。

前兩點中有個很有趣的現(xiàn)象，就是以聽覺為主的產(chǎn)品需要視覺輔助，也就意味著這類產(chǎn)品在某些時候是需要兩類感官同時參與的。而單獨以視覺為主的產(chǎn)品，則幾乎沒有這樣的情況。

比如同樣都是傳遞知識的產(chǎn)品，在大家的心理感知上，知乎是用來“看”的，而得到是用來“聽”的?？吹臅r候視覺很容易疲勞，注意力分散跳出，聽要比看的情況稍微好一些，但聽的時候如果再看到對應的文字，就要比單純聽更容易抓住聽的內(nèi)容。

第三點中，多感官產(chǎn)品向單一感官產(chǎn)品過渡的這件事，怎么來理解呢？比如貼吧這類以文字為主的社區(qū)，要想發(fā)展視頻業(yè)務是很難的。但像愛奇藝這樣的視頻平臺，做的泡泡社區(qū)很快就起來了，日活已經(jīng)到了4500萬，差不多是它總日活的1/4。原因就在于：從多感官向單一感官轉是很容易的，只需要減少調用的感官數(shù)量就好了；可反過來的話，增加的成本就很高了。

整體來說，印證了我之前提到的：從信息接收難易程度來看，視頻類產(chǎn)品最容易被接受；其次是音頻類產(chǎn)品，最后才是圖像、文字類產(chǎn)品。

那么四個象限中的各個產(chǎn)品的位置是如何確定的？

離日常生活越近的信息越好

看似同類的產(chǎn)品，其實從人接收信息的角度看，其實差異很大：越貼近人類日常生活的圖像、文字、聲音，越易于人類理解和接受。比如直接的對話、肉眼所見的場景、自然界的各種聲音。當然也有些人的和這個會不太一樣，比如對從小熱愛器樂的孩子來說，樂器振動發(fā)出的聲音可能更會讓他有感觸。

越遠離人類日常生活的東西，越需要大腦的思考、后天的學習，相對來說是一個比較痛苦的過程。比如學英語的要比看電影痛苦的多。人的天性是懶的，在不受場景制約的情況下，大部分人更愿意使用貼近自己生活的、能調動更多感官接收的信息產(chǎn)品，避免大腦思考。即更愿意看直播或短視頻。

從接收信息的容易度上進行排序：第四象限>第一象限>第三象限>第二象限

在第一象限中，從微博類產(chǎn)品到 Github 類產(chǎn)品，屬于文字類型的難度逐漸上升的結果，看的人會逐漸減少。

微信其實還是個主要以視覺傳遞信息的產(chǎn)品，但其語音功能的重要程度，讓我把它放在了這個位置，且其語音消息占了總消息數(shù)的16%。社交產(chǎn)品的天然屬性就是把線下面對面的場景搬到了線上，雖然還是略有差異，但在以文字為載體的情況下，已經(jīng)是最自然的信息傳遞方式了。

最新的數(shù)據(jù)中，喜馬拉雅活躍用戶數(shù)為4000多萬，而網(wǎng)易云的則為6700萬，音樂類 App 活躍用戶數(shù)最高的酷狗音樂為2.2億，從數(shù)據(jù)上看好像有聲書類的產(chǎn)品好像沒有音樂類產(chǎn)品的用戶數(shù)高，這和有聲書產(chǎn)業(yè)發(fā)展的時間短有關。長期來看，只要下沉做得好，有聲書類產(chǎn)品的用戶規(guī)模一定會超越音樂類產(chǎn)品。

第四現(xiàn)象中，首當其沖的是短視頻和直播，這兩類產(chǎn)品其實是在同一位置的，只不過直播近幾年的發(fā)展越來越專業(yè)化、秀場化，讓人很難有貼近身邊的感覺。

短視頻其實也有同樣的問題，但同樣的時長內(nèi)，其信息密度更大，所以更受人喜愛。長視頻類的產(chǎn)品中，B站因豐富的彈幕、眾多UGC的緣故，會讓人覺得更親近，但其主要做二次元的細分領域，所以整體的用戶規(guī)模必然沒有愛奇藝大。2017年B站的活躍用戶數(shù)7000多萬，而愛奇藝的則是4.21億。

然后我們再第四象限的網(wǎng)易公開課和第一象限的得到來做個比較。

網(wǎng)易公開課在16年的時候移動端用戶數(shù)為4300萬，得到在18年的數(shù)據(jù)是2000萬用戶，因為發(fā)展的時長不同，很難做結論。但是從信息接收的難易程度來講，網(wǎng)易公開課的用戶規(guī)模就是要比得到高的。如果最后被得到超過了，肯定是因為網(wǎng)易公開課在內(nèi)容水平上僅到達了及格線，而得到做到了120分。

第二、三象限中，我并沒有找到太多合適的產(chǎn)品，可能大家都還在競爭更好做的一、四象限內(nèi)的空間。有很多語言無法表述的信息，器樂、自然聲音等方式傳遞會更合適，而且不受語言差異的限制，通過學歌曲的形式學會說另一種語言更容易，可能和這個也有關系。從感官象限上來看，同樣需要兩個感官接收信息的情況下，離原點越遠的產(chǎn)品，受眾群體的總數(shù)就會越少。

如果再把“細分領域”作為第三個坐標軸，二維坐標系變?yōu)槿S，原有產(chǎn)品的二維圖標將變?yōu)橐粋€個有厚度的小方塊，這些小方塊的厚度就是他們所處細分領域的總體用戶規(guī)模。

所以，我們在借助感官象限對信息傳遞類產(chǎn)品做判斷的時候，想知道該產(chǎn)品的賽道有多大，除了要看他們在感官象限內(nèi)所處的位置，還要看各個產(chǎn)品“塊”的體積大小。也就意味著越是貼近人生活狀態(tài)的、平臺性質的產(chǎn)品，賽道越大，潛在用戶數(shù)越多。比如現(xiàn)階段的短視頻、直播平臺的產(chǎn)品。

那么，手機作為現(xiàn)階段最廣泛的信息傳遞載體，在視覺和聽覺上信息傳遞效率或體驗還有提升的空間么？這個問題同等于，還有比短視頻或直播更能貼近人們?nèi)粘Ｉ钚畔⒈憩F(xiàn)方式么？

當然有，想想看 IMAX 電影時候的感受。

三、3D聲音提升視頻體驗

IMAX 電影把視覺和聽覺都做了3D化，你看到的人物、建筑是立體的，聽到的聲音是有遠近、左右的。這就和我們現(xiàn)實的感受更近了。

視覺的3D在手機這個尺寸的屏幕上其實并不能產(chǎn)生很好的體驗，比如之前有段時間出現(xiàn)的裸眼3D手機無疾而終。如果技術允許，降低3D聲音的制作成本，將會為聽覺系產(chǎn)品（音樂、聽書、直播、短視頻、長視頻等）帶來體驗上的提升。

但3D聲音的局限性在于需要耳機作為支持，而大部分手機用戶其實是不用耳機的。但對于使用耳機的用戶來說，在生活化的短視頻和直播領域會有很獨特的體驗。想象一下在刷短視頻的時候，能聽到小哥哥/小姐姐在你的左耳后說話，就會有一種這個人在你身后的感覺。

因為有了“身后”這樣的位置信息，這就比原有的聲音傳遞了更多的信息，提升了信息密度，讓人有了更好的感官體驗。

B站有類叫ASMR的直播節(jié)目，中文譯稱“自發(fā)性知覺經(jīng)絡反應”，俗稱“顱內(nèi)高潮”，是通過各類模擬音效緩解人的精神壓力，其聲音效果就可以模擬出有人在你身邊的感覺。其實聰明一點的讀者能夠發(fā)現(xiàn)：我提到的在視覺和聽覺上的提升，VR（虛擬現(xiàn)實）做的就是這件事。

VR 當初引起資本的狂熱也是這個原因，資本賭的并不是 VR 這個設備有多少價值，而是 VR 有可能革新信息傳遞的效率，與視頻相比，VR 能夠傳遞的信息密度更高、更容易讓人類接受，只不過 VR 目前從體驗到設備體積，都沒有取代手機的優(yōu)勢。

所以最終不論是 VR、AR、或是 MR，誰能夠讓人類在同等條件下接受到更多的信息，調動更多的感官來接受，誰就能創(chuàng)造下一個時代。相應的，屆時整個內(nèi)容產(chǎn)業(yè)也會因此作出調整，一定會有很多人涌入去做新的媒介平臺。大家都愛談媒介升級，現(xiàn)實是做媒介聯(lián)合可能更為恰當。

就像如今的短視頻，并不一定都要去做平臺，短視頻作為一種媒介形式，可以作為原有的圖文形式的補充，大眾點評可以做美食類短視頻，豆瓣可以做電影類的，愛奇藝可以做愛豆類的。所以未來出現(xiàn)新的媒介形式的時候，考慮清楚這種媒介形式和自己現(xiàn)有業(yè)務的關系，可能比直接沖進這個戰(zhàn)場重要的多。

除了 VR ，我們再向前邁一步，未來的信息接收的載體還可能出現(xiàn)哪些變化？

四、更多維度的感官參與

回到文章最初提到的：信息雖然煩擾紛雜，但人類接收信息的感官是相同的。眼、耳、鼻、口、皮膚為我們提供了：視覺、聽覺、嗅覺、味覺、觸覺。而手機主要是圍繞視覺、聽覺展開的，觸覺在手機中主要是一種完成執(zhí)行的方式，用電容筆就可以替代。

到 VR 設備中，觸覺開始有了部分接收信息的功能，特別是在游戲的體驗提升了一個臺階，也就是說，游戲借助 VR 的設備，有了更豐富的信息傳遞通道，可傳遞的信息密度也就更高，本質上提高了信息傳遞的效率。

所以未來的信息傳遞載體升級的方向，就是提升信息接收調動感官數(shù)量。在原有的視覺、聽覺基礎上增加味覺、嗅覺等。味覺和嗅覺的增加貌似比較難，所以我猜測下一階段的創(chuàng)新，更有可能出現(xiàn)在由皮膚接收信息的方向。

皮膚作為人身體最大的器官，能夠提供的感覺至少有溫覺、冷覺、濕覺、壓覺、痛覺、觸覺等六種感覺。所以，接觸到皮膚這一個器官，就能至少擁有六種不同的感知結果。

感官象限原有的二維坐標系中，每增加一種感覺，就意味著增加一個維度，變成三位、四維的坐標軸，當然這和空間的維度并非同一個概念。

更準確的說，這種感官維度的增加指的是，人類通過電子設備接收的信息，通過維度的不斷增加，能夠更加全面和立體地被感知，更加趨近于真實生活中接觸信息的感受。

比如電影《頭號玩家》里的主人公穿戴的 VR 設備，就覆蓋了人的視覺、聽覺、嗅覺、以及整個皮膚的各種感覺，整個場景創(chuàng)造出的真實感，讓大部分人放棄了現(xiàn)實世界的生活。到時候整個內(nèi)容產(chǎn)品也依然可以按照感官象限的劃分方法，去判斷自己產(chǎn)品的位置或是選擇合適的賽道。

五、人類信息接收的5個判斷

人類文明發(fā)展萬年，視頻媒介傳播百年，互聯(lián)網(wǎng)產(chǎn)品出現(xiàn)數(shù)十年，未來媒介誕生在人們腦海里幾載。從過去到未來，縱觀全文，我一共作了5個判斷：

多感官接收信息要比單一感官有絕對優(yōu)勢，映射在當下就是：視頻＞聲音＞圖像＞文字。

人天性是懶的，越貼近人類日常生活的圖像、文字、聲音，越易于人類理解和接受。即更愿意看直播或短視頻。

以目前手機設備為載體的情況下，進一步的提升可能出現(xiàn)在聲音的3D化方面。

未來能夠替代手機的設備，一定有更高的信息傳遞效率，也就是能觸達更多的感官，盡可能模擬現(xiàn)實生活中的場景。

內(nèi)容產(chǎn)業(yè)可以依據(jù)“感官象限”去判斷自己所在領域的賽道大小，并且隨著信息傳遞效率更高的新技術出現(xiàn)，相應的去加入新的戰(zhàn)場或是對自己的產(chǎn)品進行補充與完善。

在人類信息接收的這件事上，我一方面觀察歷史是如何演進的，為什么會出現(xiàn)這些變化，另一方面也思考現(xiàn)階段的解決方案中，還有哪些不足，未來還有哪些發(fā)展的空間。希望以上內(nèi)容對大家在思考不同媒介間的差異，以及內(nèi)容產(chǎn)品的發(fā)展方向上能有些許的靈感和啟發(fā)。

同樣也希望，這篇文章在10年后翻出來，仍然能在其當下找到回應。