如果,這就是大數(shù)據(jù)……編者按:本文作者袁茵(@黑豆Yuanyin),《中國企業(yè)家》雜志互聯(lián)網(wǎng)圈記者,微信公眾號:heidouyy,或者直接搜索“黑豆”。 中國什么時候才能有自己的《紙牌屋》?或許已經(jīng)為時不遠(yuǎn)了。印象中,離互聯(lián)網(wǎng)很遠(yuǎn)的娛樂圈,已經(jīng)開始利用大數(shù)據(jù)進行各種嘗試了。 前幾天,黑豆碰到了老夏,他就正在做這樣的事。老夏名叫夏宗靚,成立了一家名叫艾漫科技的大數(shù)據(jù)公司。如果把艾漫科技當(dāng)成影視圈的一個幕后人員,它早就是腕兒了。《小時代》和《北京愛情故事》兩部賺得盆滿缽盈的電影,幕后都有艾漫科技提供大數(shù)據(jù)支持。 2013 年《小時代 1》6 月上院線之后,艾漫科技的大數(shù)據(jù)系統(tǒng)發(fā)現(xiàn)觀眾對郭敬明的導(dǎo)演功力有質(zhì)疑,同時,某一個男主角的表現(xiàn)非常不能讓觀眾滿意,而這個時候《小時代 2》已經(jīng)拍完。綜合大數(shù)據(jù)結(jié)果艾漫建議《小時代 2》在七夕中國情人節(jié)檔上院線,因為如果等待半年之后上映,關(guān)注度下降的同時,郭敬明的導(dǎo)演水平會受到更多質(zhì)疑。這是中國電影史上都是少見的操作手法,當(dāng)然,票房的成功驗證了這個決策是正確的。 大數(shù)據(jù)同樣可以用于選角和戲份刪減。艾漫科技還建議:由于其中某個男演員口碑較差,后續(xù)戲份需要刪減;而女二號的表現(xiàn)突出,戲份應(yīng)更多增加。此外,由于小時代系列的 82% 的關(guān)注者都是 90 后,而對這個人群的作息時間來講,晚上十點的排片可能比傳統(tǒng)的晚上八點黃金檔更合適;還有應(yīng)更多地在二三線市場進行排片和在營銷時重要的宣傳點應(yīng)著重放在“朋友、友情、人性”等。這些建議最終都被片方采納。 其實黑豆一直認(rèn)為,大數(shù)據(jù)做的就是了解“人”的事情。無論現(xiàn)實社會還是虛擬社會,只要我們有了身份、ID 我們就會有所顧忌,所以未必敢表達我們的真實感受。有的時候,我們內(nèi)心想要的甚至我們自己也說不出來。但這一切都會表現(xiàn)在我們的行為上,誰愿意承認(rèn)自己八卦呢,但這并不妨礙我們在文章事件曝出后,翻翻三個人的過往情史。很多人批評《小時代》紙醉金迷,這不妨礙我們依舊看著這部電影,在心里偷偷向往一下,甚至我們都不知道自己在向往。在互聯(lián)網(wǎng)上,娛樂是用戶最重要的幾件事之一,大數(shù)據(jù)能做到的更了不起的事情是——“找到你內(nèi)心的小惡魔”,并用內(nèi)容把小惡魔飼養(yǎng)好,轉(zhuǎn)而讓我們更加了解自己。 從這個角度看,娛樂信息的確比很多門類更容易直射內(nèi)心。不過黑豆想到的事情,其它人必然也會想到,這塊遲遲發(fā)展不起來大概有幾個原因:1、中國娛樂產(chǎn)業(yè)本身的互聯(lián)網(wǎng)化程度還比較初級;2、再精準(zhǔn)的數(shù)據(jù)到很流弊的作品之間也少不了“人”的加工,數(shù)據(jù)再準(zhǔn),沒有好導(dǎo)演,一部粗制濫造、各種情節(jié)拼湊在一起也未必有人看吧;3、大數(shù)據(jù)的效果無法像電商那樣精準(zhǔn)衡量,但背后的技術(shù)要求卻更高。 互聯(lián)網(wǎng)圈都有個習(xí)慣,一聽到大數(shù)據(jù),就得問在數(shù)據(jù)量、技術(shù)上有什么優(yōu)勢。其實前幾年老夏做的事情都是把非結(jié)構(gòu)化的數(shù)據(jù)變得結(jié)構(gòu)化,那時百度也提出了類似的概念,你就知道他們做得事情有多難?,F(xiàn)在對外,老夏解釋類似問題答案很直接:“在中文文字處理上,艾漫科技數(shù)據(jù)源是最大的,處理速度是最快的,識別是最準(zhǔn)的,沒有之一。還有就是,不需要人工參與判斷?!?/p> 老夏常說自己是影視行業(yè)的“黑衣人”,掌握著最新科技為影視圈的星球大戰(zhàn)保駕護航,任務(wù)完成后,就用記憶消除器對著自己閃一下。身在娛樂圈,艾漫科技超過 70% 的人卻是技術(shù)宅男,不擅長制造話題和緋聞。“就像我們服務(wù)器上存儲的 1.4PB 數(shù)據(jù)一樣,艾漫會持續(xù)每天海量存儲全網(wǎng)數(shù)據(jù)?!崩舷慕忉?,真正做好大數(shù)據(jù),需要動態(tài)、連續(xù)、完整的數(shù)據(jù)積累,而不是博曇花一現(xiàn)?!暗桨萍紡V為人知的時候,我們存儲的數(shù)據(jù)或許已經(jīng)達到 10PB、甚至 100PB 了,而且這些的數(shù)據(jù)能發(fā)揮的價值遠(yuǎn)超過容量的價值”。 2012 年《紙牌屋》讓人們知道有一種神奇的工具叫大數(shù)據(jù),卻不知道那時艾漫科技已經(jīng)在影視商業(yè)立項、主創(chuàng)評估、制片輔助、宣傳發(fā)行、動態(tài)票房預(yù)估等領(lǐng)域開始嘗試了?!缎r代》、《北愛》、《最美和聲》等知名作品都和艾漫有大數(shù)據(jù)合作,原來這些好作品都是上了科技手段的。目前艾漫的電影票房預(yù)測已經(jīng)控制到 10% 的誤差,2014 年開始,自己建設(shè)了大數(shù)據(jù)系統(tǒng)的視頻網(wǎng)站也開始尋求艾漫科技這樣的“外腦”,成功的自制內(nèi)容有騰訊視頻的《探靈檔案》、《Are you normal》等。 但老夏只想讓大數(shù)據(jù)成為影視、音樂等娛樂產(chǎn)品的“拐杖”。娛樂和互聯(lián)網(wǎng)看似風(fēng)馬牛不相及,但越跨界就越有意思。他本身就是個跨界人,畢業(yè)于清華大學(xué),在 IT 圈工作多年,后來又進入了音樂圈,曾擔(dān)任海蝶公司總裁。 最先嘗鮮的是那些對高科技很有 Feel 的導(dǎo)演,比如對新銳 90 后口味最了解的郭敬明、導(dǎo)演了《泰坦尼克號》的好萊塢大導(dǎo)演詹姆斯·卡梅隆(他在《深海挑戰(zhàn)》中和艾漫進行了大數(shù)據(jù)合作)。這也是老夏最喜歡的一類客戶,他們對大數(shù)據(jù)的認(rèn)識更加理性:不需要老夏用數(shù)據(jù)去證明自己的決策多么睿智、偉大,相反,他們和那些優(yōu)秀的產(chǎn)品經(jīng)理一樣,更關(guān)注用戶在想什么?!按髷?shù)據(jù)不是為了證明什么是對的。它研究的不是因果,而是相關(guān)關(guān)系。大數(shù)據(jù)只是在不斷提高成功的幾率,因為通向成功的路上,變量太多了?!崩舷恼f,“未來每一個影視內(nèi)容的產(chǎn)生,都是藝術(shù)感性創(chuàng)造和大數(shù)據(jù)理性支持的疊加,缺一不可”。 話說回來,以黑豆對大數(shù)據(jù)的淺薄理解,一聽到創(chuàng)業(yè)公司要做大數(shù)據(jù)還是有些擔(dān)心的,因為大數(shù)據(jù)正是 BAT 抓緊在做的事情啊,可真不是創(chuàng)業(yè)公司輕易玩得起的。而且優(yōu)土、愛奇藝等視頻網(wǎng)站都在做自己的大數(shù)據(jù)系統(tǒng),為買劇、制劇做出指導(dǎo),和創(chuàng)業(yè)公司比起來,他們怎么看都能算得上財大氣粗。 但有了技術(shù)能力后,艾漫做的事情還是有巨大的市場空間。中國娛樂文化市場很大,但做娛樂文化內(nèi)容深度挖掘的公司很少。而且這些事情,BAT 也需要,卻未必有精力專門搭建團隊做的事情。艾漫抓取的是全網(wǎng)的娛樂數(shù)據(jù)(除了微信朋友圈現(xiàn)在還沒開放權(quán)限),這些數(shù)據(jù)多、雜、散、匿。 大公司一講自己的大數(shù)據(jù)優(yōu)勢就是自己體系內(nèi)海量數(shù)據(jù)的積累,或者完善的賬號體系,而艾漫科技可以為任何一個客戶提供總平臺的數(shù)據(jù)和分析。一部電影、電視劇或是綜藝節(jié)目,大數(shù)據(jù)的作用是分析觀眾口味是什么,喜歡怎樣的橋段,而不是針對個人。《北愛》中艾漫通過內(nèi)容聚合,發(fā)現(xiàn)北京的 80 后的愛情觀,尤其是北漂,是玫瑰加房子。 做大數(shù)據(jù)首先要能正確地理解并搜集數(shù)據(jù)。在自然語言理解上,艾漫可以在博大精深的漢語中精準(zhǔn)的抽取關(guān)鍵詞以及觀點并做出情感的分析判斷(這在一般的大數(shù)據(jù)體系里是做不到的)。而且在消除歧義上,艾漫也很有心得,文章事件中,他們絕對不會把“演員文章”和“一篇文章”中的兩個詞弄混。針對相關(guān)內(nèi)容,艾漫可以自動歸檔,更牛的是,大數(shù)據(jù)系統(tǒng)可以自動給這些文章做出摘要。 搜集數(shù)據(jù)之后,還需要挖掘。如果有突發(fā)事件曝出,系統(tǒng)可以自動進行全網(wǎng)的時間傳播與追蹤。聽到這里的時候,黑豆邪惡的想了一下,如果再出艷照門,是不是宅男們就不用各大論壇去翻帖子了,始終有最新版的內(nèi)容看。此外還能根據(jù)關(guān)鍵詞形成大規(guī)模的知識圖譜,類似的知識圖譜我們其實已經(jīng)在搜索引擎或者人立方等產(chǎn)品中看到過了,但艾漫的知識圖譜是多信息的,你不僅能看到關(guān)鍵人物、或者事件,而且每個關(guān)鍵點上還有相關(guān)新聞鏈接和摘要供閱讀。 而且艾漫非常重視來自微博、評論、貼吧等各種社交產(chǎn)品中的數(shù)據(jù),因為那背后的才是一個個真實的“人”。這意味著,即便對有了大數(shù)據(jù)系統(tǒng)的視頻網(wǎng)站,艾漫也能告訴它更多,比如誰在討論什么,這個劇為什么火。 黑豆非常期待的是,很快這些用于尋找人類心中“小惡魔”的大數(shù)據(jù)系統(tǒng)就要被開發(fā)成面向用戶的 toC 類產(chǎn)品了。艾漫做影視 To B 類客戶服務(wù),是讓影視作品都符合目標(biāo)用戶的 YY;做娛樂資訊 To C 類用戶服務(wù),則是為了驗證老夏自己的 YY。 至少以目前的艾漫的手段,早期產(chǎn)品就可以讓用戶越來越“懶”:不需要花超過 3 秒的時間就能讀懂一篇新聞;甚至不再“讀”新聞,直接變成圖片來看新聞。媒體的態(tài)度不再重要,用戶的態(tài)度才是最重要的;每個人都不再是信息的孤島,因為每個人都能找到自己價值觀的認(rèn)同者;每個人都是信息的接收者,也是信息的傳播者。 黑豆內(nèi)心更期待在它的產(chǎn)品入駐了我們手機,對我們有更多了解后,能幫助我們找到內(nèi)心的小惡魔,畢竟,了解自己這件事吧,太難了。擁有直面真實的自己的勇氣,也太難了。比如黑豆自己,當(dāng)老夏告訴我,每一個社交賬號后面的行為,艾漫科技都貼上了 20 個標(biāo)簽的時候,我后背涼颼颼的。我何時是天使,何時是魔鬼,大數(shù)據(jù)竟然比我還清楚。 但黑豆還是愿意有這樣的產(chǎn)品使用,只是要友情提醒先:不要因為我們走得太遠(yuǎn),忘了我們?yōu)槭裁闯霭l(fā)。 [36氪原創(chuàng)文章,作者: 黑豆] |
|
來自: 巴山松(禪) > 《統(tǒng)計》