近日,文化部將19家不合規(guī)定的直播平臺(tái)列入查處名單。 作為新型的社交互動(dòng)平臺(tái),網(wǎng)絡(luò)直播與傳統(tǒng)的視頻網(wǎng)站不同,當(dāng)用戶(hù)上傳內(nèi)容后,傳統(tǒng)的視頻網(wǎng)站會(huì)進(jìn)行審核,符合標(biāo)準(zhǔn)后才可上傳成功,而網(wǎng)絡(luò)直播都是實(shí)時(shí)播出的,如果有人在網(wǎng)上傳播不良信息或者發(fā)布違規(guī)內(nèi)容,即使被查處,也是播出之后的事情。 雖然,大多數(shù)直播企業(yè)會(huì)選擇人工審核的方式對(duì)直播內(nèi)容進(jìn)行實(shí)時(shí)監(jiān)管,但是在過(guò)去的一年多里,“直播造人門(mén)”、“直播脫衣門(mén)”等事件仍然頻繁發(fā)生。某直播平臺(tái)負(fù)責(zé)人曾表示,視頻直播從技術(shù)不需要“上傳”這個(gè)步驟,當(dāng)手機(jī)按下攝影功能鍵,云端會(huì)同步抓取、同步存儲(chǔ)、同步傳遞,“延遲不會(huì)超過(guò)2秒”。在這個(gè)過(guò)程中,平臺(tái)面臨的困惑是“無(wú)法掌控直播下一秒會(huì)發(fā)生什么”,所以只能依靠人力進(jìn)行24小時(shí)輪班審核,但是人工審核存在的問(wèn)題較多,直播內(nèi)容監(jiān)管風(fēng)險(xiǎn)依舊存在。 直播內(nèi)容監(jiān)管存在哪些風(fēng)險(xiǎn)? 第一:網(wǎng)絡(luò)直播規(guī)模龐大,人工審核成本高 2015年直播平臺(tái)接近200家,用戶(hù)數(shù)量已經(jīng)達(dá)到2億,大型直播平臺(tái)每日高峰時(shí)間會(huì)有3000-4000千個(gè)直播“房間”同時(shí)在線,用戶(hù)數(shù)可達(dá)兩三百萬(wàn)人次,如果全部用人工對(duì)4000路視頻同時(shí)進(jìn)行審核,為了保證“無(wú)漏網(wǎng)之魚(yú)”,至少需要上百人同時(shí)工作,并且每位工作人員需要配備1-2臺(tái)監(jiān)控設(shè)備。其實(shí)直播視頻內(nèi)容的違規(guī)比例占比不高,僅0.04%,甚至更低,但為了做到“無(wú)漏網(wǎng)之魚(yú)”,企業(yè)需要投入大量的人力、物力和財(cái)力進(jìn)行監(jiān)管,運(yùn)營(yíng)成本壓力增加。 第二:直播流量聚焦夜晚,人工審核效率低 網(wǎng)絡(luò)直播白天跟晚上的“房間數(shù)”不同,目前,白天直播流量峰值是數(shù)百路視頻,晚上可以飆升到數(shù)千路。但“三班倒”的審核人員,夜晚疲勞,人眼識(shí)別精確度降低,出現(xiàn)誤判漏判的概率上漲,審核效率降低,難以達(dá)到網(wǎng)絡(luò)直播的內(nèi)容監(jiān)管需求。 因此,網(wǎng)絡(luò)直播行業(yè)的內(nèi)容監(jiān)管不能只依賴(lài)人工,可以采用機(jī)器識(shí)別結(jié)合人工審核的新型審核模式。 目前,據(jù)我所知的,國(guó)內(nèi)能夠?yàn)榫W(wǎng)絡(luò)直播企業(yè)的違規(guī)內(nèi)容過(guò)濾提供這種模式的主要有圖普科技的“智能審核機(jī)器人”,阿里的“阿里綠網(wǎng)”、騰訊的“萬(wàn)象優(yōu)圖”等。 機(jī)器識(shí)別的工作原理 機(jī)器識(shí)別原理的圖像識(shí)別技術(shù)是如何像人腦一樣認(rèn)識(shí)、學(xué)習(xí)圖像特征的呢?其核心是深度學(xué)習(xí)理論(Deep Learning)。深度學(xué)習(xí)就是人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,以下簡(jiǎn)稱(chēng) ANN)。要了解 ANN,讓我們先來(lái)看看人類(lèi)的大腦是如何工作的。: (人腦的視覺(jué)處理系統(tǒng) via:Simon Thorpe) 上圖所表達(dá)的,就是人理解外界視覺(jué)信息的過(guò)程。 從視網(wǎng)膜(Retina)出發(fā),經(jīng)過(guò)低級(jí)的 V1 區(qū)提取邊 緣特征,到V2 區(qū)的基本形狀或目標(biāo)的局部,再到高層的整個(gè)目標(biāo)(如判定為一張人臉),以及到更高層的 PFC(前額葉皮層)進(jìn)行分類(lèi)判斷等。也就是說(shuō)高層的特征是低層特征的組合, 從低層到高層的特征表達(dá)越來(lái)越抽象和概念化,也即越來(lái)越能表現(xiàn)語(yǔ)義或者意圖。 深度學(xué)習(xí),恰恰就是通過(guò)組合低層特征形成更加抽象的高層特征(或?qū)傩灶?lèi)別)。然后在這些低層次表達(dá)的基礎(chǔ)上,通過(guò)線性或者非線性組合,來(lái)獲得一個(gè)高層次的表達(dá)。此外,不僅圖像存在這個(gè)規(guī)律,聲音也是類(lèi)似的。 現(xiàn)在來(lái)看深度學(xué)習(xí)的簡(jiǎn)易模型。 傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)與深度神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí)的一個(gè)主要優(yōu)勢(shì)在于可以利用海量訓(xùn)練數(shù)據(jù)(即大數(shù)據(jù)),在學(xué)習(xí)的過(guò)程中不斷提高識(shí)別精度,但是仍然對(duì)計(jì)算量有很高的要求。而近年來(lái),得益于計(jì)算機(jī)速度的提升、大規(guī)模集群技術(shù)的興起、GPU 的應(yīng)用以及眾多優(yōu)化算法的出現(xiàn),耗時(shí)數(shù)月的訓(xùn)練過(guò)程可縮短為數(shù)天甚至數(shù)小時(shí),深度學(xué)習(xí)才逐漸可以用于工業(yè)化。 對(duì)于開(kāi)發(fā)團(tuán)隊(duì)來(lái)說(shuō),做該領(lǐng)域的產(chǎn)品困難在于如何獲取大規(guī)模已標(biāo)注數(shù)據(jù)、集成有 GPU 的 計(jì)算集群以及針對(duì)自己的項(xiàng)目調(diào)參數(shù),團(tuán)隊(duì)需要不斷地輸入新數(shù)據(jù),持續(xù)迭代以提高機(jī)器識(shí)別準(zhǔn)確率。 相關(guān)新聞
責(zé)編:梁爽
|
|
來(lái)自: llvsh > 《網(wǎng)絡(luò)》