#頭條公開課# 為什么你的內(nèi)容推薦不好?為什么你的流量總是不確定?為什么你的文章推薦到一半就不推薦了?今日頭條推薦機(jī)制大揭秘,帶你全面了解機(jī)器如何主動(dòng)內(nèi)容的。 第一課 1)推薦原理解析 2)一篇文章的推薦歷程 3)推薦中的常見問題 4)如何獲得更高推薦 首先第一個(gè)問題,推薦原理的解析。 推薦系統(tǒng)的本質(zhì)就是從一個(gè)巨大的內(nèi)容池里,給當(dāng)前用戶匹配出最感興趣的幾篇文章。用戶匹配的依據(jù)又是什么呢?有三個(gè)要素,第一個(gè)是內(nèi)容,第二個(gè)是用戶,第三個(gè)是用戶對(duì)內(nèi)容感興趣的程度。 1.系統(tǒng)是怎么理解你的內(nèi)容呢? 系統(tǒng)會(huì)根據(jù)關(guān)鍵詞的識(shí)別,然后把內(nèi)容分為粗分類和細(xì)分領(lǐng)域細(xì)化分類。 通過運(yùn)用內(nèi)容刻化的方式,做關(guān)鍵詞的識(shí)別。怎么去做關(guān)鍵詞的識(shí)別呢?判定關(guān)鍵詞提取的原則有兩個(gè): 原則一高頻詞規(guī)則;原則二獨(dú)特性規(guī)則。像經(jīng)常出現(xiàn)的虛詞,的、地、得、而、對(duì)于、關(guān)于、嗎…… 轉(zhuǎn)折詞有雖然、但是、因?yàn)椤⑺?、可是,這些都不是所能提取的關(guān)鍵詞。 那么,在我們寫文章中怎么做到更好識(shí)別我們的關(guān)鍵詞呢?彭彭老師教給我們?nèi)齻€(gè)小貼士,1、避免使用非常規(guī)詞,2、名人地名用全稱不用縮寫或外號(hào),3、希望在標(biāo)題中最好露出具有代表性的實(shí)體詞。 什么是實(shí)體詞,其實(shí)就是一些名詞和代詞,例如人名,還有公司名稱。這里舉一個(gè)例子,原標(biāo):《流動(dòng)著的舞臺(tái) 街頭中的故事》,優(yōu)化后:《印度就是臟亂差?這組圖片讓你看清印度另一面,與想象中大不同》。標(biāo)題中有印度,圖片, 上面介紹了系統(tǒng)對(duì)內(nèi)容的理解,接下來要講一講系統(tǒng)對(duì)用戶的理解。 2、系統(tǒng)如何猜出用戶的閱讀興趣? 首先要做用戶刻畫,系統(tǒng)會(huì)對(duì)用戶的信息,還有瀏覽過的文章,分析用戶的當(dāng)前身份以及他當(dāng)前的環(huán)境,還有他的狀態(tài)是在旅游還是在干別的,通過這一系列的分析,有可能推測出來這個(gè)用戶可能是一個(gè)正在旅游的男性,還是喜歡足球,汽車等等的分類。 經(jīng)過分類也可稱為用戶的標(biāo)簽,那標(biāo)簽主要分為三大類。一、基本信息。例如,年齡,性別,還有地域;二、行為信息。訂閱賬號(hào),歷史瀏覽的文章,關(guān)注的話題;三、閱讀興趣。閱讀行為,用戶聚類,用戶標(biāo)記。做完了這些,就完成了對(duì)用戶的刻化。 3、系統(tǒng)是怎么精準(zhǔn)的把內(nèi)容推薦給興趣用戶的? 是利用了文章的特征,用戶的特征,還有環(huán)境的特征。擬合一個(gè)用戶對(duì)內(nèi)容滿意度的函數(shù),每一篇文章的點(diǎn)擊概率幾十萬上百萬的實(shí)力,將所有的文章按照由高到低的排序,前十名的文章會(huì)在此時(shí)脫穎而出。介紹了推薦系統(tǒng),創(chuàng)作者比較關(guān)心的角度,就是從一個(gè)文章在推薦系統(tǒng)里的生命周期。 第二個(gè)問題,一篇文章的推薦歷程。 我們寫完一篇文章,或者拍完一個(gè)視頻就會(huì)生成一個(gè)內(nèi)容,這個(gè)內(nèi)容就會(huì)經(jīng)歷以下一些步驟:1,文章推薦之旅。首先內(nèi)容要通過審核,然后加權(quán)推薦,暴露幾千個(gè)用戶,這個(gè)環(huán)節(jié)稱之為冷啟動(dòng),冷啟動(dòng)完成了以后,會(huì)對(duì)文章正常推薦,在這一過程中文章就會(huì)被展示出來。平臺(tái)不斷地搜集到用戶的反饋。例如用戶的點(diǎn)擊,評(píng)論還有舉報(bào),基于這些用戶的行為,就會(huì)進(jìn)而觸發(fā)平臺(tái)的復(fù)審流程。復(fù)審會(huì)直接影響推薦文章的后續(xù)推薦。 先來介紹一下內(nèi)容的審核流程,也就是初審,初審的目的在于判斷文章有沒有違反國家相關(guān)法律的風(fēng)險(xiǎn)。內(nèi)容經(jīng)過機(jī)器審核和人工審核以非??斓乃俣韧ㄟ^初審。從而以及展現(xiàn)在讀者的面前,冷啟動(dòng)的過程是一個(gè)新概念,文章在發(fā)表之后就如何還取最初的幾千個(gè)展現(xiàn),都知道新的文章發(fā)表之后和之前那些已經(jīng)在平臺(tái)上的文章相比,具有一定的劣勢,現(xiàn)在還是冷文章,大部分可能火不起來,這里就存在著矛盾,如果不把文章展現(xiàn)給用戶,不知道這篇文章將來會(huì)不會(huì)火起來,因此,對(duì)于所有的新信息,會(huì)做一個(gè)加權(quán)推薦。 所有的新信息完成之后,文章會(huì)展現(xiàn)給用戶,就可以判斷哪些人喜歡這篇文章,哪些人不喜歡這篇文章,在文章有幾千次的點(diǎn)擊和分享,點(diǎn)贊時(shí),就會(huì)撤銷對(duì)這篇文章的加權(quán),這個(gè)文章后續(xù)能不能再被推出來?就靠這篇文章本身的創(chuàng)作實(shí)力了。 那么接下來再講一下正常推薦的流程。正常推薦的流程通過了冷啟動(dòng)階段的文章,平臺(tái)會(huì)收集到了最基礎(chǔ)的推薦效果,如果一篇文章推薦效果很好,自己過的擴(kuò)量,會(huì)認(rèn)為這篇文章很有潛質(zhì),進(jìn)一步擴(kuò)展到更多用戶面前。 可能是一萬個(gè),三萬個(gè),五萬個(gè)甚至更多,如果一篇文章的閱讀興趣不是特別大,推薦表現(xiàn)各種各樣的用戶行為,系統(tǒng)會(huì)檢測的到很多數(shù)據(jù)上的異常,同時(shí)負(fù)面評(píng)論與舉報(bào)有特別多的現(xiàn)象,這篇文章會(huì)再次進(jìn)入審核流程。也就是復(fù)審。如果發(fā)現(xiàn)文章存在標(biāo)題黨,虛假的,低俗的這些問題,系統(tǒng)會(huì)停止這篇文章的推薦。 上面講了頭條是如何被推薦到用戶的過程,以及在平臺(tái)內(nèi)經(jīng)歷的審核與推薦的全過程。下面講講文章推薦中常見的的問題。 為什么推薦流量不穩(wěn)定?為什么推薦效果不好?為什么推薦到一半就不推薦了?聽彭彭老師為大家解答。 可能是因?yàn)樽髡咭膊恢酪韵聨讉€(gè)原因,有些可能會(huì)問同樣一個(gè)熱點(diǎn)的文章,題材,風(fēng)格都差不多,為什么有的文章幾百萬的展現(xiàn),有的只有幾千次的展現(xiàn),那是因?yàn)槲恼孪夭呗?,用戶的閱讀體驗(yàn),優(yōu)先推動(dòng)其中的原創(chuàng)文章。 那么一定會(huì)問,怎么做才能避免消重策略呢?有三個(gè)小貼士,第一個(gè)是希望大家堅(jiān)持做優(yōu)質(zhì)的原創(chuàng),不要作低質(zhì)內(nèi)容的無用功。頭條整體對(duì)低質(zhì)內(nèi)容的識(shí)別手段和打壓手段正在不斷的進(jìn)化,低質(zhì)內(nèi)容的生存空間必將越來越窄。第二希望大家面對(duì)熱點(diǎn)內(nèi)容的時(shí)候,謹(jǐn)慎的去追逐,三,希望大家撰寫的文章可以帶有鮮明的個(gè)人特色。 第二個(gè)原因就是同類文章的擠壓,針對(duì)同一個(gè)熱點(diǎn)內(nèi)容,頭條的推薦系統(tǒng)會(huì)從中選取一篇最適合的推送給用戶。也就是說,每篇文章的推薦量,既取決于當(dāng)時(shí)具體的環(huán)境,也取決于當(dāng)時(shí)整個(gè)內(nèi)容池里面其他文章的表現(xiàn)。 一篇文章的推薦效果和這篇文章的本身質(zhì)量也會(huì)有很大的相關(guān)性,如果一篇文章推薦不好,很有可能是以下幾個(gè)原因?qū)е碌模紫瓤赡苁沁@個(gè)作者的創(chuàng)作內(nèi)容質(zhì)量不穩(wěn)定,系統(tǒng)會(huì)對(duì)作者的創(chuàng)作能力進(jìn)行評(píng)估,如果文章的質(zhì)量不穩(wěn)定,就會(huì)導(dǎo)致無法很好的評(píng)估作者的創(chuàng)作能力,會(huì)影響這篇文章最終的推薦效果, 還有一個(gè)原因就是創(chuàng)作了內(nèi)容不垂直,作者的專業(yè)創(chuàng)業(yè)度不夠,如果作者經(jīng)常換領(lǐng)域,對(duì)作者的創(chuàng)作能力評(píng)估有影響。繼而影響文章的推薦。 第三個(gè)原因是文章的用戶受眾特別小,如果文章是小眾領(lǐng)域,例如動(dòng)漫性的文章,還有實(shí)效性時(shí)間短,例如體育賽事的文章。 文章推薦一半就不推薦了,那是為什么呢?可能是因?yàn)槲恼鲁霈F(xiàn)了指標(biāo)問題,比如點(diǎn)擊率非常高,但是負(fù)面評(píng)論也特別多,這樣的情況下文章會(huì)進(jìn)入復(fù)審的流程。復(fù)審的過程中會(huì)對(duì)文章的嚴(yán)格的把控有三個(gè)原因:標(biāo)題黨,夸張故意營造懸念,無中生有,有趨勢引導(dǎo)都無法通過審核。封面黨,低俗,封面不清晰,有低俗的描繪。虛假,文章違背科學(xué)常理描述,與證實(shí)已發(fā)生的事實(shí)相悖,會(huì)認(rèn)為是虛假的內(nèi)容。包含推廣信息,當(dāng)中含有二維碼,手機(jī)號(hào),連接都會(huì)通不過的審核。 還有一些其他的因素也會(huì)影響文章的推薦,比如在冷啟動(dòng)時(shí)效果差,系統(tǒng)就不會(huì)接下來推薦給其他用戶。能啟動(dòng)時(shí),文章首先推薦給粉絲,效果不大,也會(huì)的影響推薦量。有比如熱點(diǎn)文章,當(dāng)前的熱點(diǎn)已經(jīng)過時(shí),對(duì)應(yīng)的受眾就會(huì)減少自然。那么么,推薦量也不會(huì)高。 彭彭老師最后還希望大家可以面對(duì)用戶的需要去寫一些高質(zhì)量的文章,注重內(nèi)容的指導(dǎo)作用,用戶非常注重文章的內(nèi)容價(jià)值,很喜歡那些視角新穎,觀點(diǎn)鮮明有深度的文章,可以讓用戶學(xué)到新的知識(shí),會(huì)有一定的資源傾斜,可以獲得更多的推薦量。 |
|