河南11选5技巧:解讀優酷土豆的大數據工程

閱讀  ·  發布日期 2019-03-11 10:22  ·  adminzcy
每個去視頻網站看過視頻的用戶,都知道,在看完一個視頻之后,會有相關的視頻推薦,這個不足為奇的功能,就是大數據的體現,視頻行業在不留意間早就成為了大數據的弄潮者。

河南11选5开奖号码 www.ntaee.icu 琢磨用戶喜歡什么樣的視頻,提高尋找內容的效率,這是大數據在視頻行業應用的一個小小案例,本期《數讀》聚焦視頻行業,看大數據在視頻中的數字游戲。優酷土豆集團CTO姚健向我們娓娓道來優酷土豆在大數據上的實踐。

推薦視頻:看上去簡單的高深應用

姚鍵是優酷土豆集團CTO,據他介紹,優酷新上線的首頁頁面上,光是導航欄上的視頻分類就有21個,21個不同類型的內容,這意味著會有各種不同的用戶來優酷看視頻,要想給不同的用戶推薦他們喜歡的視頻,這靠的是一個叫做“協同過濾推薦”的技術。

百度百科上這樣介紹協同過濾推薦(Collaborative Filtering recommendation):“是在信息過濾和信息系統中正迅速成為一項很受歡迎的技術。與傳統的基于內容過濾直接分析內容進行推薦不同,協同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價,形成系統對該指定用戶對此信息的喜好程度預測。”

這是亞馬遜、谷歌等互聯網巨頭都在使用的技術。亞馬遜會告訴你“買了A商品的顧客也同時購買了B商品”,Youtube上,一個視頻播放結束,馬上就會出現相關推薦視頻。

看上去簡單的相關推薦,其實在優酷的視頻推薦中涉及上百個參數,每次要調整參數,都要手動調整十幾甚至幾十個參數,每天推薦視頻的數據模型中要涉及的數據高達幾十億。

一次小小的參數調整,帶來的后果,可能是當天視頻觀看帶來幾百萬的增長,也可能是在算法穩定后的未來幾周,甚至幾個月帶來視頻觀看量的曲線變化。

當然,數字證實,通過這種協同過濾推薦給用戶的視頻是靠譜的,因為在海量的視頻中尋找自己喜歡的視頻成本是很高的,推薦視頻的打開率也令人滿意。

優酷土豆心中的“大數據”

數據的挖掘、分析,用在推薦視頻上,還只是個小意思。優酷在2010年推出的“優酷指數”把大數據精神進一步強化,把視頻播放周期、用戶核心特征、用戶播放行為、視頻熱度排行等數據進行展示。

姚鍵這樣介紹優酷指數誕生的背景:“2010年的時候,優酷在PC互聯網時代已經成為最有影響力的視頻網站,優酷希望能夠在行業內樹立一個標桿,在強化優酷品牌的同時,也打造優酷指數這樣一個概念。”

今年,優酷指數進而演變成“中國網絡視頻指數”,加入了土豆網以及移動客戶端的視頻數據,對數字感興趣的用戶,可以從這個指數里讀出很多內容。

作為一款平臺化的產品,“中國網絡視頻指數”在優酷土豆集團中的參考價值無處不在,從廣告售賣,到版權購買,再到播放器產品的優化,等等,處處都能夠作為指導依據。

據姚鍵透露,優酷土豆集團推出的數據報告給節目制作方、影視劇公司、第三方分析機構等了解視頻節目的播放信息,以及觀眾人群的分析提供了依據;在廣告銷售方面,能夠為廣告主呈現出用戶行為特征,提供廣告投放價值的分析;在進行版權購買的時候,可以根據指數的走向來幫助決策;公司內部,哪怕是播放器產品的用戶體驗優化,都可以查看數據分析結果,查看按鈕的擺放和使用頻率等。

這些價值都是顯而易見的,還有我們在表面看不到的,通過數據分析的結果來指導優酷土豆集團的自制內容。

“比如說優酷有很多自制的內容,有很多的微電影、綜藝節目等等,這些播放數據可以顯示出哪些題材是用戶喜歡的,用戶看到哪里就看不下去了,在哪里是拖放觀看的,一系列的用戶行為可以清晰地告訴內容制作人員,應該怎么去剪輯視頻,怎么去選擇內容題材。”姚鍵說。

其實這個過程也是對視頻質量進行分析的過程,在優酷土豆的搜索、推薦中按照視頻質量進行排序,反過來也提高了推薦成功率。

然而,大數據讀出的數據,其指導意義還遠不止此。

每部電影、電視劇在播出后都會有對應的數據,哪些演員受歡迎,哪些題材受追捧,通過分析數據就可以慢慢發現背后的原因,把這個受歡迎的故事講出來,這就是可見的未來。