機器學習技術讓Youtube推薦給使用者的影片觀看率明顯增加。目前YouTube平均每日向使用者推薦2億支影片,涵蓋76種不同語言。在過去三年,使用者在YouTube首頁點擊推薦影片的觀看時間共成長了20倍。此一大幅成長,與YouTube的推薦機制中導入機器學習有關。透過機器學習,Youtube平台加入了不少個人化變項,進而讓神經網路越來越能掌握使用者需要。目前YouTube已有超過70%的使用者觀看時間是來自系統自動推薦的影片。
YouTube大中華與紐澳技術管理負責人葉佳威表示,近年YouTube逐漸將重點指標從觀看次數(Views)轉移到觀看時間(Watchtime),最重要的原因是該公司希望找出對使用者而言最有價值的訊息,而觀看時間會具體呈現出使用者對影片的關注程度,像是使用者是否有將點擊後的影片從頭到尾看完,完整地吸收影片內容,還是看到一半就已跳出視窗。透過點擊率很難看出使用者對影片是否關注。
除此之外,由於目前YouTube帳號大多是以個人名義進行申請,因此很容易發現個人對YouTube影片的喜好差異。葉佳威指出,雖藉由機器學習可以明確計算出哪個影片最受台灣使用者喜愛,例如點擊次數最高、觀看時間最長,但實際上個別使用者對同一支影片的喜好程度或觀感,卻會有很大的不同。因此,Youtube希望自家的影片推薦機制能進一步應對這種個人差異,也就是讓系統能依個人的喜好而推薦不同的影片。
但要做到個人化推薦,勢必會遇到許多挑戰。舉例來說,目前每分鐘約有超過500小時的影音內容被上傳到YouTube,資料量太過龐大,既有的推薦演算法無法處理如此大量的數據資料。有鑑於此,為提供使用者更好的推薦,YouTube近年運用Google TensorFlow機器學習基礎系統,建立了結合候選生成模型以及排名模型,兩個神經網路推薦系統。在候選生成模型上,將數百萬個影音資料縮小分成數百個與使用者相關影音的資料子集。該候選生成模型是為產生更貼近使用者喜好且具新鮮感的結果所設計,因此列入了包括瀏覽歷史、搜尋歷史以及人口變項資訊(如年齡)變項。
而排名模型則會透過提名特徵來下評分訊號的權重,透過多項特徵來排名,包括人口統計資訊(如地理位置)、最受歡迎的影音、使用者和影片所使用的語言、近期觀看紀錄、使用者和該影音頻道的過往連結,並歸類類似的影音,為影音進行評分。透過由該兩個神經網絡所組成的推薦系統,來自YouTube影音資料庫中的數百萬個影片,將在候選生成模型階段,篩選到數百個,以及進一步在排名模型階段,篩選為數十個,並成為最終推薦給使用者的影片。