圖/yapei
文/檸檬
大家有沒有好奇過,當我們打開串流平台要看電視劇或電影時,為什麼它總能神準推薦你喜歡的影片?這背後其實蘊含著豐富的數學原理喔!
數據時代 新統計學
首先,讓我們了解串流平台如何用數學來記錄觀影資料。想像有一個巨大的表格,橫列是全球用戶,直行是串流平台上的所有影片。每個格子都記錄著一個數字:完整看完是1分,看一半是0.5分,快轉或跳過是0分,沒看過則是空白。每個用戶的觀影習慣就變成了一串數字,也就是獨特的「數學指紋」。
用數學語言來說,這就像是一個龐大的「用戶影片矩陣」。如果平台上有1萬部影片,那麼每個用戶就會有一個紀錄為其觀看習慣的「清單」,清單中列出了每部影片的觀影分數。雖然這個清單可能包含非常多的影片,但它就像是一個用戶個人的「喜好地圖」,可以幫助我們找到最適合他們的影片。
串流平台如何找到品味相似的用戶呢?這就要用到數學中的「距離」概念了。假設我們只看兩部電影,就能用平面座標來表示。小明給《魔法學院》4分,《太空冒險》3分,那麼他在平面上的位置就是(4,3);如果小華給這兩部片分別是4分和2.5分,她的位置就是(4,2.5)。兩個點之間的距離愈近,代表兩人的品味愈相似。
這個概念推廣到更多電影時,我們就需要用到「餘弦相似度」。想像兩個用戶的評分就像是兩支指向不同方向的箭,箭之間的夾角愈小,相似度愈高。如果兩個用戶的評分完全一致,夾角就是0度,相似度就是1;如果完全相反,夾角是180度,相似度就是-1。這個數學工具,幫助串流平台快速找出誰與誰的品味相近。
此外,串流平台利用「皮爾森相關係數」這樣的統計工具,計算用戶之間的評分相關性。如果兩個人對相同影片都打了高分或低分,那麼他們的相關係數會接近於1,表示他們的品味相似度非常高。
抽象喜好 轉具體數
更進一步來說,串流平台還使用「機率模型」來預測你會給某部新片幾分。如果有100個與你品味相似的用戶中,有80人給了《新魔法世界》4分以上,15人給了3分,5人給了2分以下,那麼你給高分的機率就是80%。
除了評分,觀看時間、觀看完成率也是重要的數學指標喔。平台會用「觀看完成率」這個比值,來分析影片的受歡迎程度。如果很多人只看了一部影片的前20%就放棄了,這部片的推薦權就會降低。反之,如果許多人一口氣看完,那麼這部片就更可能被推薦給品味相似的用戶。
其實,這些數學原理不只用在串流平台。當你使用YouTube、Instagram或Spotify時,類似數學模型也在背後默默運作。這就是數學魅力,它能將抽象喜好轉換成具體數字,再透過精密計算,為每個人打造專屬推薦。是不是很有趣?