te
览潮网> 生活>生活主张> 你知道吗?每个视频推荐背后都是属于你的专属定制

你知道吗?每个视频推荐背后都是属于你的专属定制

 

1

Netflix作为一家视频媒体平台,拥有着以亿计的用户,和成千上万的影片,个性化地为每位用户及时推荐最符合他们口味的影片就显得十分关键。

其实,需要关注的不仅仅是如何针对每位用户推荐不同类别的影片。还有,为什么用户会关注所推荐的某部影片?如何能让用户对一个陌生、全新的影片名感兴趣?如何说服用户觉得某部影片值得去看?解答这些问题对于帮助用户在一堆陌生的影片名中发现好的、喜欢的影片来说是至关重要的。

要解决这一问题,一种方法是在描绘影片的配图下功夫。一部影片的配图有某些吸引你的地方,这张图片就是让你想要了解影片背后故事的最直接途径,可以称为视觉“证据”。这张配图中也许有一个你认识的演员,也许描绘了像是飚车这样令人激动的画面,也可能是传达着电影或是电视剧核心的戏剧性的画面。如果我们把这张精彩绝伦的配图展示在主页,一张图胜过千行字,也许,你会打开看一看。这就是Netflix和其他传统媒体在提供影视资讯上的另一个不同: 没有用传统的影片推荐列表,而是为全球过亿的用户提供他们每个人自己的个性化影片推荐和视觉资料。

 

2

 

没有配图的Netflix主页。这是之前推荐系统的算法所生成的主页。

在之前的文章中,我们探讨过使用多臂赌博机问题(Multi-armed bandit problem)的算法,可以为针对所有的用户为每部影片配置恰当的图片。比如,可以为影片《怪奇物语》(Stranger Things)寻找最大范围获得用户获取播放量的最佳配图。然而,不同用户之间品位和喜好存在着巨大差异,如果能够为每位用户找到最吸引他们的配图去放大影片中最可能让他们感兴趣的元素,是否会获得更高的播放量?

3

 

《怪奇物语》在个性化算法中超过5%展现次数的配图。不同配图包含着剧情发展中的不同主题的信息,并且这些信息无法通过任何单独一张图片去呈现。

以这个问题为启发,来探究一下在什么情境下配图的个性化设置会有意义。假设每个用户有自己的观影记录,左侧是某个用户过去曾看过的三部影片,箭头指向右侧,是我们针对这位用户推荐某个影片时所使用的配图。

设想一下为《心灵捕手》(Good Will Hunting)配图,应如何为不同的用户选择不同的图片?我们可以根据用户对电影主题和种类的喜好去选择图片。例如,给一个看过很多爱情片的人展示包含马特•达蒙(Matt Damon)和明妮•德里弗(Minnie Driver)一起的剧照也许会让他对《心灵捕手》感兴趣。而一个看过很多喜剧片的人如果看到有著名喜剧演员罗宾•威廉姆斯(Robin Williams)的剧照时,也许会想去看这部电影。

4

 

设想当我们为《低俗小说》(Pulp Fiction)这部电影设置个性化配图时,不同用户对于影片主演的喜好会如何影响我们对于图片的选择?一个用户是乌玛•瑟曼(Uma Thurman)的粉丝,那么为他推荐《低俗小说》时如果配上乌玛的剧照,他就很可能选择点开去看。同理,对于一个看了很多约翰•特拉沃尔塔(John Travolta)的电影的用户来说,《低俗小说》这部电影配上约翰的剧照就会更有吸引力。

5

 

当然,并非所有情境下个性化配图的选择都是如此清晰的。所以与其一一列举这些人为制定的规则,不如让数据说话,告诉我们如何去选择配图。

总的来说,配图的个性化设计要提升用户的使用体验,让每部影片在不同用户前呈现出最好的第一印象。

挑战

传统的推荐系统可以让我们为每位用户展示多个选项,从而根据每个人的最终选择来了解他们的喜好。个性化方面的新尝试自然也有新的挑战。其中一个就是只能为每部电影选择一张配图去诠释它。这意味着个性化配图的选择是一个死循环的问题: 一个用户选择播放某部影片时,他只看到了展示给他的那一张配图。而我们需要知道:什么时候用户对影片的选择(看或不看)会受配图的影响,而什么时候又不会受影响。因此个性化配图的选择问题在传统推荐问题的顶端,中间的算法必须协同解决这个问题。

另一个挑战是去了解当给一个用户推荐某部影片时变换展示多张配图会有怎样的影响。配图的变换是否会使影片的辨识度降低,让用户很难再次从视觉上认出这部影片,比如,用户之前看到某张配图觉得有意思,但还没来得及去看。或是,变换成另一张更有吸引力的配图使得用户重新考虑了这部影片。变化的配图也给问题的归因带来挑战,因为很难知道究竟是哪张配图使得用户对影片产生的兴趣

接下来的挑战就是理解同一页或同一板块所展示的不同影片配图之间相互产生的影响。也许用主角英勇的特写镜头作为影片配图很合适是因为其在众多图片中格外引人注目。但是如果所有的电影都是这样的配图,那整个页面可能就不会很吸引人。因此,我们需要做出多样化的选择,强调不同用户对于影片的不同的兴趣点,使其效果互补。

另一个挑战是,需要为每部影片准备一个图片集来达到有效的个性化设置。这意味着每张图片都是能够吸引人的、有一定信息量的,并有代表性的而不是“标题党”。每部影片的图片之间也需要有足够大的差异去吸引有着不同喜好兴趣的潜在观众。归根结底,一张配图的有效性和信息量其实取决于看到的不同的人。因此我们不仅需要配图突出同一电影中的不同主题,还得突出不同的审美。

最后的难题是在如何技术上进行大规模的个性化配图。一个挑战需要大量的图像,来为不同作品进行个性配图,服务器要处理峰值每秒超两千万的低延时请求。要求系统必须是稳定的:不能快速完整地显示出这些配图会很大程度上降低用户体验。个性化算法也需要在新片上映时快速响应,即便是在一无所知的情况下也要能快速学习。在此之后,算法需要不断适应,因为配图的效果要随影片的生命周期和观众口味的变化而不断地变化。

“上下文老虎机”方法

Netflix大部分的推荐机制都是采用机器学习的算法。传统方式会收集一组用户如何使用我们服务的数据,然后在这组数据上采用一种新的机器学习算法。接下来通过A/B测试的方式测试这个算法与当前的系统进行比较。A/B 测试通过一组随机的用户数据去测试新的算法是否比当前的系统更好。A组成员得到通过现有系统生成的图片,B组得到新算法所生成的图片。如果B组的用户在Netflix有更高的转化率,那我们就会把这个新的算法推广到整个客户群。但是,这种方式会产生损失(Regret):比如,许多用户在很长一段时间内无法得到这种更好的用户体验。

下图展示了这一过程:

6

 

 

为了降低损失(Regret),选择在线机器学习。针对配图的个性化定制,采用“上下文老虎机”(contextual bandits)的线上学习框架。相比于以前等着收集一整批次的数据,等着学习模型,等着一个A/B测试来得出结论,“上下文老虎机”能针对每个用户和情境能够快速地找出最优的个性化配图来进行选择。简要地说,“上下文老虎机”是一类在线学习算法,这类算法通过在一个变化的情况下不断将所学模型应用到每个用户情景中,来平衡收集足够的数据去学习一个无偏模型的损失。在之前非个性化的图片筛选框架中,用的是“非上下文情境的老虎机”(non-contextual bandits),这种方法在寻找最佳配图时不考虑上下文情境。而对于个性化来说,用户就是上下文情境,我们期望不同的用户对配图有不同的回应。

“上下文老虎机”的一个重要属性是能将损失(Regret)最小化,通过在学习模型的预测中注入受控的随机化变量而获得的。一个影片的所有备选配图数量和系统部署到的用户总体大小决定了数据探索策略的选择。有了这样的探索,我们需要记录关于每个配图选择的随机化的信息。这个记录允许我们修正偏斜的选择倾向,从而如下所述,用不偏倚的方式执行离线模型评估。

线上探索方案中,获得的训练数据集记录了对于每个(用户,影片名,图片)元组,对应的影片是否被播放。另外,还能够控制数据探索使得配图筛选结果不要改变得太频繁。这可以使特定的配图与用户是否播放影片之间的归因变得清晰,还可以避免学习的模型推荐了“标题党”图片。

图片筛选

对一个用户最佳配图的设置问题其实是在一个影片的可选图片池中找到最佳图片的筛选问题。一旦模型像上面说的那样训练完成了,我们要用它对每个上下文情境中的图片进行排序。模型预测了在情境中一个给定用户看到一张给定图片后的影片播放概率。我们用这些概率对这套备选图片进行排序,然后选出概率最高的那个。那就是我们展示给那个特定用户的配图。

模型表现评估

线下

在模型上线部署于真正的用户之前我们需要对“上下文老虎机”算法(contextual bandit algorithms)进行评估,我们可以用一个叫做重播(replay)的线下评估方法[1]。这个方法允许我们根据记录的探索数据回答反事实问题(图表1)。换句话说,我们能够在线下比较:如果我们无偏地使用不同的算法,在不同情况下的历史场景中会发生什么。

7

 

图表1:一个简单的例子,根据记录的数据计算了重播测试的指标。对于每一个用户,出现了一张随机的图片(第一行)。系统记录了该次展示以及用户是否播放了这个影片(绿色圈代表播放,红色圈代表没有播放)。一个新模型的重播测试指标是通过匹配找到随机安排和模型安排一致的用户(黑色方块)并计算这些用户中的图片采纳率得来的。

重播测试(Replay)使我们能够看到,如果我们假设展示的图片是用新的算法而不是已使用的算法得出时,用户是如何反馈的。对于图片来说,我们对几个指标感兴趣,尤其是之前描述的采纳率。图表2展示了“上下文老虎机”方法相对于随机选择或非“上下文老虎机”如何帮助提高目录中的平均采纳率。

8

 

图表2:对于不同算法,基于重播记录的图片探索数据的平均图片采纳率(越高越好)。随机方法(绿色)随机选择一张图片。简单老虎机算法(黄色)选择最高采纳率的图片。“上下文老虎机算法”(蓝色和粉色)根据上下文为不同用户选择不同的图片。

 

9

图表3:基于用户类型做的上下文图片筛选案例。“喜剧”针对的是大多看喜剧的用户。相类似地,“浪漫”用户大多看浪漫爱情主题,“上下文老虎机”为倾向于喜剧的用户选择了Robin Williams(一个著名的喜剧演员)的图片,同时为倾向于浪漫爱情剧的用户选择了一张在接吻的情侣的图片。

线上

在线下实验了这么多不同的模型,并且发现了一些在重播测试(Replay)时有明显提升的模型之后,我们最终进行了一个A/B测试来比较最可靠的个性化上下文老虎机和非个性化老虎机算法的效果。正如我们猜想的,个性化起作用了,并且在我们的核心指标上表现出了显著的提升。我们还看到在线下重播测试时监测的数据和在线上模型观测到的数据间有合理的相关性。线上的结果还产生了一些有趣的发现。比如说,在那些对影片名没有过先前互动的用户身上,个性化的提升效果更大。这是合理的,因为我们会期望配图的展示对于那些不太熟悉这个影片名的用户来说更为重要。

结论

利用这个方法,我们已经在针对影片推荐和各项服务的个性化配图筛选上迈出了第一步。这为我们的用户发现新内容带来了一个有意义的进步,所以我们已经将这一服务开放给了每一个人!这个项目是不仅关注推荐内容还关注推荐给用户的方式的第一个案例。但是实际上还有许多机会可以去拓展和提升这个还处于初级阶段的方法。这些机会包括:开发尽可能快速启动的进行新图片和新影片的个性化处理算法,例如通过使用计算机视觉技术;扩展模型应用于其他类型的配图或其他影片描述上(比如影片梗概,诠释资料和预告片)。还有一个更加宽泛的问题:帮助艺术家和设计师找到应该加入什么样的元素以使得一个影片描述更加吸引人和个性化

责任编辑:林丽斌
0

一周热门