找回密码
 立即注册
搜索
查看: 201|回复: 0

外卖场景交互式推荐架构与策略:挑战与解决方案详解

[复制链接]

2万

主题

0

回帖

6万

积分

管理员

积分
63359
发表于 2024-12-2 15:33:12 | 显示全部楼层 |阅读模式
用户在外卖场景中的停留时长低于传统电商,对用户实时需求的了解和反馈有更高的要求。针对业务问题,外卖推荐团队从2021年开始持续投入,终于摸索出了一套适合外卖场景的交互推荐架构和策略,并取得了不错的回报。下面将详细介绍外卖首页 Feed 构建交互推荐时遇到的挑战和解决方案。

2. 问题与挑战

三、主要工作

四、总结与展望

5.本文作者

6. 参考文献

七、招聘信息

1. 背景 1.1 什么是互动推荐?

交互式推荐是一种交互式实时产品推荐模块,主要了解用户需求,以交互的方式进行推荐。交互式推荐于2018年被提出[1],主要用于解决推荐系统[2]的延迟以及与用户交互弱的问题。

从2021年下半年开始,美团外卖推荐技术团队将继续在外卖首页Feed上进行探索,并将于2022年上半年完成全卷。具体流程如视频1所示:用户进入外卖首页Feed后,商户详情页从首页feed退出后,新的推荐内容会动态插入到用户的推荐列表中。其主要优点是根据用户的实时需求动态插卡进行反馈,从而提升用户体验。

视频1 外卖首页的互动推荐表

1.2 为什么需要交互式推荐?

我们发现,外卖首页Feed在捕捉和反馈用户的切身兴趣方面存在痛点,“对比”用户的购买效率和体验较差。外卖首页的Feed是通用用户的主要购买场景之一。用户在浏览订单流程时,通常需要进行一些比较,逐渐收敛自己的意图,然后做出最终决定。

但受限于长列表的翻页方式,首页Feed缺乏根据用户需求实时调整推荐结果的能力。具体来说,有些用户的浏览深度小于一页,推荐系统没有额外的机会根据用户的兴趣调整推荐结果。虽然另一组用户的浏览深度较深,但推荐系统需要等到页面翻过之后才能重新理解用户的意图,实时性不足。

业界针对此类问题优化的主要产品形态包括交互推荐、动态翻页、端重排等。由于交互推荐插入在用户可视范围内,用户感知强;后两种主流形式在用户看不见的地方更新推荐,用户感知相对较弱。事实上,这三种形式在美团外卖都已经尝试过。本文重点介绍交互式推荐。

2. 问题与挑战

我们在外卖场景构建交互推荐时,主要面临以下困难和挑战:

本文将从以上四个方面详细介绍外卖首页从0到1构建互动推荐的整个过程,以及针对上述问题的解决方案。

3. 主要工作 3.1 互动推荐框架

3.1.1 整体链接

如上所述,要实现交互式推荐,构建一个基于适合外卖的终端智能框架的推荐系统非常重要。建设思路可以概括为“4W1H”:

基于我们对上述问题的思考和讨论,最终我们联合产品、终端智能、客户端、应用服务、推荐工程等多个相关团队共同构建了这套适合外卖首页 Feed 的交互推荐链接。

图1 互动推荐整体链接

上图1展示了从“用户点击首页的Feed商户卡”到互动推荐卡展示的整个流程。用户进入点餐页面后,客户端调用智能意图理解引擎;满足交互式推荐的要求触发条件后,对特征进行处理、计算和存储,并将计算出的特征传递给客户端组装推荐请求;推荐请求从应用服务层透传到混合服务,然后由混合服务调用商家推荐模块。召回、排序、机制、披露阶段,最后将结果返回给客户端展示。

3.1.2 产品形态

文章开头的视频1是我们最终的线上形式(在用户点击商户的下方插入单张商户卡片),但在此之前,我们对互动推荐的卡片形式和交互逻辑进行了多轮尝试。

视频2 互动推荐双商户卡展示样式

在观察不同产品形态的效果差异时,我们重点关注插入互动卡对首页 Feed 千人交易额的影响。实验数据如下表所示:

其中,=交易用户数/曝光数。

在探索过程中,我们也迭代了以下三点认识:

图2 转化漏斗:多商户聚合卡转化漏斗(左)、单商户卡转化漏斗(右) 3.2 评估方法及评估指标

互动推荐的目标是提高首页Feed的整体购物效率,从而改善用户体验。评估其收入的核心指标是首页Feed的整体转化效率。但交互式推荐存在触发策略限制(详见3.3节),且流量占比较低。同时,它们对主页提要的用户订单产生“拥挤”效应。只有大幅提升互动卡的购买效率,才能撬动首页 Feed 的整体效率。因此,仅仅观察首页Feed的整体效率并不能指导日常互动推荐策略的迭代和效果分析。需要更直接、更有信心的指标来衡量“什么是好的交互推荐算法”。

我们评估交互式推荐算法,主要考虑两个维度:



为了配合上述两个维度的评估,我们引入了“曝光页数占比”和“同位置订单增量”来衡量互动推荐对首页Feed曝光的影响。

评价覆盖率的常用指标是曝光量和曝光比例。但互动推荐卡插入后,会改变首页Feed的曝光率,直接计算其在首页Feed上的曝光率是不合理的。因此,我们将统计曝光量的维度从“量”改为“页数”,通过计算互动卡片曝光页数占首页曝光页数的比例来评估卡片覆盖率。

观察Page比例(以下简称“曝光页面Page比例”),可以方便评估互动推荐覆盖率与其理论上限的差异。如果每次用户点击主页 Feed 上的商户时都会触发并显示互动商户卡,则曝光 Page 比例与主页 Feed 的 Page CTR(曝光点击率)相同。因此,结合首页Feed的Page CTR,我们可以观察互动推荐覆盖率与其理论上限的差距,以便我们不断优化并逼近上限。曝光页面比例对同一页面上的多个触发不敏感。因此,我们引入了互动卡曝光PV比(互动卡曝光与首页Feed曝光的比例)、曝光UV(互动卡曝光的用户与首页Feed曝光的比例)辅助观察影响在主页提要上。

评价匹配度,常用的指标是曝光到订单的转化率。我们认为,通过交互式推荐插入的商家应该比上下文中的其他商家更与用户当前的兴趣相关。因此,最直观的指标就是比较首页Feed上的互动卡片和其他卡片的转化率。但比较这两类卡会出现三个偏差:

以上三个偏差使得互动卡的转化率自然高于主页 feed 上的其他卡。因此,单纯比较主页 feed 上的互动卡片与普通卡片的差异并不能正确评估互动推荐本身的价值。互动推荐的产品特点就是将首页反馈中原本暴露的卡片按顺序进行挤压。因此,只有当互动推荐卡的转化率高于原来在该位置的卡的转化率(即后来被挤进互动卡的下一张卡时),互动推荐才能产生正向的效果。影响。

基于此,我们用“与同一请求内的下一个自然商家的预估转化率的相对差异”(以下简称与下一个自然商家的相对差异)来衡量推荐卡的匹配程度。 “同一请求”解决人群偏差问题,“下一个位置”缓解位置偏差问题,“自然商户”解决资源类型偏差问题。

此外,扩大覆盖范围通常会导致匹配度下降。为了平衡这两个指标,我们引入“相对次差倍互动卡曝光”作为策略迭代的辅助观察指标。其物理意义是插入交互式卡片被推下和原卡片被挤压后在该位置产生的预期订单数的增量(以下简称“同一位置的订单增量”)。

3.3 理解用户意图

交互推荐是由推荐系统感知用户的“交互”而触发的。其理解用户意图的过程主要包括两个阶段:1)用户对推荐系统的哪些行为可以触发交互推荐; 2)当交互推荐被触发时,用户的直接意图是什么。下面就围绕这两部分进行讲解。

图3 用户意图理解引擎

3.3.1 首次触发策略

为了探究不同触发时机对互动卡“相对下差值”、“曝光页面比例”等指标的影响,我们尝试了添加购物车、点击菜品、停留时间(10s/5s/2s) /进入商店后立即触发并等待时机。实验表明,放宽触发条件会增加交互推荐在没有信心的情况下被触发的风险,导致交互卡的效率下降。但会增加互动卡牌的曝光度,覆盖更多用户,有利于后续策略迭代。最终我们采用了“用户从首页feed进入商店后立即触发”的第一种触发策略。

3.3.2 连续触发策略

由于无法确定用户在商户详情页面停留的时间长短,而且技术上也不可能在用户返回列表的瞬间就请求推荐服务并显示结果,因此,当用户在浏览商户详情时页面中,系统需要连续多次向服务器请求推荐。因此,用户在商户详情页面停留的时间越长,需求越清晰,服务器端的推荐结果就越准确。因此,我们采用“持续触发策略”,即随着用户在商店停留时间的增加,或者用户产生新的菜单点击或额外购买,客户端会向后端服务连续多次请求更新推荐结果。 。

3.3.3 了解用户实时需求

如何通过终端智能更好地理解用户意图[3-4]是我们关注的焦点。与服务器端相比,端用户的特征主要有以下两个特征:

因此,借助终端智能能力,我们不再受首页feed的分页请求更新机制的限制。我们可以根据用户行为更好地了解用户需求,做出实时智能决策来更新推荐结果,缓解反馈信号感知延迟问题。

用户在商店点击商户卡后的主要行为可以帮助我们更好地了解用户的实时需求。图4(a)展示了一些店内行为,图4(b)分析了一些不同的行为来比较和查看商家介绍行为。用户当日订单完成率(当日订单完成率的定义:用户当天在商户发生的某种行为,与该自然日内外卖订单的差异)表明有不同行为下用户的需求存在明显差异。

图4(a) 店内用户主要行为

图4(b) 店内用户“查看评论”主要行为对比及当日下单率差异

3.4 推荐的排序策略

主页提要一次显示整个列表,而交互式推荐一次仅显示一张商户卡。为了推荐更精准的结果,需要交互式推荐,更准确地了解用户的实时外卖需求。因此,我们在首页Feed推荐环节的基础上,优化了“召回->排序->机制->披露”环节,覆盖更多用户,同时不断提高互动推荐与用户兴趣的匹配度。 。

3.4.1 召回

召回阶段分为两个步骤(如下图5所示):

图5 召回阶段流程图

首先,一方面,我们直接复用首页Feed推荐的召回链接,集成双塔召回[5]、召回[6]、热销召回等多种召回算法。另一方面,为了增强对用户即时意图的理解和关注,我们新增了多重旁路召回。

具体做法是:我们将用户在首页Feed上点击购买的POI作为召回,召回更多符合用户即时意向的商家。每个用户数量不同,每个召回商户数量也不同,数量满足N/M(N为I2I Multi-召回的POI总数,M为数量)。

其次,用户最近点击的商家可以帮助我们更好地了解用户的即时意图。考虑到外卖场景中“比较”用户的特点,为了给用户提供更好的体验,我们提出了“同叶类”策略:限制曝光的互动卡商户必须与外卖同叶类。触发商家(反映了商家的口味,和主菜一样,比如烤串、鸡肉卷等。但是这种方案会带来2个问题:

因此,我们参考现有的商户品类定义,考虑商户品味、消费者相似度、商户包含的产品品类分布等维度,通过聚类的方法重新定义相似品类进行互动推荐。具体来说,我们将大约 200 个细粒度类别定义为大约 70 个粗粒度类别。在满足“比较”用户需求的同时,我们也给更多用户带来了新颖性和多样性。经验。

我们提出的策略不仅显着提高了互动卡片曝光页面的比例,而且相比下一个差异也显着改善。具体效果见下表:

3.4.2 排序

在排序阶段,模型的主要任务是预测CTR和CXR(曝光转化率),并将预测结果传递给机制阶段。

在优化交互式推荐的排序模型时,我们主要面临样本分布差异和训练样本较少的问题。互动推荐的单商户卡形式与首页 Feed 的列表形式存在天然差异,导致样本分布(如点击率、转化率、人群分布)明显不一致。直接使用首页 feed 的推荐模型缺乏交互推荐的需求。场景个性化关注的效果会明显减弱。简单的做法是直接使用交互式推荐样本来训练模型,但交互式推荐单场景样本较少,会导致模型鲁棒性不足。

因此,我们选择了业界通用的Fine-tune方法,基于首页Feed排序模型,并使用了交互式推荐样本Fine-tune排序模型。同时,我们充分利用3.3.3节内置的实时用户需求理解模块来优化模型效果。当然,我们也探索了不同的网络结构如何提升模型效果。但由于计算资源等限制,我们还没有推出更复杂的交互推荐排名模型。具体模型结构如下图6所示。

图6 模型结构图

输入模型的数据经过MMoE[7]层和3层MLP网络,得到预测的pCTR和pCXR结果。其中,模型的输入特征分为5类:1)用户特征; 2)商户特征; 3)上下文特征; 4)序列特征; 5)触发互动推荐的商家功能。序列功能包括实时曝光、点击等序列,并使用Micro-[8]详细信息。

触发互动推荐的商户特征包括商户代表性、配送信息、折扣信息等。排序模型的线下/线上效果如下表所示。可以看出,与首页Feed排序模型相比,优化后的交互推荐排序在卡片效率方面明显优于直接使用首页Feed排序模型。

3.4.3 机制

为了更灵活地承载业务目标,我们引入了机制模块。目标是根据不同的业务目标(如CTR、CXR、新颖性等)调整排序阶段通过的候选商户的顺序。最终,为了平衡新颖性,交互式推荐根据估计的 CXR 进行排名,以最大限度地提高卡片和列表的转化率。同时,我们还从解决差评和优化体验两个方面对体验进行了优化:

3.4.4 揭示

曝光阶段,主要决定机制阶段通过的Top 1商家是否展示给用户。理论上,每次用户“触发”一次互动推荐,系统就可能会推荐一个新的商家进行展示。然而,不考虑商家质量的推荐策略会极大地损害用户体验和首页Feed效果。因此,我们探讨了卡牌披露策略,即通过机制阶段传送的Top 1卡牌是否显示。

如下图7所示,商户展示区域分为四个区域ABCD:互动推荐插卡位置(A)、触发商户(B)、上方触发商户(C)、下方触发商户(D)。互动卡插入后,D区第一个商户向下滑动,动画效果将用户的注意力吸引到互动卡A上。但是,用户是否在互动推荐商户A上进行购买,不仅仅与是否购买互动卡有关。满足用户的喜好,还取决于与上下文商户C、B、D的对比效果——至少,A应该比C、B、D区的商户更符合用户当前的意图。

图7 业务展示区域划分

我们更关注首页feed的转化率。因此,当交互推荐的商家比相同上下文中的其他商家具有更高的pCXR时,应该将该商家暴露出来,其形式为:

交互式地向下一个商家推荐商家

那么,有几个问题:B、C、D区有哪些企业进行比较?互动推荐商户A的pCXR比对比商户的pCXR高多少(由公式1中的比例系数α控制)才应该展示?对于后者,我们是通过实验得到的;对于前者,我们分析如下:

由于卡片曝光条件的限制,交互式卡片的曝光量明显降低。实验表明,当交互推荐卡相对于1位商户卡具有较高的pCXR时,其在相同位置的订单增量最高,曝光页页面份额损失最小,策略最优。我们采用这种方法。从实验数据可以看出,在比较N位pCXR的平均值时,随着N值的变化,会影响交互卡的曝光和效率。效果相当于直接调整pCXR的滤波阈值α。实际生产环境中,“同位置订单增量互动推荐”较高时选择参数α即可。这里我们取1。

四、总结与展望

本文介绍了我们在首页 Feed 上进行互动推荐的尝试,主要包括:

目前,首页Feed已全面提供交互式推荐,我们还获得了以下商业收益:

未来,我们将从以下几个方向进行探索和优化:

5.本文作者

|季晨、亚成、王伟、成龙、蒋飞、王聪、北海等来自到家事业群/到家研发平台/搜索推荐技术部。

|舒阳、张静等,来自到家事业群/外卖事业部/产品部。

6. 参考文献

-  -  -  -  -  结尾  -  -  -  -  -

招聘信息

搜索推荐算法工程师

开发大规模深度学习、图学习等技术,利用注意力机制、记忆网络、关系网络等模块,了解用户需求,挖掘用户兴趣,从海量数据中优化点击率和转化率模型多个时空场景。向用户展示更多适合、有趣的食物和产品。

开发强化学习、可解释深度学习、多模态学习、多目标优化等技术,优化重排和混序模型,智能调节流量分布,优化平台生态,实现消费者和消费者的双赢。商人。

利用知识图谱、计算视觉、自然语言生成等技术,帮助商家根据用户兴趣自动智能生成展示内容和文案,提高推广效率。

跟踪研究前沿人工智能技术,探索技术在零售、医疗电商场景中的应用。

感兴趣的同学可以将简历发送至:。期待与您携手共创美好未来。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|【智道时空】 ( 京ICP备20013102号-16 )

GMT+8, 2025-5-11 09:37 , Processed in 0.064009 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表