Rec - Large Scale Product Graph Construction for Recommendation in E-commerce
这篇论文想要解决什么问题?
解决大规模电商推荐系统中产品关系图构建的关键挑战。 论文关注的核心问题包括:
产品间关系的捕捉:理解并捕捉产品之间的关系是现代电子商务推荐系统的基础。这些关系可以被视为产品重构索引,能够根据给定的种子产品返回排名列表。
解决大规模电商推荐系统中产品关系图构建的关键挑战。 论文关注的核心问题包括:
产品间关系的捕捉:理解并捕捉产品之间的关系是现代电子商务推荐系统的基础。这些关系可以被视为产品重构索引,能够根据给定的种子产品返回排名列表。
特征编码在工业广告推荐系统中,特征是从许多来源生成的,并且属于不同的类型,例如序列特征、数字特征和嵌入特征。在对这些特征进行编码时,我们希望尽可能地保留其固有的时间、顺序或距离(相似性)先验。
「用户新增预测挑战赛」是由科大讯飞主办的一项数据科学竞赛,旨在通过机器学习方法预测用户是否为新增用户。 赛题提供了讯飞开放平台的海量应用数据作为训练样本, 参赛者需构建模型对测试数据中的用户进行分类,判断其是否为新增用户。 比赛属于二分类任务,评价指标采用F1分数,分数越高表示模型性能越好。
创新点:
COBRA的输入是一系列级联表示,由稀疏ID和与用户交互历史中的项相对应的密集向量组成。在训练过程中,密集表示是通过对比学习目标和端到端的方式学习的。通过首先生成稀疏ID,然后生成稠密表示,COBRA降低了稠密表示的学习难度,并促进了两种表示之间的相互学习。在推理过程中,COBRA采用了一个由粗到细的生成过程,从稀疏ID开始,稀疏ID提供了一个捕获项目分类本质的高级分类草图。然后,生成的ID被附加到输入序列中,并反馈到模型中,以预测捕获细粒度细节的密集向量,从而实现更精确和个性化的推荐。为了确保灵活的推理,我们引入了BeamFusion,这是一种将波束搜索与最近邻检索分数相结合的采样技术,确保了检索到的项目的可控多样性。与TIGER不同,它只依赖于稀疏ID,COBRA利用稀疏和密集表示的优势。
Reference:Multimodal Alignment and Fusion: A Survey 第五章
这篇论文试图解决的问题是如何在推荐系统中有效地利用大型语言模型(LLMs)来提升序列推荐的准确性和效率。具体来说,论文探讨了以下几个关键问题: