国际计算机协会数据挖掘和知识发现会议ACM KDD是数据挖掘领域的旗舰会议,是中国计算机协会(CCF)建议的国际学术会议。自1995年以来,KDD一直处于会议的形式。今年的会议将于2023年8月6日至8月10日在美国加利福尼亚举行。在社区科学系列中聘请了6篇论文。这次会议(研究轨道)收到了1,416份意见书,313项提交,接受率约为22.1%;数据(应用数据科学轨道)收到了725份提交的意见,接受率约为184个提交,接受率约为25.4%。以下是录用了6篇论文的简要介绍,涵盖了参数个性化网络,超长序列建模,持续时间估算,生成流网络,长期用户互动,图形比较学习等主题。
纸01 ::和
|下载地址:
|论文的作者: **(), **(),Hui (),Leng (),Niu ()(),Song Yang()()()
|论文简介:随着在线服务(例如在线购物和视频观看)中的内容页面和交互式按钮的数量增加,工业级建议系统在多场和多任务推荐中面临挑战。多任务和多场建议的核心是根据多种用户行为准确地捕获多种情况下的用户兴趣。在本文中,我们提出了一个带有嵌入式个性化网络(和)的插件参数,以进行多域和多任务建议。以个性化的先验信息为输入,并通过门机构在模型中动态扩展基础和顶级DNN隐藏单元。嵌入个性化网络以个性化选择,以将不同重要性的特征收敛到多个域下的不同用户。参数个性化网络个性化DNN参数,以在多个任务中为不同用户平衡目标与不同的稀疏度。我们已经对培训框架和在线部署环境进行了一系列特殊工程优化和DNN参数。部署在应用程序中,每天为超过3亿用户提供服务。通过注入的个性化选择和对DNN参数的个性化校正,可以根据每个人的兴趣量身定制的方式来提高性能,在线改善多个领域的多个任务指标的在线改进超过1%。
*本文由模型和应用部门自行开发
**联合第一作者
纸02:双:二 - 在ctr中的用户
|下载地址:
|本文的作者:张江(),张·钦宾(张尚拜(),富伊()(),Zang (),(),lu jing(),),),hui yi ( ) (),Song Yang()
|论文简介:终身用户行为建模(用户),旨在建模数月甚至数年的丰富历史行为序列,从中提取用户的隐藏兴趣。长期以来,终身用户行为建模在现代推荐系统,尤其是CTR预测中发挥了极其核心作用。从直觉上讲,用户的终身行为非常丰富,通常包括成千上万到数十万个行为。序列的长度通常超过传统注意力机制的处理能力(DIN,),因此出现了两阶段的方法:一个简单有效的GSU模块,该模块大致筛选了数以万计的长期行为,以发现100个与预测目标相关的100个行为,以及一个准确的ESU,以GSU选择的赢得胜利者。尽管具有效率,但大多数现有算法都有一个关键缺点:GSU和ESU之间的目标行为相关指标不一致。因此,他们的GSU通常会错过高度相关的行为,而是检索ESU认为无关的行为。在这种情况下,ESU中的TAS,无论其注意力分布如何,主要偏离用户的真实利益,从而降低了整体CTR预测的准确性。
为了解决两阶段行为建模中的不一致问题,我们提出了双算法。我们的GSU应用距离度量与ESU中的注意机制完全相同,以便两个阶段可以准确,一致地选择与预测目标(如双胞胎)最相关的行为。具体而言,我们将行为特征分为视频的固有特征,并与视频和用户相交的特征。对于固有的功能,我们在离线前预报并有效地将其线性投影缓存。对于视频和用户的交点特征,我们将其压缩为注意机制中的偏差术语。结合高度优化的基础架构和在线部署,我们成功地将计算瓶颈降低了99.3%,从而在的主要情况下实施了这一两阶段一致的终身用户行为建模方法,每天为3.4亿活跃用户的主要流量提供服务。
*本文由模型和应用部门自行开发
纸03:tree -time in-
|下载地址:
|论文的作者:lin Xiao **(),Chen **(),Song (),Liu ()(),Li Biao(), Peng()()
|纸简介:用户的长度反映了用户对应用程序的满意度。对于视频平台,建议系统需要准确估计用户观看某些视频的时间,从而提高了平台的消耗效率。现有时间估计技术有两种主要类型:一种通过查看时间加权到正面样本;另一个直接回归到时间分位数。这些工作忽略了不同级别的几个重要问题::查看时间是订单变量。普通的回归方法仅着眼于估计值和实际值之间的绝对差异,但忽略了高估计值和低估计值之间的相对差异;:观看行为表明渐进式依赖性,也就是说,如果用户想查看10 s,他需要首先完成前9s;:现有的现有模型对持久性的不确定的估计性影响,这会影响其稳健的估计性,这会影响b的准确性,这将影响b的准确性,这将影响b的准确性;估计模型及其影响需要最小化。
为此,我们在考虑上述问题时提出了TPM(树)。 TPM将查看持续时间视为订单变量,并且持续时间估计任务被分解为几个相互依存的分类任务,并将其组织成树结构。每个节点代表估计时间所在的间隔,在同一级别的节点之间存在序列关系,并且父节点和子节点之间存在条件依赖性(如图1所示)。该模型以自上而下的方式得出了观看时间落入每个叶节点间隔内的概率,因此可以轻松地计算出估计值的方差以表征不确定性。同时,通过向树的节点添加偏见,TPM可以无缝地适应因果推断的处理以减轻偏见的影响。
这项工作是在 Main网站选定的页面上实施的,为持续时间实现了可观的利润,其各种变体也迭代和进一步利润。
*本文由战略算法部门自行开发
**联合第一作者
纸04:流
|下载地址:
|代码地址:
|论文的作者:刘·夏昌(),凯旺彭(),(UCSD)(UCSD),Sun ( ),(UCSD),(UCSD), Dong( Dong( Dong), Peng()()
|论文简介:个性化推荐系统被广泛用于满足客户的日常需求。优化目标通常是学习推荐策略,以生成满足用户需求或兴趣的项目列表。与传统的LTR模型相比,该方法可以突破单点优化的限制,建模列表中揭示的项目之间的相关性,并进一步提高建议质量。在列表重排和生成推荐方法的最新研究中,已验证了这种优势。但是,探索列表动作的组合空间非常具有挑战性。在提高清单多样性时,现有的生成方法很难保持高建议准确性,而非务必的方法倾向于专注于有限的高列表和缺乏多样性。在这项工作中,我们借鉴了 获奖者提出的想法,并提出了一种生成方法,该方法通过概率流图对列表的自动估计生成过程进行了建模,优化了列表的整体生成概率,以使其与整体列表成比例,并逐渐将概率流图通过概率流图将概率流图传递到每个中间生成。学识渊博的推荐策略可以同时保持高度推荐质量并探索多样性。该方法已在脱机评估和多个公共数据集的在线模拟器中进行了验证。与现有的协作过滤,生成方法和重排方法相比,它可以更好地探索动作空间改进列表的总体建议效果。
*本文由战略算法部门自行开发
纸05 ::与长期用户一起
|下载地址:
|代码地址:
|论文的作者:Xue ( 工程),Cai (),Xue ( ),Sun ()(), Dong()()(), Peng Peng Peng(), ,
|论文简介:在当前的推荐系统研究中,如何优化用户的长期互动仍然是一个非常具有挑战性的问题。最近,强化学习(RL)算法在各种长期目标优化任务中显示出有效性,并被广泛认为是优化建议系统中长期用户指标的基本范式。但是,在RL框架下设计合适的奖励功能非常困难。这是因为奖励功能的设计取决于用户反馈,并且用户反馈存在诸如稀疏,延迟和随机性之类的问题,这使得用户的真实偏好与用户反馈之间的关系不清楚。为此,我们提出了一个新的范式,这是一种直接从用户偏好中学习的推荐系统,该系统允许RL建议系统从用户历史行为偏好数据中学习,而不是人为定义的奖励。这些偏好可以从人为的标准数据中获取,从而避免了复杂的工程。在培训期间,用户偏好会自动训练该功能端到端,然后使用该功能生成学习信号来训练推荐的策略。此外,我们设计了一种有效的优化方法,该方法使用增值功能和期望回归来提高模型的预测准确性。我们对各种长期用户交互指标的优化任务进行了实验,结果表明它们在所有任务中都明显优于SOTA。
*本文是由战略和算法和南南技术大学制作的
纸05:与
|下载地址:
|代码地址:
|论文的作者:吴成大学),王查昆( ),Xu ( ),Liu ( ), Kai(),Wang ((),),()
|论文简介:典型的对比学习范式需要通过增强策略来产生多种观点,并根据这些观点构建正面和负面样本对,从而使用对比度学习损失训练模型。一般的增强策略用于通过随机添加和删除节点/边缘来构建对比度视图。这些方法要么不考虑引入新边缘,要么可能引入随机噪音边缘,因此很难实现最佳效果。
在我们的工作中,我们建议在对未来存在的新边缘产生对比度时,应考虑图形分布和图进化,从而产生更丰富的对比视图。具体而言,我们提出了一个称为GACN的生成对抗对比网络模型,该模型利用自适应学习对比视图中的图形生成对抗网络分布,并控制基于两个正则化损失的新边缘的产生。为了优化GACN的模型参数,我们还提出了一个联合培训框架,用于图形生成对抗和图比较学习。实验结果表明,GACN可以产生更丰富,更合理的对比视图,从而在下游任务中取得更好的性能。
*本文与模型和应用系和 软件学院合作生产
工作时间:8:00-18:00
电子邮件
扫码二维码
获取最新动态