1. [ABSTRACT]时间敏感性极其重要,推荐时间太晚或者太迟都可以。,比之预测 即将到来的恶活动, 尤为重要的是预测将来相对较为久远的活动(似乎难度也更大一些)。本文 要处理的就是时间相关的长期的处理方法。以4square数据集作为基础。能够做到给定用户的历史,可以预测用户能否在给定的日子里访问特定的地点类型。数周内的预测精度达75%。发现事实:点之间的 交互,由此点的访问历史可以决定其将来的访问点。
2.[INTRODUCTION]预测用户在下周购买飞机票而提前购买即从此处来,很多文章致力于相关性,本文致力于时效性。预测分为短期和长期,短期即是指“突发的”或者“下一个活动”。短期预测在诸如交通规划这样的应用中是有用的,但由于用户会提前制定很多计划,有时候短期的计划会无能为力。在诸如不可退还的飞机票及和很多人定好的晚餐中,长期预测很有必要。
4.[TECHNICAL APPROACH]采用了经典的二元分类框架,对于每一个用户、用户访问过的访问地点类型、用户活跃的历史时间,产生一个数据点。标签为“+1”或者“-1”。下文使用了一系列的特征,计算每个点的描述符号,
数据分为训练集和测试集,按时间顺序先后分类,问题在于用户有时会改变行为模式。
二元分类器在训练集上测试,在测试集上评估。对于每一个分类其,做ROC曲线,上的ERR点用于评价分类其的性能。
采用的特征集合(在预测中不一定全部使用) :Day of week :目标在一周中所处星期几(有助于捕捉一周 内的循环特征) Days since: 表示上次访问目标地点所距离的时间 History :是每一个地点类型所采用的特征。包括所有的访问类型,不仅仅是目标类型。该特征揭示了用户和目标日期相关的某一天相关的日子是否访问了地点类型。历史日期的选择 涉及如下两点:a.today:目标日期的访问集合,捕捉当前的用户活动,但是除了对目标类型的访问除外b.N days ago:N天前对所有目标地点类型的访问
有疑问加站长微信联系(非本文作者)