清华大学交叉信息研究院唐平中助理教授研究组与阿里巴巴公司合作,针对评价系统(Reputation System)普遍存在的商家刷单提升信用问题提出了基于博弈论与优化的新解决方案,并在淘宝网和天猫的数据集上取得了优异的仿真实验结果。该研究成果Mechanism Design for Personalized Recommender Systems近期以长文形式发表于推荐系统顶级会议ACM RecSys 2016。
推荐系统根据买家的购买点击数据和商品的评价(Reputation System)进行推荐,得分高的卖家获得更多的买家访问量,这促使卖家通过提升自己的服务和商品质量,从而提升购买数量。对于卖家来说,良好信誉是建立于长期累积和稳定经营,但为获得更多的买家访问量,部分卖家会采用刷单、炒信的捷径提高信誉度。这一方法不仅严重影响了买家在推荐系统上的用户体验,也影响了不刷单的卖家的利益。刷单的现象如今非常普遍,甚至已形成了一个地下产业。
现有的防止办法大多采用机器学习的方式,即对商品的评价文本抽取特征,同时进行人工标定是否为虚假评价的标记训练模型。 但对于很多评论来说,人工标记也十分困难,因此这些模型有可能会误伤诚信的卖家。
针对这个问题,唐平中研究组从博弈论和机制设计的角度,提出了一个全新的防止刷单的理论模型和相应的实现算法。在这个模型中,推荐的流量分配被建模成一个可分割资源的问题,卖家参与刷单的成本大于刷单得到流量提升带来的收益,因而卖家不会选择刷单。之后对阿里巴巴提供的购买数据进行分析处理,模拟论文中提出的机制,发现机制带来的总成交量优于淘宝现有的推荐算法。下图为模拟实验的结果:
该成果具有一定的普适性,可应用于基于推荐的互联网场景,如亚马逊、阿里巴巴、京东、美团等企业,具有很高的应用前景和商业价值。
ACM RecSys是美国计算机协会(ACM)举办的推荐系统顶级会议,本次会议的长文录用率约为10%。该论文主要作者为交叉信息研究院2014级直博生蔡庆芃。此项研究得到了国家自然基金和清华大学自主科研计划的资助。
论文链接:http://dl.acm.org/citation.cfm?id=2959135