题名

奇异值分解法在预测用户页面兴趣度方面的应用研究

并列篇名

Research on Singular Value Decomposition in Predicting User's Page Interest Degree

DOI

10.6338/JDA.200910_4(5).0010

作者

刘伟江(Wei-Yuan Liu);王颖(Ying Wang)

关键词

奇异值分解 ; 页面兴趣度 ; 协同过滤 ; Singular Value Decomposition ; page interest degree ; collaborative filter

期刊名称

Journal of Data Analysis

卷期/出版年月

4卷5期(2009 / 10 / 01)

页次

223 - 234

内容语文

簡體中文

中文摘要

随着电子商务的不断发展,商务网站可以按着用户访问网站的足迹来考察用户感兴趣的内容并以此为基础向用户推荐相应的产品,这种方式以其特有的双赢特性引起了很多商家和学者的关注。本文以预测用户对页面的兴趣度为研究目标,考虑到用户页面兴趣度矩阵是一个稀疏矩阵,因此将奇异值分解(Singular Value Decomposition,简称SVD)方法用到Slope One算法(协同过滤算法中的一种)中,提出了一种基于奇异值分解的协同过滤算法-SlopeOne_After_SVD算法。该方法不仅解决了矩阵稀疏性问题,而且由于用户页面兴趣度矩阵中的数据是通过提取网络日志文件中对页面兴趣度有影响的因素计算得出的,因此又解决了显性用户评分数据可能存在的“虚假评分”问题。最后本文用易诚网站的数据进行了验证,实验结果显示:在数据稀疏性普遍存在的情况下,SlopeOne_After_SVD算法比单纯使用Slope One算法在预测用户页面兴趣度的准确性有所提高。

英文摘要

By the development of electronic commerce, commerce website can know visitor's interest by following visitors' footstep and recommend corresponding product to them, this method abstracts researcher's attention by its special win-win characteristic.The paper focus on users' page interest degree, considering user page interest matrix is a sparse generator matrix, so applies singular value decomposition into slope one algorithm, puts forward a collaborative filter algorithm based on SVD-Slope One_after_SVD. This method not only solves sparse generator problem, but also solves false evaluation problem. At last, this paper tests by using encity website data, experiment result is: under sparse generator, Slope One_afer_SVD algorithm is better than slope algorithm in predicting user's page interest degree's accuracy.

主题分类 基礎與應用科學 > 資訊科學
基礎與應用科學 > 統計
社會科學 > 管理學
参考文献
  1. Claypool, M.,Le, P.,Waseda, M.(2001).Implicit Interest Indicators.Proc of the ACM Intelligent User Interfaces Conf(IUI)
  2. Claypool, M.,Le, P.,Waseda, M.(2001).Implicit Interest Indicators.Proc of the ACM Intelligent User Interfaces Conf (IUI)
  3. Lemire, Daniel,Maclachlan, Anna(2005).Slope One Predictors for Online Rating-Based Collaborative Filtering.SIAM Data Mining
  4. Liang, T. P.,Lai, H. J.(2002).Discovering User Internet from Web Browsing Behavior: An Application to Internet News Services.Proc of the 35th Hawaii Int'1 Conf on System Sciences
  5. 田东风、欧飞、申维(2008)。矩阵奇异值分解理论在中文文本分类中的应用。数学的实践与认识,38(24),132-139。
  6. 李珊、袁方(2007)。基于Web日志挖掘的页面兴趣度方法的改进。计算机时代,3,29-31。
  7. 曾春、邢春晓、周立柱(2002)。个性化服务技术综述。软件学报,13(10)
  8. 董丽、邢春晓、王克宏(2009)。基于不同数据集的协作过滤算法评测。清华大学学报(自然科学版),49(4),590-594。
  9. 吕佳(2007)。基于兴趣度的Web用户访问模式分析。计算机工程与设计,5,2403-2404。
  10. 吴颜、沈洁(2007)。协同过滤推荐系统中数据稀疏问题的解决。计算机应用研究,24(6),94-97。
  11. 孙铁利、杨凤芹(2003)。根据用户隐式反馈建立和更新用户兴趣模型。东北大学学报(自然科学版),35(3),99-104。
  12. 谭琼、李晓黎、史忠植(2002)。一种实现搜索引擎个性化服务的方法。计算机科学,29(1),23-25。
  13. 邓爱林、朱扬勇、施伯乐(2003)。基于项目评分预测的协同过滤推荐算法。软件学报,14(9),1621-1628。
  14. 陈东林、聂规划(2006)。基于商品属性隐性评分的协同过滤算法研究。计算机应用,26(4),996-968。