论文《Empirical Analysis of Predictive Algorithm for Collaborative Filtering》中对协同过滤提出了分类,分为基于内存的协同过滤和基于模型的协同过滤,而基于用户的协同过滤和基于项目的协同过滤都是属于基于内存的协同过滤。
基于内存的协同过滤有以下不足:
1) 数据稀疏问题
2) 冷启动问题:冷启动问题包含新用户问题(new user problem)和新项目问题(new itemproblem)两种情况。新用户问题是指当一个新用户加入到推荐系统时,由于没有该用户的历史评分数据,因此无法根据评分信息对新用户进行推荐服务。新项目问题是指当一个全新的商品加入到推荐系统中后,由于没有用户对其进行过评价,则在系统运行的初期,它将很难获得推荐。新项目问题可以通过结合基于内容的推荐(项目的属性信息)等方法,来缓解冷启动问题。
3) 可扩展性问题
4) 鲁棒性问题:推荐系统能否识别此种情况,去除恶意用户及异常数据,提高推荐系统的可靠性,这也是目前推荐系统鲁棒性方面所需要重点关注的问题。
5) 隐性喜好发现
基于模型的协同过滤