24小时热门版块排行榜    

查看: 581  |  回复: 2

userbasedCF

新虫 (初入文坛)

[求助] 实现【协同过滤】时遇到的【邻居选择】问题

最近在学习推荐算法中的协同过滤
看了文章自己写了代码 是基于用户的协同过滤 UBCF
在邻居选择这里遇到了问题 求大神来一起讨论:
我开始是按照Top-n规则给每个用户找最大的n个邻居 然后计算预测值
这样有个问题就是 相似度高的用户可能没有评分 这样MAE值就很大 3.4左右 比正常的值 0.8左右 大太多
后来换成只从有评分的用户里选择 这样的问题是 有的项目评分用户很少 没法达到规定的邻居数 而且最终的MAE是0.5左右 又太小了

现在就很纠结用什么方法选择邻居 欢迎大家来讨论

对了用的是MOVIELENS的 10k数据集
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

keppelsue

新虫 (正式写手)

2楼2016-07-21 21:58:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

userbasedCF

新虫 (初入文坛)

引用回帖:
2楼: Originally posted by keppelsue at 2016-07-21 21:58:30
可以用均值先填充一下

我试过 结果MAE也很大啊 我就是想知道基础的ubcf是怎么选择邻居的

发自小木虫IOS客户端
3楼2016-07-22 01:27:15
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 userbasedCF 的主题更新
信息提示
请填处理意见