24小时热门版块排行榜    

查看: 1975  |  回复: 1

dqpilzg

铜虫 (小有名气)

[求助] 求解100组数据重复率较高的一组的方法? 已有1人参与

大家好,我现在有100组数据,每组数据300维,我现在想找一种方法来计算100组中重复率最好的一组数据。所谓的重复率就是指该组数据与其他组的数据的偏差最小,请问有什么好的办法吗?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gorgan

木虫之王 (文学泰斗)

无意苦争春

【答案】应助回帖

★ ★ ★ ★ ★
感谢参与,应助指数 +1
dqpilzg: 金币+5, 有帮助 2014-01-11 09:27:30
先找重复率最差的一组数据,即该组数据与其他组的数据的偏差最大,把这个outlier排除掉,再找重复率最好的数据,否则重复率最好的数据与outlier的偏差也会很大的,outlier的存在会干扰偏差估计
无我相,无人相,无众生相,无寿者相
2楼2013-12-26 13:07:47
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 dqpilzg 的主题更新
信息提示
请填处理意见