24小时热门版块排行榜    

查看: 1417  |  回复: 5
当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖

thunder3

新虫 (正式写手)

[求助] 最少有几个样本点,GMM和EM算法才有效

请教各位前辈一个问题。我想用GMM和EM算法对一堆数据点聚类,假定有K个中心,那么最少应该有几个样本点,EM算法才能有效?

我想应该有这方面的论文,本人水平有限,没有找到。谢谢!
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

quanyun

铁杆木虫 (正式写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
thunder3: 金币+2, 有帮助 2013-01-12 11:04:31
我的感觉,至少要30*K,样本点少了很难求出准确的概率模型吧
3楼2013-01-12 10:59:30
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
查看全部 6 个回答

ilovewby

铜虫 (正式写手)

【答案】应助回帖

★ ★
感谢参与,应助指数 +1
thunder3: 金币+2, 有帮助 2013-01-12 11:04:23
这个和你的的数据维度和在空间的分布有关,很难一概而论~
不过从经验的角度上说,感觉至少样本数得是你维度的10倍以上,当然,这个没有什么理论依据的,都是经验之谈~
2楼2013-01-12 01:47:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thunder3

新虫 (正式写手)

引用回帖:
2楼: Originally posted by ilovewby at 2013-01-12 01:47:53
这个和你的的数据维度和在空间的分布有关,很难一概而论~
不过从经验的角度上说,感觉至少样本数得是你维度的10倍以上,当然,这个没有什么理论依据的,都是经验之谈~

因为现在研究课题的需要,我想知道有没有文章是从理论上分析这件事情的?谢谢!
4楼2013-01-12 11:05:34
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

thunder3

新虫 (正式写手)

引用回帖:
3楼: Originally posted by quanyun at 2013-01-12 10:59:30
我的感觉,至少要30*K,样本点少了很难求出准确的概率模型吧

因为现在研究课题的需要,我想知道有没有文章是从理论上分析这件事情的?谢谢!
5楼2013-01-12 11:05:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
信息提示
请填处理意见