| 查看: 2199 | 回复: 9 | |||
| 当前只显示满足指定条件的回帖,点击这里查看本话题的所有回帖 | |||
[求助]
kmeans聚类的问题请教! 已有2人参与
|
|||
| 每类训练样本约200多不等,如果只选用其中的两类进行kmeans自动聚类,准确率会相对的高。但是如果把所有的18类样本进行自动聚类。正确率不到3%。 难道样本类型越多,每类所需要的样本个数越多码? |
» 猜你喜欢
招博士
已经有6人回复
限项规定
已经有8人回复
国家基金申请书模板内插入图片不可调整大小?
已经有5人回复
交叉科学部支持青年基金,对三无青椒是个机会吗?
已经有3人回复
国家级人才课题组招收2026年入学博士
已经有5人回复
Fe3O4@SiO2合成
已经有6人回复
青年基金C终止
已经有4人回复
青椒八年已不青,大家都被折磨成啥样了?
已经有7人回复
为什么nbs上溴 没有产物点出现呢
已经有10人回复
救命帖
已经有11人回复
» 本主题相关价值贴推荐,对您同样有帮助:
请教一个聚类的问题
已经有32人回复
土地利用的栅格影像如何进行空间聚类
已经有5人回复
K均值聚类matlab算法完善版
已经有321人回复
请教各位,聚类分析图和系统发生树有什么区别?
已经有5人回复
【求助】kmeans函数错误:Empty cluster created at iteration 1
已经有7人回复
摘星者
铁杆木虫 (正式写手)
- 应助: 27 (小学生)
- 金币: 8207.2
- 散金: 50
- 红花: 4
- 帖子: 397
- 在线: 506.3小时
- 虫号: 494941
- 注册: 2008-01-14
- 专业: 人工智能与知识工程
【答案】应助回帖
★ ★ ★ ★ ★
感谢参与,应助指数 +1
xmcrobbie: 金币+5, ★★★★★最佳答案 2014-01-09 16:57:13
感谢参与,应助指数 +1
xmcrobbie: 金币+5, ★★★★★最佳答案 2014-01-09 16:57:13
|
首先,k-means(KM)确实有准确率的说法,这是一种外部指标。所谓的无监督不过是指在聚类过程中没用使用到标签之类的信息而已。 然后是楼主的问题。我没有看过你使用的是什么样子的数据集。但是把所有的18类样本进行自动聚类正确率下降并不奇怪。你说的自动聚类是指不指定聚类数吗?要算法自己找到合适的聚类数并不容易。即便指定聚类数,类别多了正确率也容易下降。 KM只适用于每类样本在空间中分布呈超球体且超球中心间的距离明显大于超球半径的情况。当这些条件不满足的时候,很容易出现错分。楼主仅仅选择两类样本,这些样本在空间中的分布比较容易满足KM的要求,故准确率较高。18类样本放在一起,相互影响之下准确率自然就低了。 Liu Y, Li Z, Xiong H, et al. Understanding of internal clustering validation measures[C]//Data Mining (ICDM), 2010 IEEE 10th International Conference on. IEEE, 2010: 911-916. 还有一篇类似的论文在IEEE trans. 上,楼主不妨看看,也许对你了解这个问题有帮助。 |
6楼2014-01-09 14:39:09
youth0826
至尊木虫 (著名写手)
weibo.com/138147022
- 应助: 172 (高中生)
- 金币: 10458.4
- 散金: 145
- 红花: 4
- 帖子: 1726
- 在线: 149.4小时
- 虫号: 707170
- 注册: 2009-02-23
- 专业: 模式识别

2楼2014-01-09 07:08:41
3楼2014-01-09 08:02:00
fhjianke
金虫 (初入文坛)
- 应助: 6 (幼儿园)
- 金币: 7828.5
- 帖子: 36
- 在线: 219.7小时
- 虫号: 549512
- 注册: 2008-04-21
- 专业: 通信与信息系统/视频编码
4楼2014-01-09 10:23:29













回复此楼