版块导航: 正在加载中...

登录注册

应《网络安全法》要求，自2017年10月1日起，未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用，请尽快对帐号进行手机号验证，感谢您的理解与支持！

24小时热门版块排行榜

返回列表

qdairman

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别

[交流] k-means算法的相关问题已有5人参与

对于k-means这种无监督学习算法来说，在聚类后只是知道有几个聚类中心，如何评价好坏（有聚类错的情况），有没有性能指标？类似于监督学习的精度，求大神知道，谢谢了

回复此楼

1楼 2014-04-06 23:24:26

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

netivs

专家顾问 (知名作家)

DataHacker

专家经验: +31
应助: 101 (高中生)
金币: 10338.6
散金: 310
红花: 14
帖子: 6179
在线: 1910.5小时
虫号: 1654541
注册: 2012-03-01
性别: GG
专业: 计算机应用技术
管辖: 信息科学

关注一下

回复此楼

机器学习爱好者

2楼2014-04-07 08:20:43

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xgj2008best

至尊木虫 (知名作家)

应助: 66 (初中生)
金币: 11531.8
散金: 359
红花: 13
帖子: 7082
在线: 1077.1小时
虫号: 1320746
注册: 2011-06-11
专业: 计算数学与科学工程计算

★
小木虫: 金币+0.5, 给个红包，谢谢回帖

没有明确的评价标准，你可以尝试做误差分析。另外，k的取值不同结果也不尽相同，可以去多值测试。最后选取最优k值。

赞一下

回复此楼

3楼2014-04-07 09:27:32

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

qdairman

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别

引用回帖:

3楼: Originally posted by xgj2008best at 2014-04-07 09:27:32
没有明确的评价标准，你可以尝试做误差分析。另外，k的取值不同结果也不尽相同，可以去多值测试。最后选取最优k值。

首先谢谢你的回复
1.对于k的取值，有办法可以确定
2.你所说的误差分析是什么？

赞一下

回复此楼

4楼2014-04-07 20:11:31

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

xgj2008best

至尊木虫 (知名作家)

应助: 66 (初中生)
金币: 11531.8
散金: 359
红花: 13
帖子: 7082
在线: 1077.1小时
虫号: 1320746
注册: 2011-06-11
专业: 计算数学与科学工程计算

★
小木虫: 金币+0.5, 给个红包，谢谢回帖

引用回帖:

4楼: Originally posted by qdairman at 2014-04-07 20:11:31
首先谢谢你的回复
1.对于k的取值，有办法可以确定
2.你所说的误差分析是什么？...

k的取值没有合理的方法，只有自己不段取值测试。或许8是个不错的选择。

针对k在不同值是影响实际的结果，我理解的误差分析分析是指，每次k的取值结果和上次k的结果情况进行比较得出的差值与上次k值取商。
当然有其他更多的办法，这得根据你文章的实际安排。
但有一点的是，做误差分析是给论文提分的。

赞一下

回复此楼

5楼2014-04-07 21:13:24

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

耗子囧rz

铁虫 (初入文坛)

应助: 0 (幼儿园)
金币: 41.3
帖子: 15
在线: 5.3小时
虫号: 3083255
注册: 2014-03-24

★
小木虫: 金币+0.5, 给个红包，谢谢回帖

k-means 这种古董级算法，一般是用来作为别的聚类算法的指标的。

要改进的话，可以试试k众数或k中心值算法，多换几个k看看。

不限于用这些划分方法的话，一般还是用层次聚类法比较好，可以通过类之间距离的最大化确定类的数目。

[ 发自小木虫客户端 ]

赞一下

回复此楼

6楼2014-04-07 22:41:01

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

qdairman

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别

引用回帖:

5楼: Originally posted by xgj2008best at 2014-04-07 21:13:24
k的取值没有合理的方法，只有自己不段取值测试。或许8是个不错的选择。

针对k在不同值是影响实际的结果，我理解的误差分析分析是指，每次k的取值结果和上次k的结果情况进行比较得出的差值与上次k值取商。
当然 ...

谢谢你的回复
1.对于k，有个叫elbow method的方法可以比较好的解决
2.主要是之前看别人说的，事先是知道了具体类别（监督学习），但用的时候当它是没有类别（无监督），用聚类，最后在与之前有标签的进行对比，计算精度
就是感觉这样的方法“不纯”，所以就比较想知道对于根本就不知道类别的数据进行聚类的好坏

赞一下

回复此楼

7楼2014-04-08 10:26:06

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

qdairman

新虫 (初入文坛)

应助: 0 (幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别

引用回帖:

6楼: Originally posted by 耗子囧rz at 2014-04-07 22:41:01
k-means 这种古董级算法，一般是用来作为别的聚类算法的指标的。

要改进的话，可以试试k众数或k中心值算法，多换几个k看看。

不限于用这些划分方法的话，一般还是用层次聚类法比较好，可以通过类之间距离的最 ...

谢谢回复，目前就是针对k-means，正如你说的是古董级算法，所以先多了解点

赞一下

回复此楼

8楼2014-04-08 10:33:25

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

摘星者

铁杆木虫 (正式写手)

应助: 27 (小学生)
金币: 8207.2
散金: 50
红花: 4
帖子: 397
在线: 506.3小时
虫号: 494941
注册: 2008-01-14
专业: 人工智能与知识工程

★
小木虫: 金币+0.5, 给个红包，谢谢回帖

引用回帖:

7楼: Originally posted by qdairman at 2014-04-08 10:26:06
谢谢你的回复
1.对于k，有个叫elbow method的方法可以比较好的解决
2.主要是之前看别人说的，事先是知道了具体类别（监督学习），但用的时候当它是没有类别（无监督），用聚类，最后在与之前有标签的进行对比，计 ...

没有什么纯不纯的。

什么叫相似？什么叫不相似？太主观了。内部指标有很多啊，db、cs、dunn等等，太多了，层出不穷。它们不使用标签，但是都包含了提出者自己对于相似的主观印象，是有偏向的。用这些指标证明a算法比b算法好，就必须证明a算法在聚类过程中没有迎合所选指标，无论有意无意。否则如何让人信服？

相比之下，外部指标通过将聚类结果和真实标签比较的方法评价聚类效果是比较客观的。虽然外部指标也有各种问题，也带有一定的主观性，但至少不在样本的真实标签上存在主观的判断。而作为评价标准，客观很重要。

赞一下

回复此楼

9楼2014-04-11 01:21:59

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

jssw

金虫 (初入文坛)

应助: 0 (幼儿园)
金币: 1132.5
帖子: 7
在线: 217.3小时
虫号: 2139759
注册: 2012-11-21
专业: 计算机软件

★
小木虫: 金币+0.5, 给个红包，谢谢回帖

聚类评价指标有很多，Rand Index较为常用

赞一下

回复此楼

10楼2014-04-11 08:24:14

已阅回复此楼关注TA 给TA发消息送TA红花 TA的回帖

相关版块跳转我要订阅楼主 qdairman 的主题更新

返回列表

最具人气热帖推荐 [查看全部]		作者	回/看	最后发表

[考博] 华师大读博 +3	xq83 2026-04-22	3/150	2026-04-22 03:56 by 啊哒哒哒叨
[论文投稿] 急需审稿人！！！ +3	陆小果画大饼 2026-04-21	3/150	2026-04-21 23:54 by jzy_123456
[考博] 申博/考博 +4	啃面包的小书虫 2026-04-17	8/400	2026-04-21 16:26 by 啃面包的小书虫
[考研] 一志愿A区211，22408 321求调剂 +7	随心所欲☆ 2026-04-15	8/400	2026-04-21 08:22 by Equinoxhua
[考研] 295分求调剂 +6	?要上岸? 2026-04-17	6/300	2026-04-21 08:18 by Equinoxhua
[考研] 085600材料与化工调剂 5+3	孜孜不倦2002 2026-04-19	6/300	2026-04-20 21:25 by babero
[论文投稿] 期刊推荐 +3	材料研究生 2026-04-15	5/250	2026-04-20 16:02 by 豆豆7758
[论文投稿] 有没有接收比较快的sci期刊呀，最好在一个月之内的，研三孩子求毕业 20+4	之护着 2026-04-16	7/350	2026-04-20 15:45 by 豆豆7758
[教师之家] 又一批高校组建人工智能学院师资行吗不是骗人吗 +4	yexuqing 2026-04-19	4/200	2026-04-20 14:47 by brantleo
[考博] 申博 +3	Xyyx. 2026-04-18	3/150	2026-04-20 10:44 by YuY66
[考博] 湖南大学刘巧玲课题组2026年第二批次博士研究生招生信息 +3	南风观火 2026-04-18	5/250	2026-04-20 10:13 by 南风观火
[考研] 求计算机方向调剂 +3	Toffee2 2026-04-16	6/300	2026-04-19 22:37 by ll叶
[考研] 294求调剂 +8	淡然654321 2026-04-17	9/450	2026-04-19 19:51 by Equinoxhua
[考研] 求调剂 +6	苦命人。。。 2026-04-18	7/350	2026-04-19 16:27 by 中豫男
[考研] 0854求调剂 +23	门路摸摸 2026-04-15	27/1350	2026-04-19 01:59 by 烟雨流涯
[考研] 300求调剂 +12	橙a777 2026-04-15	12/600	2026-04-18 23:51 by 路病情
[考研] 接受任何调剂 +6	也就是栗子 2026-04-17	7/350	2026-04-18 17:20 by 涵竹刘
[考研] 260求调剂 +4	Zyt1314520.. 2026-04-17	5/250	2026-04-18 08:28 by babysonlkd
[考研] 急需调剂 +9	绝不放弃22 2026-04-15	10/500	2026-04-18 08:09 by chixmc
[考研] 322求调剂 +6	tekuzu 2026-04-17	6/300	2026-04-17 13:48 by Espannnnnol

24小时热门版块排行榜

[交流] k-means算法的相关问题 已有5人参与

» 收录本帖的淘帖专辑推荐

» 猜你喜欢

» 本主题相关价值贴推荐，对您同样有帮助:

[交流] k-means算法的相关问题已有5人参与