版块导航
正在加载中...
客户端APP下载
论文辅导
申博辅导
登录
注册
帖子
帖子
用户
本版
应《网络安全法》要求,自2017年10月1日起,未进行实名认证将不得使用互联网跟帖服务。为保障您的帐号能够正常使用,请尽快对帐号进行手机号验证,感谢您的理解与支持!
24小时热门版块排行榜
>
论坛更新日志
(3711)
>
虫友互识
(431)
>
文献求助
(408)
>
导师招生
(245)
>
考博
(140)
>
休闲灌水
(119)
>
博后之家
(83)
>
招聘信息布告栏
(80)
>
硕博家园
(78)
>
论文投稿
(37)
>
SciFinder/Reaxys
(31)
>
绿色求助(高悬赏)
(29)
>
基金申请
(22)
>
教师之家
(20)
>
外文书籍求助
(18)
>
找工作
(16)
小木虫论坛-学术科研互动平台
»
专业学科区
»
信息科学
»
人工智能
»
k-means算法的相关问题
12
1/2
返回列表
1
2
下一页
查看: 1969 | 回复: 11
只看楼主
@他人
存档
新回复提醒
(忽略)
收藏
在APP中查看
qdairman
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别
[交流]
k-means算法的相关问题
已有5人参与
对于k-means这种无监督学习算法来说,在聚类后只是知道有几个聚类中心,如何评价好坏(有聚类错的情况),有没有性能指标?类似于监督学习的精度,求大神知道,谢谢了
回复此楼
» 收录本帖的淘帖专辑推荐
感兴趣的文章
» 猜你喜欢
康复大学泰山学者周祺惠团队招收博士研究生
已经有6人回复
AI论文写作工具:是科研加速器还是学术作弊器?
已经有3人回复
孩子确诊有中度注意力缺陷
已经有6人回复
2026博士申请-功能高分子,水凝胶方向
已经有6人回复
论文投稿,期刊推荐
已经有4人回复
硕士和导师闹得不愉快
已经有13人回复
请问2026国家基金面上项目会启动申2停1吗
已经有5人回复
同一篇文章,用不同账号投稿对编辑决定是否送审有没有影响?
已经有3人回复
ACS Applied Polymer Materials投稿
已经有10人回复
RSC ADV状态问题
已经有4人回复
高级回复
» 本主题相关价值贴推荐,对您同样有帮助:
LARS算法问题求助
已经有6人回复
Kmeans聚类算法的聚类数目可能小于K吗
已经有43人回复
kmeans聚类的问题请教!
已经有9人回复
PRML读书会第九章 k-means 混合高斯 EM算法
已经有11人回复
关于迭代算法的收敛问题,求高人指点!
已经有3人回复
大家来交流下聚类分析方面容易做出成果的方向
已经有5人回复
FFT算法的一个问题请教
已经有18人回复
K均值聚类matlab算法完善版
已经有321人回复
求助:机器学习和模式识别领域的一个基本问题
已经有5人回复
机器学习、模式识别、数据挖掘的关系
已经有29人回复
关于MATLAB和OpenCV对相同算法的运算速度对比问题
已经有20人回复
【讨论】线性预测编码中Levinson-Durbin算法在音频信号去相关应用中的问题
已经有6人回复
【求助】DLS中数据算法问题
已经有16人回复
【讨论】聚类分析的讨论
已经有7人回复
【求助】求算法,两点间距离问题
已经有7人回复
【求助】k-medoids聚类算法关于中心替换的问题
已经有5人回复
【原创】一个简单的kNN分类算法 (k-Nearest Neighbor algorithm) 的C++实现(附源码)
已经有9人回复
【求助】求教K-D树的BBF搜索算法
已经有7人回复
【求助】关于图像分割的小问题
已经有11人回复
1楼
2014-04-06 23:24:26
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
netivs
专家顾问
(知名作家)
DataHacker
专家经验: +31
应助: 101
(高中生)
金币: 10338.6
散金: 310
红花: 14
帖子: 6179
在线: 1910.5小时
虫号: 1654541
注册: 2012-03-01
性别: GG
专业: 计算机应用技术
管辖:
信息科学
关注一下
回复此楼
机器学习爱好者
2楼
2014-04-07 08:20:43
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
xgj2008best
至尊木虫
(知名作家)
应助: 66
(初中生)
金币: 11531.8
散金: 359
红花: 13
帖子: 7082
在线: 1075.3小时
虫号: 1320746
注册: 2011-06-11
专业: 计算数学与科学工程计算
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
没有明确的评价标准,你可以尝试做误差分析。另外,k的取值不同结果也不尽相同,可以去多值测试。最后选取最优k值。
赞
一下
回复此楼
3楼
2014-04-07 09:27:32
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
qdairman
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别
引用回帖:
3楼
:
Originally posted by
xgj2008best
at 2014-04-07 09:27:32
没有明确的评价标准,你可以尝试做误差分析。另外,k的取值不同结果也不尽相同,可以去多值测试。最后选取最优k值。
首先谢谢你的回复
1.对于k的取值,有办法可以确定
2.你所说的误差分析是什么?
赞
一下
回复此楼
4楼
2014-04-07 20:11:31
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
xgj2008best
至尊木虫
(知名作家)
应助: 66
(初中生)
金币: 11531.8
散金: 359
红花: 13
帖子: 7082
在线: 1075.3小时
虫号: 1320746
注册: 2011-06-11
专业: 计算数学与科学工程计算
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
4楼
:
Originally posted by
qdairman
at 2014-04-07 20:11:31
首先谢谢你的回复
1.对于k的取值,有办法可以确定
2.你所说的误差分析是什么?...
k的取值没有合理的方法,只有自己不段取值测试。或许8是个不错的选择。
针对k在不同值是影响实际的结果,我理解的误差分析分析是指,每次k的取值结果和上次k的结果情况进行比较得出的差值与上次k值取商。
当然有其他更多的办法,这得根据你文章的实际安排。
但有一点的是,做误差分析是给论文提分的。
赞
一下
回复此楼
5楼
2014-04-07 21:13:24
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
耗子囧rz
铁虫
(初入文坛)
应助: 0
(幼儿园)
金币: 41.3
帖子: 15
在线: 5.3小时
虫号: 3083255
注册: 2014-03-24
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
k-means 这种古董级算法,一般是用来作为别的聚类算法的指标的。
要改进的话,可以试试k众数或k中心值算法,多换几个k看看。
不限于用这些划分方法的话,一般还是用层次聚类法比较好,可以通过类之间距离的最大化确定类的数目。
[ 发自小木虫客户端 ]
赞
一下
回复此楼
6楼
2014-04-07 22:41:01
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
qdairman
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别
引用回帖:
5楼
:
Originally posted by
xgj2008best
at 2014-04-07 21:13:24
k的取值没有合理的方法,只有自己不段取值测试。或许8是个不错的选择。
针对k在不同值是影响实际的结果,我理解的误差分析分析是指,每次k的取值结果和上次k的结果情况进行比较得出的差值与上次k值取商。
当然 ...
谢谢你的回复
1.对于k,有个叫elbow method的方法可以比较好的解决
2.主要是之前看别人说的,事先是知道了具体类别(监督学习),但用的时候当它是没有类别(无监督),用聚类,最后在与之前有标签的进行对比,计算精度
就是感觉这样的方法“不纯”,所以就比较想知道对于根本就不知道类别的数据进行聚类的好坏
赞
一下
回复此楼
7楼
2014-04-08 10:26:06
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
qdairman
新虫
(初入文坛)
应助: 0
(幼儿园)
金币: 34.8
红花: 1
帖子: 34
在线: 17.3小时
虫号: 3109523
注册: 2014-04-02
专业: 模式识别
引用回帖:
6楼
:
Originally posted by
耗子囧rz
at 2014-04-07 22:41:01
k-means 这种古董级算法,一般是用来作为别的聚类算法的指标的。
要改进的话,可以试试k众数或k中心值算法,多换几个k看看。
不限于用这些划分方法的话,一般还是用层次聚类法比较好,可以通过类之间距离的最 ...
谢谢回复,目前就是针对k-means,正如你说的是古董级算法,所以先多了解点
赞
一下
回复此楼
8楼
2014-04-08 10:33:25
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
摘星者
铁杆木虫
(正式写手)
应助: 27
(小学生)
金币: 8207.2
散金: 50
红花: 4
帖子: 397
在线: 506.3小时
虫号: 494941
注册: 2008-01-14
专业: 人工智能与知识工程
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
引用回帖:
7楼
:
Originally posted by
qdairman
at 2014-04-08 10:26:06
谢谢你的回复
1.对于k,有个叫elbow method的方法可以比较好的解决
2.主要是之前看别人说的,事先是知道了具体类别(监督学习),但用的时候当它是没有类别(无监督),用聚类,最后在与之前有标签的进行对比,计 ...
没有什么纯不纯的。
什么叫相似?什么叫不相似?太主观了。内部指标有很多啊,db、cs、dunn等等,太多了,层出不穷。它们不使用标签,但是都包含了提出者自己对于相似的主观印象,是有偏向的。用这些指标证明a算法比b算法好,就必须证明a算法在聚类过程中没有迎合所选指标,无论有意无意。否则如何让人信服?
相比之下,外部指标通过将聚类结果和真实标签比较的方法评价聚类效果是比较客观的。虽然外部指标也有各种问题,也带有一定的主观性,但至少不在样本的真实标签上存在主观的判断。而作为评价标准,客观很重要。
赞
一下
回复此楼
9楼
2014-04-11 01:21:59
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
jssw
金虫
(初入文坛)
应助: 0
(幼儿园)
金币: 1132.5
帖子: 7
在线: 217.3小时
虫号: 2139759
注册: 2012-11-21
专业: 计算机软件
★
小木虫: 金币+0.5, 给个红包,谢谢回帖
聚类评价指标有很多,Rand Index较为常用
赞
一下
回复此楼
10楼
2014-04-11 08:24:14
已阅
回复此楼
关注TA
给TA发消息
送TA红花
TA的回帖
相关版块跳转
数理科学综合
机械
物理
数学
农林
食品
地学
能源
信息科学
土木建筑
航空航天
转基因
我要订阅楼主
qdairman
的主题更新
12
1/2
返回列表
1
2
下一页
如果回帖内容含有宣传信息,请如实选中。否则帐号将被全论坛禁言
普通表情
龙
兔
虎
猫
高级回复
(可上传附件)
百度网盘
|
360云盘
|
千易网盘
|
华为网盘
在新窗口页面中打开自己喜欢的网盘网站,将文件上传后,然后将下载链接复制到帖子内容中就可以了。
信息提示
关闭
请填处理意见
关闭
确定