24小时热门版块排行榜    

Znn3bq.jpeg
查看: 920  |  回复: 6

朝天阙520

金虫 (正式写手)

[求助] 数据挖掘中聚类算法 已有2人参与

我的数据点集在一个球面上均匀分布,已知聚类数K,我只要求聚类算法能满足聚完类之后每个类中对象个数相等,可以做到吗?
回复此楼

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

自古悟中成大师,于无声处听惊雷
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hefei_lord

新虫 (初入文坛)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
感谢参与,应助指数 +1
朝天阙520: 金币+5, ★★★很有帮助 2015-04-27 16:35:00
朝天阙520: 金币+5, ★★★很有帮助 2015-04-27 16:35:23
如果样本是球状均匀分布,比如图示的K=2聚类情形,当迭代次数足够大时,两个聚类中心应该位于AB为直径的内圆边上,CD则是图示的AB为直径的一种样本划分情况,此时,外圆被CD一分为二,样本数目自然也是相等的!
K为其他情况时,也可以以此分析!
结论:样本是球状均匀分布,基本所有的聚类算法都可以实现等样本划分。
自己的看法!
数据挖掘中聚类算法
无标题.png

2楼2015-04-24 17:01:53
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

胡不归

木虫 (正式写手)

【答案】应助回帖

★ ★ ★ ★ ★
朝天阙520: 金币+5, ★★★很有帮助 2015-04-27 16:35:15
只是均匀分布,能保证实际样本中,类中所分到的样本数相等吗?就拿楼主所举的例子来说,万一样本数是偶数,两个类还勉强可以说是相等,但样本数是奇数呢?
3楼2015-04-25 09:44:58
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hefei_lord

新虫 (初入文坛)

【答案】应助回帖

引用回帖:
3楼: Originally posted by 胡不归 at 2015-04-25 09:44:58
只是均匀分布,能保证实际样本中,类中所分到的样本数相等吗?就拿楼主所举的例子来说,万一样本数是偶数,两个类还勉强可以说是相等,但样本数是奇数呢?

你要绝对相等?这里我模拟了个例子,二维四个象限【-10,10】共441个样本,样本圆形均匀分布的,当k=2时实现等值聚类划分,当k为其他值时,可近似实现,我怀疑与样本大小及迭代次数相关,我的实验 迭代次数是10000次!后续将采用更大样本数据实验!

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : 1.csv
  • 2015-04-26 13:10:46, 2.65 K
4楼2015-04-26 13:10:50
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

朝天阙520

金虫 (正式写手)

引用回帖:
4楼: Originally posted by hefei_lord at 2015-04-26 13:10:50
你要绝对相等?这里我模拟了个例子,二维四个象限【-10,10】共441个样本,样本圆形均匀分布的,当k=2时实现等值聚类划分,当k为其他值时,可近似实现,我怀疑与样本大小及迭代次数相关,我的实验 迭代次数是10000次 ...

如果是高维空间均匀分布的点,也能吗,有没有那篇文章涉及这个问题啊?
自古悟中成大师,于无声处听惊雷
5楼2015-04-26 21:14:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

朝天阙520

金虫 (正式写手)

引用回帖:
4楼: Originally posted by hefei_lord at 2015-04-26 13:10:50
你要绝对相等?这里我模拟了个例子,二维四个象限【-10,10】共441个样本,样本圆形均匀分布的,当k=2时实现等值聚类划分,当k为其他值时,可近似实现,我怀疑与样本大小及迭代次数相关,我的实验 迭代次数是10000次 ...

对了,我还想问一下你均匀分布的点集是如何生成的啊?
自古悟中成大师,于无声处听惊雷
6楼2015-04-26 21:16:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

hefei_lord

新虫 (初入文坛)

【答案】应助回帖

引用回帖:
6楼: Originally posted by 朝天阙520 at 2015-04-26 21:16:19
对了,我还想问一下你均匀分布的点集是如何生成的啊?...

用java写了个小函数,算不算太均匀的!

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : Uniformdistribution.java
  • 2015-04-28 21:19:30, 786 bytes
7楼2015-04-28 21:19:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 朝天阙520 的主题更新
最具人气热帖推荐 [查看全部] 作者 回/看 最后发表
[考博] 化学专业申博 +3 赵子羊 2026-05-23 4/200 2026-05-24 18:10 by 工大学长
[硕博家园] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +3 1rx34o113h 2026-05-23 3/150 2026-05-24 17:41 by 0i3mu4vkjz
[教师之家] 论文撤稿了 +4 bjvtcliu 2026-05-24 7/350 2026-05-24 17:29 by bjvtcliu
[硕博家园] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +4 hvkbtfonbv 2026-05-23 4/200 2026-05-24 17:21 by 75ui6h7z2t
[博后之家] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +3 hvkbtfonbv 2026-05-23 3/150 2026-05-24 17:10 by 75ui6h7z2t
[考博] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +3 hvkbtfonbv 2026-05-23 3/150 2026-05-24 17:01 by 75ui6h7z2t
[论文投稿] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +3 a2tycdlnq1 2026-05-23 4/200 2026-05-24 16:16 by hhx1yx9evi
[基金申请] 河北省自然科学基金 +6 Peterchao 2026-05-18 9/450 2026-05-24 16:02 by 130067131
[硕博家园] 售SCI一区T0P文章,我:8.O.5.5.1.O.5.4,科目齐全,可+急 +4 pmo95bazuy 2026-05-23 8/400 2026-05-24 15:56 by 1uy1ht2y9r
[基金申请] 西安交大新媒学院副院长用撤稿论文结题 +3 bjvtcliu 2026-05-24 5/250 2026-05-24 10:16 by kudofaye
[教师之家] 某211大学教师把个人教师官方主页改成:我跑了我跑了我跑了!官宣跑路! +4 zju2000 2026-05-21 5/250 2026-05-24 09:35 by songwz
[考博] 26/27申博自荐 10+4 ZXW0202 2026-05-22 9/450 2026-05-24 08:47 by bjvtcliu
[考博] 博士申请 +3 焦晓明 2026-05-21 3/150 2026-05-23 11:26 by mlc840311
[论文投稿] 投稿求助,期刊 +4 希冀,有书读 2026-05-20 8/400 2026-05-22 10:16 by 希冀,有书读
[文学芳草园] 献血感触 +7 呀呀好傻 2026-05-19 13/650 2026-05-21 20:15 by 呀呀好傻
[基金申请] 国自然评分 +4 无名者登山 2026-05-20 5/250 2026-05-21 16:35 by swuq
[基金申请] 国自然上会要求 +7 无名者登山 2026-05-18 11/550 2026-05-21 15:50 by draco1987
[基金申请] 提交了我也来说说感想 +9 fummck 2026-05-20 10/500 2026-05-21 14:17 by draco1987
[有机交流] 反应很差,大量原料没有反应 5+3 Mr.Zot 2026-05-19 8/400 2026-05-20 22:19 by Equinoxhua
[考博] 如果工作了想读博,可以边工作边读全日制嘛? 30+3 铁达火车 2026-05-18 5/250 2026-05-20 09:33 by tfang
信息提示
请填处理意见