24小时热门版块排行榜    

CyRhmU.jpeg
查看: 1777  |  回复: 5

零度心情

银虫 (小有名气)

[求助] 求助:机器学习和模式识别领域的一个基本问题

各位虫子:
        我有个问题想咨询一下,还望知道的同志多多指点。做模式识别和机器学习方向的同志应该会比较清楚这个问题的解法。

问题描述:
有一组(8个)整数数据,从小到大已经排好序。现在需要将这组数据分为大数集、中数集和小数集三组,要求这三个数集中的数据大小相对比较接近,每个数据集中的元素个数不固定。

问:这个函数该如何确定?
也就是说,将大于某个阈值的数据归为大数集,将小于某个阈值的数据归为小数集,其它的即为中数集。那么该分组方法的阈值函数如何确定?

举几个例子吧:
例子1:
输入数据:2、3、101、104、105、107、481、483
分组结果:小数集{2、3},中数集{101、104、105、107},大数集{481、483}

例子2:
输入数据:1、3、4、7、391、800、801、808
分组结果:小数集{1、3、4、7},中数集{391}、大数集{800、801、808}

例子3:
输入数据:0、3、301、981、982、983、990、991
分组结果:小数集{0、3},中数集{301},大数集{981、982、983、990、991}
回复此楼

» 收录本帖的淘帖专辑推荐

ML相关

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

ts2119

铁杆木虫 (著名写手)

【答案】应助回帖

感谢参与,应助指数 +1
零度心情(金币+5): 明白了 2011-12-15 21:33:58
把数据聚成3类就可以了
2楼2011-12-15 01:25:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

rosicky

金虫 (初入文坛)

【答案】应助回帖

感谢参与,应助指数 +1
零度心情(金币+10): 明白了,谢谢 2011-12-15 21:34:15
用聚类的方法。你的目标是使“这三个数集中的数据大小相对比较接近”,因此目标函数可以是使类内方差最小,类间方差最大。就是fisher鉴别分析了。
3楼2011-12-15 03:05:55
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

webbery

金虫 (正式写手)

【答案】应助回帖

感谢参与,应助指数 +1
零度心情(金币+5): 明白了,谢谢 2011-12-15 21:34:32
你这个问题比较简单,随便一个分类器都能做到。仅从你的例子看的话,一般的分类器都能够正确的分类。什么k-means,什么LDA,什么感知器,用最简单的就行。
4楼2011-12-15 09:23:56
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zhengyumeng

铜虫 (小有名气)

gmm也可以
5楼2011-12-16 09:02:39
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

130098300

银虫 (正式写手)

K-means就可以啊,简单的聚类应该就可以了
Working for the Lord with all my heart
6楼2011-12-16 10:02:36
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 零度心情 的主题更新
信息提示
请填处理意见