24小时热门版块排行榜    

CyRhmU.jpeg
查看: 3077  |  回复: 11

typhoon111

木虫 (著名写手)

[求助] 机器学习时如何给数据分配权重

比如有些数据的可靠性高一些,在学习时可以给高一点的权重;有些数据比较古老,相对给低一点的权重。

有什么比较有效的办法呢?
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xxxatxmc

新虫 (小有名气)

搜索 Active Learning
世事皆虚幻
2楼2013-03-15 20:55:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xxxatxmc

新虫 (小有名气)

搜索 Active Learning
世事皆虚幻
3楼2013-03-15 20:55:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

typhoon111

木虫 (著名写手)

来个人帮帮忙啊。
4楼2013-03-19 09:37:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

typhoon111

木虫 (著名写手)

引用回帖:
3楼: Originally posted by xxxatxmc at 2013-03-15 20:55:40
搜索 Active Learning

楼上的讲清楚点啊。

还有你不是应助帖,我不能给你金币啊。
5楼2013-03-19 09:37:45
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

xxxatxmc

新虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
typhoon111: 金币+10, ★★★很有帮助, 好的,还是谢谢你的帮忙哈。 2013-03-19 14:37:28
引用回帖:
5楼: Originally posted by typhoon111 at 2013-03-19 09:37:45
楼上的讲清楚点啊。

还有你不是应助帖,我不能给你金币啊。...

哦,是不太清楚。感觉你这个问题有个解决方向叫做 Active Learning
至于中文是啥我不太清楚。但是Active Learning做的现有工作应该还是蛮多的,我的意思是你去google学术上搜:Active Learning,会出来很多文章,然后可以看看是不是适合你的要求。我对Active Learning不了解
世事皆虚幻
6楼2013-03-19 12:43:32
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

7rabbit

铜虫 (初入文坛)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ ★
typhoon111: 金币+15, ★★★很有帮助 2013-03-21 22:00:33
A WEIGHTED SUPPORT VECTOR MACHINE FOR DATA CLASSIFICATION
This paper appears in:
Neural Networks, 2005. IJCNN '05. Proceedings. 2005 IEEE International Joint Conference on
Date of Conference: 31 July-4 Aug. 2005
Author(s): Yang, Xu-Lei L.
Sch. of Electr. & Electron. Eng., Nanyang Technol. Univ., Singapore
Song, Qing; Cao, Aize Z.
Volume: 2
Page(s): 859        - 864 vol. 2
Product Type: Conference Publications
7楼2013-03-21 16:32:29
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

zheng0323

铜虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★
typhoon111: 金币+5, 有帮助 2013-03-26 21:30:05
如果只想把数据分成不同的类,那么“聚类”算法就够了;如果需要预测,则需要一个“分类”算法。

OpenCV库里面包含的是基于概率统计的机器学习方法,贝叶斯网络、马尔科夫随机场、图模型等较新的算法还在成长过程中,所以OpenCV还没有收录。
机器学习的算法有很多很多:
1、Mahalanobis
2、K-means  非监督的聚类方法
3、朴素贝叶斯分类器 特征是高斯分布&&统计上相互独立    条件比较苛刻
4、决策数  判别分类器,根据阈值分类数据,速度快。ID3,C4.5
5、Boosting  多个判别子分类器的组合
6、随机森林 由多个决策树组成
7、人脸检测/Haar分类器   使用Boosting算法
8、期望最大化EM  用于聚类的非监督生成算法  
9、K-近邻  最简单的分类器
10、神经网络(多层感知器)  训练分类器很慢,但是识别很快
11、支持向量机 SVM 可以分类,也可以回归。通过分类超平面实现在高维空间里的最优分类
12、遗传算法  借鉴生物遗传机制 ,随机化非线性计算算法
8楼2013-03-26 18:42:02
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

jeffary

木虫 (小有名气)

【答案】应助回帖

★ ★ ★ ★ ★ ★ ★ ★ ★ ★
typhoon111: 金币+10, ★★★很有帮助 2013-06-06 08:41:37
Weka支持给instance赋予权值。
9楼2013-06-04 23:09:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

typhoon111

木虫 (著名写手)

引用回帖:
9楼: Originally posted by jeffary at 2013-06-04 23:09:05
Weka支持给instance赋予权值。

可以吗?能否说下具体操作呢?
10楼2013-06-05 09:43:10
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 typhoon111 的主题更新
信息提示
请填处理意见