24小时热门版块排行榜    

查看: 1560  |  回复: 6

kuiyuanYANG

铜虫 (小有名气)

[交流] 机器学习综述已有6人参与

机器学习综述
1、有监督
通常给定训练集、验证集和测试集,每个样本的特征和标号(注:标号可能是简单的0/1,也有可能是复杂的结构标号)都是给定的。算法就是根据训练集学习特征和标号之间的函数关系。这类算法比较直观,算法性能也比较好评价。
2、无监督
给定数据集,及每个样本的特征。算法根据数据集来分析数据的一些分布特性。这类算法因为没有groudtruth,通常不太好评价。
3、半监督
给定数据集,一部分是标注的,一部分是未标注的。侧重于如何利用大量无监督的数据(因为标注数据的成本是比较高的)来帮助有监督学习算法,这类算法发挥空间比较大。
4、主动学习
由于标注的成本比较高,如何标注少量的样本就能获得很好的性能,这是个很好的问题,也有较大的发挥空间(不同的模型、不同的策略)。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
2楼2011-10-31 23:24:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
3楼2011-11-01 10:33:19
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
谢谢分享
4楼2011-11-19 00:52:44
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

yean1980

木虫 (正式写手)


小木虫(金币+0.5):给个红包,谢谢回帖
刚写了一篇 半监督 学习的文章,,,,
佛曰:不可说,不可说!
5楼2011-11-21 22:21:35
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

tj_pr_2010

银虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
现在又出来 多标记学习了,还比较热。
6楼2012-06-16 18:53:43
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

彼岸simona

铜虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
科学前沿的知识还需普及!
Time lost can not be won again!
7楼2012-06-17 01:06:40
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 kuiyuanYANG 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见