24小时热门版块排行榜    

查看: 301  |  回复: 1

东极

金虫 (小有名气)

[求助] 想讨论2个朴素贝叶斯的问题

想讨论2个朴素贝叶斯的问题,
问题1:朴素贝叶斯更适合大数据分类还是小数据。他对样本容量的适应性如何。
问题2:书上说,模型假设属性值有条件的相互独立,即在属性间不存在依赖关系。但是实践中由于对其使用假设(属性彼此独立)的不正确性,使分类正确率下降。我将原始数据进行转化后,新数据的属性彼此独立。但是新数据用贝叶斯的准确率还不如老数据。
回复此楼

» 猜你喜欢

地球物理测井数据挖掘
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

东极

金虫 (小有名气)

与决策树模型相比,朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。在属性个数比较多或者属性之间相关性较大时,NBC模型的分类效率比不上决策树模型。而在属性相关性较小时,NBC模型的性能最为良好。
地球物理测井数据挖掘
2楼2012-11-13 09:53:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 东极 的主题更新
信息提示
请填处理意见