| 查看: 548 | 回复: 1 | |||
| 当前主题已经存档。 | |||
[交流]
粗糙集简介
|
|||
|
粗糙集简介 1 粗糙集的基本概念 2.信息系统S[6,7]定义:S=。其中U是对象的集合,C∪D=A 是属性集合,子集C和子集D分别称为条件属性和决策属性,V是所有A的取值的集合,f;UxA→V是一个信息函数,它指定U中的每个对象x的属性值。. 1.1 粗糙集定义 给定一个有限的非空对象集合U,称为论域。 表示U上的一个等价关系,代表关于U的知识。等价关系R将集合U划分成不相交的子集,记为U/R,表示R的所有等价类族, 表示包含 的R等价类。粗糙集理论把知识看成是对有关对象论域的划分,而等价关系R和由其产生的等价类则是关于U的有效信息或知识。任意给定一个集合X U,如果使用R等价类无法精确描述X,则X就是R的粗糙集(Rough set);反之,X是R的精确集。 l 上下近似 一般来说,粗糙集X可以用两个精确集合----下近似(集)和上近似(集)来定义: 分别称它们为X的R的下近似(集)和R的上近似(集)。也可以用下面的形式定义: 。 l 边界域、正域和负域 集合 称为X的R边界域; 成为X的R正域; 称为X的负域;显然, 。 l 粗糙度 由等价关系R定义的集合X的近似精度为: 则X的R粗糙度定义为: l 依赖度和重要度 在数据归约中,利用两个属性集合 之间的相互依赖程度,可以确定一个属性a的重要性。属性P对R的依赖程度用γR(P)表示。定义如下: 属性a加入R,对于分类U/P的重要程度定义如下: 。 l 属性归约 在一个S中,如果 ,则a在属性集R中是冗余,否则a在R中对于D是不可缺少的。属性集B C是S的一个归约,当且仅当 ,且B 中的每个属性对于D都是不可缺少的。属性归约记为: 。一个信息系统可能存在多个属性归约集。 l 核和分辨矩阵 相对于属性集D,属于属性集合C的所有归约的交集的属性集合称为属性集C的核心,记为 。求核一般用分辨矩阵进行。信息系统S中关于属性集C的分辨矩阵 定义如下: 代表了区分 , 的完整信息。如果 ,则所有这样的 构成了CORE(C,D)。 [ Last edited by 幻影无痕 on 2006-11-18 at 07:35 ] |
» 猜你喜欢
拟解决的关键科学问题还要不要写
已经有7人回复
存款400万可以在学校里躺平吗
已经有17人回复
请教限项目规定
已经有3人回复
基金委咋了?2026年的指南还没有出来?
已经有10人回复
基金申报
已经有6人回复
推荐一本书
已经有13人回复
国自然申请面上模板最新2026版出了吗?
已经有17人回复
纳米粒子粒径的测量
已经有8人回复
疑惑?
已经有5人回复
计算机、0854电子信息(085401-058412)调剂
已经有5人回复
|
粗糙集首先从新的视角对知识进行了定义。把知识看作是关于论域的划分,从而认为知识是具有粒度〔granularity〕的。认为知识的不精确性是由知识粒度太大引起的。为处理数据〔特别是带噪声、不精确或不完全数据〕分类问题提供了一套严密的数学工具,使得对知识能够进行严密的分析和操作。又由于数据挖掘的深入研究和一些成功的商业运作,使得粗糙集理论和数据挖掘有了天然的联系,粗糙集在知识上的定义、属性约简、规则提取等理论,使得数据库上的数据挖掘有了深刻理论基础,从而为数据挖掘提供了一种崭新的工具。粗糙集不仅自己可以独特的挖掘知识,而且可以和其他的数据挖掘算法结合起来,从而产生了学多混合数据挖掘算法,大大开拓了数据挖掘的算法和技术,丰富了数据挖掘的工具。 除了研究,人们也在积极寻找粗糙集在数据挖掘中的应用,如RSES[18]系统,该系统是基于粗糙集理论上研制的数据挖掘系统,里面提供了粗糙集的属性约简算法和规则提取,可以找到最佳约简集和近似约简集,并可以提出规则。另外,还有,Regina大学开发的KDD-R系统[3],被广泛用于医疗诊断、电信业等领域。还有美国Kansas大学开发的LERS(Learning from Examples based on RS)系统,在医疗诊断、社区规划、全球气象研究等方面都有应用。 粗糙集目前研究得到了很大的发展,主要方向如下。 1.粗糙集的属性约简。约简是粗糙集用于数据分析上的重要方面,但是求最小约简是NP问题,大都采用启发式算法。⑴、重要性方法:根据重要性来对属性进行约简。⑵、根据布尔运算,此方法可以求出所有最小约简,但是只适合小数据集。⑶遗传算法:Bjorvand 和Kormoraski用遗传算法来求最小约简。 2.粗糙模型的扩展。粗糙集理论用于数据挖掘时会碰到噪音数据、数据缺失、大数据量的一系列经典模型处理不理想的情况,于是出现了扩展的模型。 ⑴可变精度模型:有一定容错能力,在一定情况下退化为经典模型。⑵相似模型:可以处理数据库中的缺失值。 3.粗糙逻辑。在RS的基础上建立rough逻辑。 4.多方法的融合。⑴粗糙集和神经网络的结合,加快神经网络的速度。⑵和遗传算法的结合来处理大数据集。 总之,。粗粮集理论的应用前景很广阔,不但可以用于构造新型的系统,而且关键在于它能够优化现有的许多算法。大数据集、高效约简算法、并行计算以及混合算法研究等问题仍是粗糙集在数据挖掘中需要探讨的问题。 |
2楼2005-06-30 10:57:12













回复此楼