查字典论文网 >> 粗糙集理论及其应用综述

粗糙集理论及其应用综述

小编:

摘 要:粗糙集理论是一种新的分析和处理不精确、不一致、不完整信息与知识的数学工具,为智能信息处理提供了有效的处理技术,近年来,被广泛应用于专家系统、图像处理、模式识别、决策分析等领域。文中介绍了关于粗糙集的基本理论,并对其在各领域的应用情况进行了综述。

关键词:粗糙集理论;不确定性;知识约简;粗糙模糊集

中图分类号:TP18 文献标识码:A 文章编号:2095-1302(2017)06-00-02

0 引 言

粗糙集理论由波兰华沙理工大学Z.Pawlak教授于1982年首先提出,通过结合逻辑学和哲学中对不精确、模糊的定义,针对知识和知识系统提出了知识简约、知识依赖、知识表达系统等概念,并在此基础上形成了完整的理论体系――粗糙集理论。粗糙集理论把知识看作关于论域的划分,认为知识是有粒度的,而知识的不精_性是由知识的粒度过大引起的。从1992年至今,每年都要以粗糙集为主题召开国际会议,近两年,召开的关于粗糙集的会议有2015年国际粗糙集联合会议(IJCRS2015)和2016年第十六届中国粗糙集与软计算联合学术会议(CRSSC2016)。粗糙集越来越受到各行业专家和科研人员的重视,随着对粗糙集理论研究的不断加深,越来越多的领域开始运用粗糙集解决问题。

1 粗糙集理论

1.1 知识与知识系统

将研究对象构成的集合记为U,这是一个非空有限集,称为论域U,任何子集,称其为U中的一个概念或范畴。把U中任何概念族都称为关于U的抽象知识,简称知识。一个划分定义为:X={X1,X2,…,Xn},,Xi≠φ,Xi∩Xj=φ,且i≠j,i,j=1,2,…,n;∪niXi=U。U上的一簇划分称为关于U的一个知识系统。

R是U上的一个等价关系,由它产生的等价类可记为[x]R={y|xRy,y∈U},这些等价类构成的集合U/R={[x]R|x∈U}是关于U的一个划分。若PR,且P≠φ,则∩P也是一种等价关系,称为P上不可分辨关系,记为ind(P):。

1.2 粗糙集与不精确范畴

给定知识库K=(U,Q),对于每个子集和一个等价关系R∈ind (Q),定义在知识系统U/R下集合X的下近似为:

上近似表示属于X的对象组成的最小集合,即X的正域,记为POSR(X),而肯定不属于X的对象组成的集合称为X的负域,记为NEGR(X)。

在知识系统U/R下集合X的上近似为:

上近似是可能属于X的对象组成的最小集合。集合X的边界区域为:

边界区域BNR(X)是根据知识R,U中既不能肯定包含于集合X,又不能肯定包含于集合的元素构成的集合。

1.3 知识简约与知识依赖

知识简约,是在保持知识库分类能力不变的条件下,删除其中不相关或不重要的知识。令R为一簇等价关系,r∈C,若ind(R)=ind(R-r),则称r为R中不必要的,若对于每一个r∈C都为R中必要的,则称R为独立的,否则称R为依赖的。P中所有必要关系组成的集合称为核,记为core (P)。

定义知识R对知识Q的依赖程度为:

显然,0≤ξQ(R)≤1。当ξQ(R)=1时,知识R完全依赖于知识Q;当ξQ(R)→1时,说明定义知识R对知识Q的依赖程度高。ξQ(R)的大小从总体上反应了知识R对知识Q的依赖程度。

1.4 知识表达系统

在粗糙集理论中,一个知识表达系统可表示为S=(U,R,V,f),为其中U为论域,R为属性集合,V为属性值集合,f为一个信息函数,其对象的每个属性赋予一个信息值。即。

决策表是一类特殊而重要的知识表达系统。设S=(U, R, V,f)为一个知识表达系统,R=C∪D,C∩D=φ,称C为条件属性集,称D为决策属性集。具有条件属性集和决策属性集的知识系统称为决策表。

2 粗糙集理论的应用

粗糙集理论具有很强的实用性,目前在各领域已有诸多应用。

2.1 故障诊断

文献[1]中提出了一种基于粗糙集与证据理论的航空装备故障诊断方法,利用粗糙集框架实现对故障诊断模型的构造并对冗余信息进行简约,通过边界粗糙熵来衡量每个条件对决策的重要程度;文献[2]利用变精度粗糙集和信息论中互信息增量的特性,针对倾转旋翼机在过度转换时的故障进行诊断,利用OMELM对变精度粗糙集属性简约进行故障分类。

2.2 图像处理

粗糙集理论对不精确问题能够提供较好的解决方法,文献[3]将粗糙集理论与模糊聚类算法相结合用以解决图像分割问题。文献[4]依靠粗糙集对边界区域近似有较好的解决能力,将粗糙集近似集与粒子群算法相结合来解决图像分割问题,利用粗糙集理论得到图像的最优粒度,再通过粒度划分得到图像的近似集,从而利用近似集得到便捷的精准刻画。

2.3 专家系统

粗糙集理论对规则的抽取有较好的应用,因此能够为专家系统的构造提供理论基础。文献[5]利用粗糙集理论获取知识,建立决策表,并利用可辨识矩阵对决策表进行条件属性简约,能够获得需要诊断的故障树。

2.4 模式识别

文献[6]中关于矿井突水问题,可利用粗糙集对非正态、非线性和高维数据的处理能力,对存在大量不明确对应关系的特征进行简约,剔除与决策无关的属性,得到简约样本。

2.5 信息安全

在信息安全问题中,由于数据量大、信息种类繁多,无法形成统一阈值特性,所以很难针对不同种类的数据进行准确判断。文献[7]中提出了基于粗糙集合信息熵融合算法的入侵检测方法,利用粗糙集分析复杂信息的能力,对多样的入侵数据特征进行表达,构建入侵特征集合,根据决策表求出必要的特征集合,以有效解决多样数据检测困难的问题,提高效率。

热点推荐

上一篇:燃气―蒸汽联合循环供热机组综合管网地理信息系统应用

下一篇:如何对幼儿进行德育教育论文 幼儿园关于德育教育之类的论文

2023年教师教育教学心得体会 教师教育教学心得体会大班汇总 踢足球的心得体会