粗糙集与其他软计算理论结合情况进行综述研究
来源:网络 时间:2017-07-01 00:32:00
3.2 粗糙集与神经网络的联系
粗糙集对事物的识别和判断是基于论域上的不可辨关系,它不需要任何先验的信息。通过系统参数的重要度函数来获得描述事物各个属性的重要度,依此不仅可以进行属性的约简,而且也可以用于把握事物的主要特征,提高识别能力。粗糙集可以实现对信息系统的知识约简,去除冗余的信息,减少输入信息的空间维度,提高处理效率。不过粗糙集的抗干扰能力较差,对于噪声较为敏感,在噪声较大的环境中就表现得不尽如人意。
神经网络的特点就是通过训练和学习产生一个非线性的映射,模拟人的思维方式,具有很好的自适应性,可以实现有监督和无监督的学习,并能够对信息进行并行处理;同时,它具有很好的抑制噪声的能力。但是神经网络也有很明显的缺陷,它无法对输入的信息进行有用性或冗余性的判断,因此不能对输入的信息进行简化,这使得它在处理空间维数较大的信息时会很困难和低效。
粗糙集与神经网络各自的长处和短处让人们发现它们具有很好的互补性;另外,从对人类思维模拟的角度看,粗糙集方法模拟人类的抽象逻辑思维,而神经网络方法模拟人类的形象直觉思维。因此,将两者结合起来,用粗糙集的特点去弥补神经网络在处理髙维度数据上的不足,而用神经网络的抗干扰强的特性去弥补粗糙集对噪声的敏感性,将模拟人的抽象思维与形象直觉思维相结合,就会得到更好的效果。目前,这方面的研究已成为一个重要的研究方向。
3.3 粗糙集与神经网络的结合
粗糙集与神经网络最常见的结合方式主要有两种:a)将粗糙集作为神经网络的前端处理器[53],通过利用粗糙集先对原始信息进行属性及属性值的约简,去除冗余信息,降低信息空间的维度,为神经网络提供一个较为简化的训练集,然后再构建和训练神经网络。这样的结合方式不仅缩短了神经网络的学习和训练的时间,提高了系统反应速度,而且也可以充分发挥神经网络在抗噪性和容错性的优势,达到提高神经网络整体性能的目的。b)通过在神经网络中引入一种粗糙神经元来进行,将粗糙神经元与普通神经元混合起来使用构成粗糙神经网络。
粗糙神经元是Lingras[54]设计的一种由一对重叠的普通神经元——上神经元和下神经元r组成,如图1所示。粗糙神经元中上神经元和下神经元r整体看成是一个神经元r,神经元之间的连线表示信息的相互交换。图2~4分别表示粗糙神经r与s之间的全连接、抑制连接和激励连接三种常见连接方式。粗糙神经元的输出是具有上近似和下近似的一对数值,而普通神经元只有一个输出值。下近似或上近似的神经元输入根据以下公式计算权值:
input?i=?nj=1wji×output?j
其中:wji为神经元j到i神经元间的连接权值,n表示i与j间存在的连接个数。
若f(u)为神经元激励函数,则粗糙神经元的上下神经元的输出值分别为
output?=max(f(input?), f(inputr))
output?r=min(f(input?), f(inputr))
计算普通神经元i的单个输出值的公式:
output?i=f(input?i)
函数f(input)为sigmoid型函数,定义如下:
f(u)=1/(1+e??-gain×u)
其中:增益系数gain是由系统的设计者确定的斜率。f(u)采用sigmoid型转移函数是因这种转移函数在0~1具有连续的取值。
有关粗糙集与神经网络的结合研究,还有其他学者研究提出的一些新的结合方式,如强耦合集成[55]方式,为解决神经网络设计中的网络的隐层数、隐层节点数和初始权值的确定及网络语义提供了一种便于实现的新思路。随着软计算理论中的各种理论和技术的不断发展和创新,将神经网络与诸如进化算法、概念格、证据理论及混沌学等加强结合研究,相信会取得更加让人振奋的成就。
4 粗糙集与遗传算法
遗传算法[56]是一种自然进化系统的计算机模型,也是一种通用的求解优化问题的适应性搜索方法。它的本质特征在于群体搜索策略和简单的遗传算子,是目前进化算法中最为重要的一种算法,广泛地应用于人工智能、数据挖掘、自动控制及商业等领域。
4.1 遗传算法基本原理
遗传算法通过模拟自然选择和遗传机制,以迭代的方式对其研究的对象群体进行适应性评价、选择、重组,直到目标群体满足预定的要求或者达到最大迭代次数,从而得到其希望的最优解。遗传算法的关键问题是对问题空间中个体的编码方式的选择、适应函数的确定,以及遗传策略中选择、交叉、变异三个遗传算子和选择概率p?s、交叉概率p?c、变异概率p?m等遗传参数的确定。下面是一个标准遗传算法的算法描述[56]:
迭代开始(iteration):t=0
初始化(initialize):P(0)={a?1(0),a?2(0),…,a?n(0)}
适应性评价(evaluate):P(0)={f(a?1(0)),…, f(a?n(0))}
while(循环)T(P(t))≠true do
选择(select):P′(t)=s(P(t),p?s)
交叉(crossover):P″(t)=c(P′(t),p?c)
变异(mutate):P?(t)=m(P″(t),p?m)
新一代群体:P(t+1)=P?(t),t=t+1
适应性评价(evaluate):
P(t+1)={f(a?1(t+1)),…, f(a?n(t+1))}
结束(end do)
4.2 粗糙集与遗传算法的结合
粗糙集与遗传算法的结合主要应用在属性的约简[57~59]、数据挖掘[60]等方面。粗糙集中对于属性的约简通常采用启发式算法,如基于Pawlak属性重要度的属性约简算法、基于差别矩阵的属性约简算法等。这种方法在一定的问题规模范围内会较为有效,但随着问题的规模增大,其最小约简的求解难度也会大幅增加。遗传约简算法是求取信息系统最小约简或者相对最小约简的一种算法。所谓最小约简或者相对最小约简,就是属性集的所有约简或者相对约简中,包含属性个数最少的属性集。由于遗传算法是一种基于全局优化的搜索方法,并具有并行性和很好的鲁棒性,能够防止搜索陷入局部最优解的困境,更利于处理大规模问题的约简。
文献[57]根据可辨别关系的下三角矩阵,利用遗传算法提出一种基于遗传算法的粗糙集知识约简算法,这种算法不仅可以得到正确的约简,而且也能解决粗糙集中启发式算法无法求解的部分问题;文献[61]将信息论角度定义的属性重要性度量作为启发式信息引入遗传算法,并构造一个新的算子modifypop(t+1)来对种群进行修复,既保证了算法的整体优化性,也提高了算法的收敛速度。在数据挖掘方面,文献[60]将粗糙集与遗传算法相结合,提出一种从大型数据表中获取决策规则的方法。该方法利用粗糙集中属性的重要度和核的思想得到属性的约简,然后借助遗传算法来求得最优解。
此外,对连续属性的离散化处理是粗糙集中的一个重要问题。属性离散化处理的关键在于选取合适的断点对条件属性构成的空间进行划分以减少搜索空间。文献[62]针对该问题利用遗传算法将最小断点集作为优化目标,并构造一个新的算子来保证所选断点能保持原决策系统的不可分辩关系。
5 粗糙集与概念格
概念格理论也被称做形式概念分析理论,是由德国数学家While提出的一种基于概念和概念层次的数学化表达[63],对于数据分析和规则提取非常有效。目前广泛应用于机器学习[64]、软件工程[65]等领域。
5.1 概念格理论的基本知识
定义9[66] 形式背景。称(U,A,I)为一个形式背景,其中U={x?1,x?2,…,x?n}为对象集,每个x?i(i≤n)称为一个对象;A={a?1,a?2,…,a?n}为属性集,每个a?j(j≤m)称为一个属性;I为U与A之间的二元关系,IU×A。若(x,a)∈I ,则说x具有属性a,记为xIa。
在形式背景(U,A,I)下,若对象子集XU,属性子集BA,分别定义运算算子X?*和B?*为
X?*={a|a∈A,?x∈X,xIa}
B?*={x|x∈U,?a∈B,xIa}
其中:X?*表示X中所有对象共同具有的属性的集合,B?*表示共同具有B中所有属性的对象集合。
定义10 形式概念。设(U,A,I)为形式背景,如果一个二元组(X,B)满足X?*=B且B?*=X,则称(X,B)是一个形式概念,简称概念。其中,X称为概念的外延,B称为概念的内涵。
定义11[67] 子概念、父概念。如果(X?1,B?1)≤(X?2,B?2),且两者之间不存在与它们不同的概念(Y,C),满足(X?1,?B?1)≤(Y,C)≤(X?2,B?2),则称(X?1,B?1)是(X?2,B?2)的子概念,(X?2,B?2)是(X?1,B?1)的父概念。
粗糙集与概念格之间都是基于二元关系的数据表来展开研究的。粗糙集是根据其论域上的不可辨关系实现对论域的划分,产生若干个等价类。概念格是基于形式概念,结合序理论和完备格理论进行概念分层讨论。概念格的每个概念就是具有最大共同属性的对象的集合,这一点与粗糙集的等价类非常相似。在形式背景中,外延即是由内涵所确定的等价类。因此,粗糙集的一些性质包括等价类,上、下近似等都可以通过概念来描述;同时,利用概念格的特殊结构可以得到函数依赖,从而可以用概念格来直观地进行条件属性的约简。
粗糙集与概念格的相似性让两个理论之间有了密切的联系,很多学者将它们结合起来研究。魏玲等人[67]分析研究了形式概念与等价类、概念格与划分之间的相互关系,得出粗糙集中的划分和概念格理论中的概念格可以进行相互转换的结论;文献[68]将粗糙集理论中属性约简和辨识矩阵的概念引入到形式概念分析中,实现了形式背景中冗余知识的约简;Yao[69,70]基于对象定向概念的概念格讨论了概念格和粗糙集理论之间的对应关系,将粗糙集理论中上下近似的思想引入到形式概念分析中,分别讨论了形式概念分析中的几种近似算子。文献[71]将包含度和偏序集的概念引入到形式概念分析中,对形式概念分析中的一些基本概念分别用包含度和偏序集加以表示。文献[72]利用形式概念分析中的名义梯级背景(nominal scale)和平面梯级(plain scaling)的概念,论证了粗糙集理论中的上下近似、属性依赖等核心概念都可以在相应的衍生背景中进行表示,并指出利用梯级的概念可以对粗糙集理论进行扩展,为两者的融合提供了一个理论平台。文献[73]的研究结合粗糙集与概念格理论,给出了在形式背景下概念集合上的元素之间的二元运算,使一般意义下的概念格成为带有算子的概念格。
6 粗糙集与证据理论
证据理论[74]也常称做D-S理论,是一种利用一组函数来处理不确定性问题的理论。证据理论中的证据指的是研究对象的属性或者专家经验等。
6.1 证据理论基础
设Θ表示对一个问题的所有可能答案的集合,其中的每一个答案θ都是Θ的一个子集,子集之间是无交集的,称Θ为辨识框架。
定义12[75] 基本可信度分配函数。设Θ是一个辨识框架,如果集函数m:2?Θ→[0,1]满足m(Φ)=0,并且?A?Θm(A)=1,则称m为Θ上的基本可信度分配函数;?A?Θ,m(A)称为A的基本可信度。
在定义12的基础上,本文定义Θ的幂集2?Θ上的三个测度?函数:
a)信任函数Bel,Bel(X)=?AXm(A),?XΘ;
b)似然函数pl,pl(X)=?A∩X≠?m(A);
c)公共函数Q,Q(X)=?X?Am(X)。
其中:信任函数Bel表达了对每个命题的信度;似然函数pl(X)表示对命题X不怀疑的程度;公共函数Q(X)反映了包含X的集合的所有基本可信度之和。
6.2 粗糙集与证据理论的联系
证据理论根据可信度分配函数来定义信任函数、似然函数,通过这对函数在给定证据下对假设进行估计和评价。在证据理论中,证据主要是已知的事物的属性或者专家经验等一些先验知识,这使得证据推理具有较强主观性,限制了其使用范围。证据理论的这些特征与粗糙集存在明显的互补性和相似性。粗糙集对于问题的解决是基于一对客观的近似算子,具有很强的客观性;而粗糙集中的下、上近似与证据理论中的信任函数、似然函数在形式上又有着一定的相似性。将两者的优势进行互补以及相似性进行结合的研究,已成为这个领域的一个重要方向。
文献[76,77]通过在一个随机近似空间上进行粗糙集与证据理论的相似性研究,得出结论:证据理论中的信任函数与似然函数可以用粗糙集中下近似与上近似的概率来描述:
Bel(X)=|R(X)|/|U|,pl(X)=|(X)|/|U|
文献[78]也对粗糙集与证据理论之间的关系进行了进一步的研究,认为不同的辨识框架与有着不同下、上近似的各种粗糙近似空间之间有着密切联系,并可以用这种联系来解释辨识框架上的信任函数与似然函数,以加深对这两个理论的?认识。
7 结束语
科技的发展让人们对于生活、学习、科学研究等各种现代化工具的期望趋于自动化、便捷化、智能化、高速化。而客观的现实是人们获得和需要处理的数据不仅数量庞大复杂,而且绝大部分都是不确定的、不完整的或者是不全真的。如何有效地、快速地从中提取出人们需要的信息就成了亟待解决的问题。软计算理论的出现帮助人们在这一方面取得了巨大的成就,粗糙集的迅速发展也为软计算理论的应用与研究提供了强大支持和扩展。随着对软计算理论不断深入的研究和发展,人们发现单个的软计算理论在理论上和应用上都存在着这样或那样的不足,而这些理论之间很强的互补特性则可以弥补这些不足。因此,将不同的软计算理论结合起来研究已成为当前学术界的共识。
- 上一篇:IGRS与UPnP设备互连的安全机制探讨
- 下一篇:粒计算下的粗糙集模型对比
最新论文
热点论文
- [中等教育] 职专政治教育中的德育渗透
- 帮助学生树立正确的价值观和人生观,提升学生的个人品德与思想素质,是职专政治教育的主要目标与根本目的。但受限于传统政治教育的教学 [全文]
- [中国哲学] 传递“中国梦”正能量是记者的神圣使命
- 摘要:中国梦是中华民族伟大复兴的梦,是当今中华民族前进的动力,是当前中国最具影响力、最具感染力、最具普遍性的正能量。记者作为以 [全文]
- [财务控制] 论企业集团财务控制的对策
- 摘 要:市场经济飞速发展促使企业集团组织形式发生非常大的变化,那么企业集团需要有效利用自身发展优势,促进现代化经济发展。 改革逐渐 [全文]
- [财务控制] 中小企业的财务控制问题分析
- 摘 要:随着市场经济体制不断完善,我国中小企业进入快速发展阶段,其在国民经济发展中的作用被不断凸显出来。本文中笔者以中小企业财务管 [全文]
- [职业教育] 分析音乐课堂中的情感互动及学生体验
- 【摘要】针对音乐课堂中的情感互动及学生体验进行分析,基于学生的实际音乐学习需求、音乐学习目标等予以教学设计,以期能够不断提升音 [全文]
- [市场营销] 新时期下市场营销的演变趋势分析
- 摘要:随着全球经济互相影响,新市场格局的形成让新时期环境里市场营销不断发生变革。而本文主要是对当今市场新形势进行一个分析,找出对市 [全文]
- [国际贸易] 国际贸易融资创新及风险控制
- [摘 要] 国际贸易企业融资风险的主要表现有两种:一是国际贸易企业无法以自身的流动资金偿还债务,要通过集资的方式偿还债务本金和利息; [全文]
- [国际贸易] “互联网 +”时代下国际贸易发展策略研究
- 摘 要:随着网络技术和经济全球化的进一步发展,互联网关系到国际贸易领域的方方面面,并以全新的国际贸易形态,将分散在世界各地的市场, [全文]