人类在处理大量复杂信息时.由于人类认知能力有限,往往会把大量复杂信息按其各自特征和性能将其划分为若干较为简单的块.每个被分出来的块就被看成是一个粒。实际上,粒就是指一些个体通过不分明关系、相似关系、邻近关系或功能关系等所形成的块。这种处理信息的过程.称信息粒化。如商场的货物多种多样,如果不按某种方式摆放就很难进行有效管理.于是人们按货架所摆放货物的种类、体积、等级等将商场划分为若干块并以此安排货架,其每一块将摆放同一种类或体积相似或同一等级的货物。这里所说的块就是粒的概念,划分粒的过程称为信息粒
基本概念
粒计算是一个刚刚提出的研究领域, 至今还没有明确的定义与研究范围, 不同的研究者对这个领域的理解也不完全相同。大体可分为2大类: 一类侧重于不确定性处理; 另一类则注重于多粒度计算。
从粒计算的角度看计算的对象, 可能形成不同的计算模型。如果我们从多粒度计算的角度去看,这个计算模型大体由以下几个部分组成。基本粒子, 构成粒计算模型的最基本元素, 是计算模型的原语。一个粒子可以看作是由内部属性描述的个体元素的集合, 以及由它的外部属性所描述的整体。
粒层, 是对问题空间或计算对象的一种抽象化描述, 按照某个实际需求的粒化准则得到的所有粒子的全体构成一个粒层。同一层的粒子内部往往具有相同的某种性质或功能。由于粒化的程度不同,导致同一问题空间会产生不同的粒层, 各个粒层的粒子具有不同的粒度, 即粒的不同大小。粒计算模型的主要目标是能够在不同粒层上进行问题求解,且不同粒层上的解能够相互转化。
粒结构, 一个粒化准则对应一个粒层, 不同的粒化准则对应多个粒层, 粒层之间的相互联系构成一个关系结构, 称为粒结构。在一般的粒计算理论中, 把同一粒层的粒子看成一个集合, 通常并不考虑粒子之间的结构关系, 而在我们的商空间理论中, 粒层中的粒子间具有结构关系, 因此我们所谈的粒结构, 通常既指粒层间的结构关系, 同时又指粒层中的结构。
原理作用
粒计算是一种看待客观世界的世界观和方法论.信息粒广泛存在于我们的现实生活中.是对现实的一种抽象,信息粒化是人类处理和存储信息的一种反映。粒计算对人类的问题求解非常重要.它通过把复杂问题抽象、划分从而转化为若干较为简单的问题.有助于我们更好的分析和解决问题。
自Zadeh 1979年发表论文“Fuzzy sets and information granularity”以来 ,研究人员对信息粒度化的思想产生了浓厚的兴趣.Zadeh认为很多领域都存在信息粒的概念,只是在不同领域中的表现形式不同.自动机与系统论中的“分解与划分”、最优控制中的“不确定性”、区间分析里的“区间数运算”、以及DS证据理论中的“证据”都与信息粒密切相关.Hobss在1985年直接用“粒度(granularity)”作为论文题目发表论文,讨论了粒的分解和合并,以及如何得到不同大小的粒,并提出了产生不同大小粒的模型.I in在1988年提出邻域系统并研究了邻域系统与关系数据库之间的关系.1996年,他在UC-Berkeley大学访问时,向Zadeh提出作“granular computing”的研究,Zadeh称之为“granularmathematics”,I in改称为“granular computing”,并缩写成GrC.他发表了一系列关于粒计算与邻域系统的论文,主要是研究二元关系(邻域系统、Rough集和信任函数)下的粒计算模型,论述基于邻域系统的粒计算在粒结构、粒表示和粒应用等方面的问题,讨论了粒计算中的模糊集和粗糙集法,并将粒计算方法引入数据挖掘和机器发现.依据人们在解决问题时能从不同的粒度世界去分析和观察同一问题,并且很容易地从一个粒度世界转到另一个粒度世界,张钹和张铃在1990年针对复杂问题求解,建立了一种复杂问题求解的商结构形式化体系,给出了一套解决信息融合、
启发式搜索、路径规划和推理等问题的理论和算法.1997年,Zadeh进一步指出,世上有3个基本概念构成人类认知的基础:粒化、组织及因果关系.其中,粒化是整体分解为部分,组织是部分结合为整体,而因果关系则涉及原因与结果问的联系.物体的粒化产生一系列的粒子,每个粒子即为一簇点(物体),这些点难以区别,或相似、或接近、或以某种功能结合在一起.一般来说,粒化在本质上是分层次的,时间可粒化为年、月、日、小时、分、秒就是大家熟悉的例子.
基本问题
根据粒计算的上述模型与概念, 可以看到, 粒计算中存在2个基本问题: 粒化和基于粒化的计算。即如何构造这个模型, 以及根据这个模型的计算。粒化, 是问题空间的一个划分过程, 它可以简单理解为在给定粒化准则下(如等价关系)得到一个粒层的过程, 是粒计算的基础, 通过粒化我们可以得到问题空间的层次间与层次内部的结构。在同一或者不同的粒化准则下均可得到多个粒层, 形成多层次的网络结构。粒计算通过访问粒结构求解问题, 包括在层次结构中自上而下、或者自下而上2个方向的交互, 以及在同一层次内部的移动。即不同粒层上粒子之间的转换与推理, 以及同一粒层上粒子之间相互交互,形成所谓的多粒度计算。
模型与理论
粒计算模型大体分为2大类: 一类以处理不确定性为主要目标, 如以模糊处理为基础的计算模型, 以粗糙集为基础的模型; 另一类则以多粒度计算为目标, 如商空间理论 。这2类模型的侧重点有所不同, 前者在粒化过程中, 侧重于计算对象的不确定性处理, Zadel认为..在人类推理与概念形成中, 其粒度几乎都是模糊的, 因此他认为以模糊概念为基础的词计算, 是粒计算的主要组成部分。以Paw lak 为首的波兰学者提出的
粗糙集理论, 其基础也是基于“思维的计算,即关于含糊、不清晰概念的近似推理” 。而多粒度计算的思想则来源于H obbs的如下思想“人类问题求解的基本特征之一, 就是具有从不同的粒度上观察世界, 并很容易地从一个抽象层次转换到其它层次的能力, 即分层次地处理它们”。因此多粒度计算的目的是为了降低处理复杂问题的复杂性。
面临的挑战
随着计算机及网络的日益普及, 出现了以下趋势: 数据的复杂性增加且更加多样化, 如文本、图像、语音、与视频等; 海量数据; 人机交互更加频繁与密切。这种发展趋势给粒计算提出巨大的挑战。这里仅就粒化问题提出几点想法。
计算对象的粒化
一个复杂的对象(系统)通常具有复杂的内部结构, 因此要将粒计算方法应用于这类对象, 首先遇到的问题是对象的粒化, 或者是结构分析(分解)。信息结构通常有以下几种类型: 逻辑(语法)结构(如文本)、空间结构(如图像)、时间结构(如语音)、与时空结构(如视频)等。这些结构中, 有的是已知的固定结构, 如数据库; 有的是未知的固定结构, 如文本; 有的则是未知的变化结构, 如图像、网页内部结构等。对于后2 种未知的结构, 无论是固定还是变化的, 在粒化的过程中均存在如何选择信息结构中的基本元素, 如何划分, 如何表示粒层之间与粒层内部的结构, 以及结构本身的不确定性等难题,这都是当前研究的热点课题。已有的粒计算研究主要针对已知的固定结构, 如粗糙集研究中的决策表。
结构的表示
粒化之后, 另一个重要问题是如何表示这些结构。已有的进展是采用概率图模型, 如条件随机场、马尔可夫随机场等, 即利用概率来表示结构中的不确定性。为了分析
概率图模型, 在传统机器学习的基础上, 发展出一套具有结构数据的机器学习方法, 即结构预测法 。因此对于有结构的对象,也可以采用传统的机器学习方法加以处理。
面向大规模的实际问题
网络环境下, 粒计算必须面向大规模的问题, 这必然导致采用多粒度、多层次的分析与处理方法。因此需要在此框架下发展出一套高效的算法。
Yao的成果
在I in的研究基础上,Yao结合邻域系统对粒计算进行了详细的研究,发表了一系列研究成果,并将它应用于知识挖掘等领域,建立了概念之间的ifthen规则与粒度集合之问的包含关系,提出利用由所有划分构成的格求解一致分类问题,为数据挖掘提供了新的方法和视角.结合粗糙集理论,Yao探讨了粒计算方法在机器学习、数据分析、数据挖掘、规则提取、智能数据处理和粒逻辑等方面的应用.
Yao给 了粒计算的3种观点:
(1)从哲学角度看,粒计算是一种结构化的思想方法;
(2)从应用角度看,粒计算是一个通用的结构化问题求解方法;
(3)从计算角度看,粒计算是一个信息处理的典型方法.
研究情况
随着粒计算研究的发展,近年来国内外又有很多学者加入到了粒计算研究的领域.为了探讨粗糙集理论在各种环境下的应用,Skowron以包含度概念来研究粒近似空间上的Rough下近似和Rough上近似.刘清在Rough逻辑的基础上,提出了粒一逻辑的概念( 逻辑),构造了这种逻辑的近似推理系统,并应用于医疗诊断.近几年来,在掀起粒计算研究的热潮中,商空间理论被人们广泛认识和推广,2003年张铃和张钹将模糊概念与商空间理论结合,提出模糊商空间理论,为粒计算提供了新的数学模型和工具,并成功应用于数据挖掘等领域 。2002年苗夺谦等人 对知识的粒计算进行探讨,引入属性的重要度,并在求最小属性约简方面得到应用.王飞跃等人 对词计算和语言动力学进行了探讨,以词计算为基础,对问题进行动态描述、分析和综合,提出了设计、控制和评估的语言动力学系统.
王国胤等人 4提出了基于容差关系的粒计算模型,利用属性值上的容差关系给出了不完备信息系统的粒表示、粒运算规则和粒分解算法,同时结合粗糙集中的属性约简问题,提 了不完备信息系统在粒表示下属性必要性的判定条件,对粒计算方法在规则提取方面进行了探索.郑征等人提出了相容粒度空间模型,并在图像纹理识别和数据挖掘中取得了成功,他们认为,人类具有根据具体的任务特性把相关数据和知识泛化或者特化成不同程度、不同大小的粒的能力,以及进一步根据这些粒和粒之间的关系进行问题求解的能力.卜东波等人从信息粒度的角度剖析聚类和分类技术,试图使用信息粒度原理的框架来统一聚类和分类,指出从信息粒度的观点来看,聚类是在一个统一的粒度下进行计算,而分类却是在不同的粒度下进行计算,并根据粒度原理设计了一种新的分类算法,大规模中文文本分类的应用实践表明,这种分类算法有较强的泛化能力.Zhang等人对粒神经网络进行了探讨,并在高效知识发现中得到很好的应用.李道国等人研究了基于粒向量空间的
人工神经网络模型,在一定程度上提高了人工神经网络的时效性、知识表达的可理解性.杜伟林等人根据概念格与粒度划分在概念聚类的过程中都是基于不同层次的概念结构来进行分类表示,而且粒度划分本身构成一个格结构的特点,研究了概念格与粒度划分格在概念描述与概念层次转换之间的联系,通过对概念的分层递阶来进行概念的泛化与例化,使概念在递阶方面忽略不必要的冗余信息.Yager 探讨了基于粒计算的学习方法和应用.I in在2006年粒计算国际会议上提出了新的研究思路“infrastructures for AIengineering”.同时,Bargiela和Witold Pedrycz也从各个侧面对粒计算的根源和实质进行了详细的探讨和总结.Yager指出,发展信息粒的操作方法是当前粒计算研究的一个重要任务.
无处不在
粒计算是一种看待客观世界的世界观和方法论。信息粒广泛存在于现实世界中,是对现实的抽象。信息粒化旨在建立基于外部世界的有效的并以用户为中心的概念,同时简化我们对物理世界和虚拟世界的认识。
资料参考
论文:《粒计算及其应用研究》
论文导师 王周敬,论文学位 硕士,论文专业 系统工程
论文单位 厦门大学,点击次数 40,论文页数 75页
《粒计算:过去、现在与展望》
基本信息
作者: 苗夺谦 王国胤 刘清 林早阳 姚一豫 出版社:科学出版社 ISBN:9787030195708 上架时间:2007-8-23 出版日期:2007 年8月 开本:16开 页码:373 版次:1-1 所属分类: 数学 > 计算数学 > 计算方法教材 > 教材汇编分册 > 高等理工 本版教材征订号:0044094501-2 适用专业:计算机、计算机科学理论适用分级:博士、硕士
内容简介
粒计算是近十年来计算机科学中一个非常活跃的研究领域。本书由该领域知名的国内外华人学者撰写,分别对粒计算基础理论、模型及典型应用等进行了深入的讨论。内容涉及粒计算思想与方法、商空间、相容粒度空间、覆盖、粒逻辑、粒计算的数学模型及研究方向、粗糙集及其扩展、不完备信息系统、概念格、粒计算在数据挖掘和控制中的应用等方面。
本书通过丰富的文献资料和研前言究成果,对粒计算的过去做了回顾,对现状做出了剖析,对未来进行了展望,充分反映出各章作者对所论述问题独到的见解。本书对粒计算的理论与应用研究具有重要的参考价值。
本书可供计算机、自动化、电子工程专业的高年级本科生、研究生、教师、研究人员与工程技术人员参考。
《商空间与粒计算》
基本信息:张燕平等编著 出版社:科学出版社。主要介绍了运用商空间方法结构化问题从而进行粒计算的过程。