知识发现与管理 - 2 知识发现(3)

来源:网络收集 时间:2025-11-09 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xuecool-com或QQ:370150219 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

上述的 3 个机制从认知结构与智能结构的角度刻划了知识发现过程中的内在机理,奠定了知识发现的理论基础、优化了知识发现的结构、完善了知识发现的运行机制、完备了知识发现的功能、扩展了知识发现的应用。

2.3 知识发现系统框架及其理论体系 2.3.1 通用型知识发现系统框架

通用型知识发现系统采用 KDD* 结构模型,主要包括数据准备、数据挖掘、知识管理三大部分,主要功能模块如图1所示。

(1)数据预处理模块

第 6 页 共 15 页

知识发现与管理 2 知识发现

通过数据配置功能获取用户数据库信息,可将用户的各类关系型数据库系统的数据进行转化,然后利用数据选取、属性一致、填补空缺等手段进行数据清理。同时借鉴数据仓库技术的面向主题思想,由用户根据喜好建立不同的主题,并在此主题下选择数据,利用语言场理论,对原始数据进行离散化,形成不同主题的挖掘数据库,供挖掘模块使用。

(2)数据挖掘模块

提供两种挖掘启动形式:一种为用户自定义挖掘,即根据用户的要求对指定的属性程度词的相关性进行挖掘;另一种形式为利用启发式协调器,实现了我们提出的基于双库协同机制的关联规则挖掘算法———Maradbcm算法( Mining Association Rules Algorithms Based on Double-Bases Co-operating Mechanism),并提供对挖掘结果的综合评价功能成衍生知识库或充实基础知识库。

(3)知识管理模块

为用户提供将本领域已有的知识输入基础知识库,并且将数据挖掘模块存储在衍生知识库和基础知识库中的结果以可视化的形式表示出来。对于规则采用网格和图形两种表示方式。对于构成规则的属性程度词,用户可以选择查看挖掘数据库中实际数据在该属性的分布情况,从而对该规则的可靠性有更深刻的认识,为决策提供帮助。

图2-2 通用型知识发现系统功能模块图

在具体的挖掘过程中,用户可以循环调用以上模块,直至获得满意的决策信息为止。

第 7 页 共 15 页

知识发现与管理 2 知识发现

图 2-3 通用型知识发现系统的总体结构图

2.3.2 知识发现理论体系

根据通用知识发现系统的总体结构可推导出知识发现理论体系,如图2-4所示。

图2-4 知识发现理论体系圈

(1)理论基础

① 逻辑基础,基本概念包括数据(data):数据是客观事物的属性(property)、数量、位置等的抽象表示。信息(information):信息是数据所表示的含义(或称数据的语义)。信息是对数据的解释,数据是信息的载体。知识(knowledge):知识是以各种方式把一个或多

第 8 页 共 15 页

知识发现与管理 2 知识发现

个关联在一起的信息结构。知识的属性,包括真理性:对客观事物或客观世界的反映,可判定真伪;相对性:有适用条件和环境的要求;不完全性(不完备性):条件不完全或结论不完全;模糊性:在现实条件下的不精确性;可表示性:1)符号的逻辑结合——抽象表示;2)图形表示——形象表示;3)物理表示;可存储性(可记忆性),可传递性,可处理性;相容性(无矛盾性):关于知识的集合的属性,即存在与一体的所有知识之间应该是互相不矛盾的。按照不同的属性特点,知识有不同的分类方法按含义大体上可分为:事实,规则,规律,方法 理论;按使用范围可分为:通用知识、专门知识。事实:事实是指人类对客观事物的属性的值的描述(客观陈述——Objective description)。规则:规则指可以分解为前提(条件)和结论两部分的那种能够表达因果关系的知识。规律:规则中如果含有变量,则可将这类规则称为规律,规律比规则具有更广阔的适用范围,反映更深刻的知识。推理方法:推理方法是知识的很重要的一部分,通过它可以从已有的知识推出新知识,是获得知识的重要方法。

② 方法论基础,(鱼与鱼竿的故事)“方法论”(methodology)指的是处理问题的一般途径和程序。“方法”(method)指的是具体做法。用于完成一个既定目标的具体基础、工具或程序。知识发现研究方法如基于粗糙集理论的BP网络,模糊C-均值算法和最大化分类指标算法等。

③ 认识论基础,探讨人类认识的本质、结构,认识与客观实在的关系 ,认识的前提和基础,认识发生、发展的过程及其规律,认识的真理标准等问题的哲学学说。又称知识论。因此,知识发现就是要从认识的本质、结构,认识与客观实在的关系中识别有效的、新颖的、有潜在价值的以及最终可理解的模式。

(2)内在认识机理

① 双库协同机制,通过建立数据库与知识库间的关系, 产生“ 定向搜索” 与“ 定向挖掘” 的机制。

② 双基融合机制,挖掘数据库中的知识发现与知识库中的知识发现之间的内在联系的机制。揭示了基于数据库的知识发现模型与基于知识库的知识发现模型的逻辑等价。

③ 信息扩张机制,把信息扩散理论的结果经合理修正,有针对性地移植到知识发现系统中,建立双库协同、双基融合的信息开放系统中信息扩张的模型,以寻求在知识库与数据库的动态扩张下,知识信度、优化与算法复杂性等变化规律机制。揭示了动态挖掘进程中规则参数的演变规律。

④ 免疫进化机制,借鉴生命科学中免疫的概念与理论,提出了一系列揭示基于免疫机制

第 9 页 共 15 页

知识发现与管理 2 知识发现

的进化算法,其目的就是动态挖掘 KDD 进程中人工免疫与进化演算的协同性。

2.4 知识管理中知识发现方法

知识管理作为一种企业战略,其本质就是在恰当的时间以恰当的方式,将恰当的知识传递给恰当的人。因此知识的产生就是这个战略得以实施的源泉。1989年8月在美国底特律召开的第11届国际人工智能联合会议的专题讨论会上。提出了数据库的知识发现(knowledgediscoveryindatabase,KDD)。FayyadU。等人于1996年出版专著

旷,明确定义“KDD 是从数据集中识别出有效的、新颖的、潜在有用的以及最终可为人们理解的非平凡的知识的过程”。

在知识管理的关键内容中,知识发现是其中的—个重要部分,知识技术

百度搜索“70edu”或“70教育网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,70教育网,提供经典综合文库知识发现与管理 - 2 知识发现(3)在线全文阅读。

知识发现与管理 - 2 知识发现(3).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.70edu.com/wenku/159561.html(转载请注明文章来源)
Copyright © 2020-2025 70教育网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:370150219 邮箱:370150219@qq.com
苏ICP备16052595号-17
Top
× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:7 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219