热搜:南怀瑾 |证严上人

分类浏览



数据库与智能数据分析 ———技术、实践与应用
作者:
施伯乐 朱扬勇 编著
定价:
25.00元
页数:
228页
ISBN:
ISBN7-309-03580-1/T.273
字数:
346千字
开本:
16 开
装帧:
平装
出版日期:
2003年5月       
本类其他相关图书

内容提要


       编辑出版说明
      
       21世纪,随着科学技术的突飞猛进和知识经济的迅速发展,世界将发生深刻变化,国际间的竞争日趋激烈,高层次人才的教育正面临空前的发展机遇与巨大挑战。
       研究生教育是教育结构中高层次的教育,肩负着为国家现代化建设培养高素质、高层次创造性人才的重任,是我国增强综合国力、增强国际竞争力的重要支撑。为了提高研究生的培养质量和研究生教学的整体水平,必须加强研究生的教材建设,更新教学内容,把创新能力和创新精神的培养放到突出位置上,必须建立适应新的教学和科研要求的有复旦特色的研究生教学用书。“21世纪复旦大学研究生教学用书”正是为适应这一新形势而编辑出版的。“21世纪复旦大学研究生教学用书”分文科、理科和医科三大类,主要出版硕士研究生学位基础课和学位专业课的教材,同时酌情出版一些使用面广、质量较高的选修课及博士研究生学位基础课教材。这些教材除可作为相关学科的研究生教学用书外,还可以供有关学者和人员参考。
       收入“21世纪复旦大学研究生教学用书”的教材,大都是作者在编写成讲义后,经过多年教学实践、反复修改后才定稿的。这些作者大都治学严谨,教学实践经验丰富,教学效果也比较显著。由于我们对编辑工作尚缺乏经验,不足之处,敬请读者指正,以便我们在将来再版时加以更正和提高。
      
      
       复旦大学研究生院
      
       2002年6月
      
      
       本书将数据库与当前数据分析技术有机地结合在一起,从数据库的基础知识讲起,全面介绍了智能数据分析的各个方面。对数据分析与数据建模,客户/服务器数据库设计,知识库系统,数据仓库,联机分析处理,数据挖掘技术等进行了系统的阐述。
       本书可以作为计算机专业研究生教材,也可作为有关专业技术人员的参考书。

作者简介

书摘


       前 言
      
       在19世纪末,人们设计所谓的计算机就是想让它辅助人脑或像人脑一样工作,到了20世纪当按照这种愿望设计的机器被创造出来时,却先在计算领域获得成功应用,于是它被称为计算机。虽然计算机随后带来的迅猛发展和给社会带来的巨大变革是前人始料不及的,但人们却至今无法让计算机像人脑一样工作。多少年来,人们一直在这方面进行着不懈努力,甚至发展了人工智能学科,将人的学习、推理和思考形式化,并且将管理大数据量的数据库技术也结合起来。但人脑几乎无限的信息存储量和极快的推理判断速度,是目前的计算机所无法达到的,况且人脑的很多机理还没有被认识。
       虽然如此,人们还是努力使各种计算机系统带上智能色彩,其中最典型的就是决策支持系统。在计算机信息处理系统中,底层是操作型信息系统,中间是管理信息系统,最高层就是决策支持系统,即对人的决策行为提供支持。决策支持系统是在20世纪70年代提出来的,到了80年代更是出现了各种各样的专家系统,以及充分结合人工智能和数据库技术的知识库系统,但应用效果并不好。在20世纪90年代,人们认识到了数据的决策分析和数据的事务操作有很大的不同点,于是发展了数据仓库技术,并在延续统计学方法和人工智能技术的基础上发展了它们在大数据量上的应用技术,形成了联机分析处理(OLAP)和数据挖掘技术。到了21世纪,数据仓库、数据挖掘技术更是被认为是互联网之后的技术热点,具有极大的发展潜力和应用前景。这些技术形成了智能数据分析的技术内涵。
       本书力求全面地介绍智能数据分析的各个方面,包括智能数据分析的基础内容———数据库建设、在数据库上进行逻辑推理的知识库技术、进行数据分析的联机分析处理、数据仓库的设计技术和数据挖掘技术等等。本书的内容大致安排如下:
       第1章介绍了一些基本知识,主要有数据模型、体系结构、数据库语言等概念以及数据库的发展。
       第2章介绍了数据库设计与数据建模,包括数据库生命周期、数据需求分析和数据库设计。第3章系统介绍了数据库设计的ER方法,主要有基本ER构造、高级ER构造、建立ER模型的方法,包括划分实体和属性、找出泛化和汇集层次、视图集成等技术。
       第4章介绍了语义对象模型及其建模,包括语义对象定义、属性、标识符和视图等基本概念以及语义对象的建模过程。
       第5章介绍了关系数据库的规范化原理和方法,包括范式、规范化框架和规范化算法等内容。第6章介绍了数据模型到关系模式的转换,包括ER模型转换到关系模式、语义对象模型转换到关系模式。
       第7章介绍了客户/服务器数据库设计,包括客户/服务器式数据库的分析与设计以及公共数据库与私有数据库等。第8章介绍了知识库系统,主要介绍了知识库定义、DATALOG语言、递归规则语义、查询优化原理及其算法、知识库系统和语言的发展。
       第9章介绍了数据仓库,包括提取、转换、清洗、加载、汇总等概念以及数据仓库体系结构和数据仓库设计方法等。
       第10章介绍了联机分析处理技术,包括多维数据模型、多维数据操作、OLAP体系结构、OLAP产品及开发实例等。
       第11章介绍了数据挖掘技术,包括关联规则、分类、预测、聚类及其算法,模式评价与知识表示以及数据挖掘应用等。
       本书由施伯乐教授和朱扬勇教授编著,张忠平、李荣和曹顺良参加了部分章节的编著。在本书的写作过程中得到了上海市研究生教材基金、复旦大学研究生院重点课程建设基金的支持,复旦大学计算机与信息技术系数据挖掘课题组对许多内容进行了讨论,提出了许多好的建议,复旦大学出版社为本书的出版做了大量的工作,在此一并表示谢意。书中的不妥之处全属作者水平有限所致,如蒙读者指正,不胜感谢。
      
       作 者
      
       2003年3月1日于复旦大学
      
      
       目 录
      
       第1章 数据库基础知识
      
       1.1 概念
       1.1.1 从文件系统到数据库系统
       1.1.2 数据库系统
       1.1.3 数据模型
       1.1.4 数据库系统的体系结构
       1.1.5 与数据库相关的人员
       1.2 数据库发展
       1.2.1 第一代:层次数据库和网状数据库
       1.2.2 第二代:关系数据库
       1.2.3 第三代:后关系数据库
       1.2.4 数据库发展大事记
       1.3 数据库分类
       1.3.1 根据数据模型分类
       1.3.2 根据体系结构分类
       1.3.3 根据数据类型分类
       1.4 数据库研究
       1.4.1 数据库理论
       1.4.2 数据模型
       1.4.3 数据库语言
       1.4.4 数据的安全性
      
       第2章 数据库设计与数据建模
      
       2.1 数据库应用系统
       2.1.1 EDP
       2.1.2 MIS
       2.1.3 DSS
       2.2 数据库设计
       2.2.1 为什么要数据库设计
       2.2.2 数据库设计的工作
       2.2.3 数据库生命周期
       2.2.4 数据库设计方法
       2.3 数据需求分析与数据建模
       2.3.1 什么是数据需求分析
       2.3.2 数据需求分析与系统生命周期
      
       第3章 ER模型及其建模
      
       3.1 基本ER构造
       3.1.1 实体
       3.1.2 联系
       3.1.3 属性
       3.2 高级ER构造
       3.2.1 泛化
       3.2.2 汇集
       3.2.3 弱实体、存在依赖和标识依赖
       3.3 建立ER模型
       3.3.1 需求分析与ER建模
       3.3.2 区分实体和属性
       3.3.3 找出汇集层次
       3.3.4 找出泛化层次
       3.3.5 找出弱实体
       3.3.6 定义联系
       3.3.7 建立ER模型的几点原则
       3.4 视图集成
       3.4.1 视图集成的基本问题
       3.4.2 简单的视图集成
       3.4.3 视图集成的基本步骤
       3.4.4 举例
      
       第4章 语义对象模型及其建模
      
       4.1 语义对象
       4.1.1 定义
       4.1.2 属性
       4.1.3 语义对象标识符
       4.1.4 语义对象实例
       4.1.5 语义对象视图
       4.2 语义对象建模的过程
       4.2.1 某大学管理数据库
       4.2.2 描述语义对象
       4.2.3 语义对象建模的步骤
       4.3 数据分析与语义对象建模
       4.3.1 简单语义对象
       4.3.2 组合语义对象
       4.3.3 复合语义对象
       4.3.4 混合语义对象
       4.3.5 关联语义对象
       4.3.6 父/子类型语义对象
       4.3.7 原型/版本语义对象
       4.4 与相关概念的比较
       4.4.1 面向对象的程序设计与语义对象
       4.4.2 语义对象模型和ER模型的比较
      
       第5章 关系数据库模式规范化
      
       5.1 规范化
       5.1.1 意义
       5.1.2 泛关系假设
       5.2 基本概念
       5.2.1 投影与连接
       5.2.2 函数依赖
       5.2.3 Armstrong公理系统
       5.2.4 闭包和投影
       5.2.5 覆盖
       5.2.6 范式
       5.3 模式规范化
       5.3.1 规范化的框架
       5.3.2 无损连接分解
       5.3.3 保持函数依赖的分解
       5.4 规范化算法
       5.4.1 计算属性闭包
       5.4.2 计算投影
       5.4.3 求最小覆盖
       5.4.4 通用分解方法
       5.4.5 3NF分解
       5.4.6 BCNF分解
      
       第6章 从数据模型到关系模式的转换
      
       6.1 基本问题
       6.2 将ER模型转换到关系模式
       6.2.1 转换方法
       6.2.2 转换样例
       6.2.3 从ER图生成函数依赖
       6.2.4 从需求说明书中产生函数依赖
       6.3 将语义对象模型转换到关系模式
       6.3.1 转换简单语义对象
       6.3.2 转换组合语义对象
       6.3.3 转换复合语义对象
       6.3.4 转换混合语义对象
       6.3.5 转换关联语义对象
       6.3.6 转换父/子类语义对象
       6.3.7 转换原型/版本语义对象
      
       第7章 客户/服务器数据库设计
      
       7.1 客户/服务器数据库
       7.1.1 客户/服务器计算机网络
       7.1.2 客户/服务器数据库
       7.1.3 客户/服务器数据库环境
       7.1.4 客户/服务器数据库应用的特点
       7.1.5 说明
       7.2 客户/服务器式的分析
       7.2.1 基本分析模型
       7.2.2 功能分析和数据分析
       7.2.3 多级数据分析
       7.2.4 ER集成
       7.3 客户/服务器式的设计
       7.3.1 存储过程与泛模式
       7.3.2 泛模式下的功能设计
       7.3.3 数据库设计
       7.3.4 公共数据库与私有数据库
      
       第8章 知识库系统
      
       8.1 知识库的定义
       8.1.1 定义
       8.1.2 逻辑程序的语义
       8.2 DATALOG语言
       8.2.1 谓词
       8.2.2 规则和程序
       8.2.3 依赖图和递归
       8.2.4 安全性
       8.3 查询处理
       8.3.1 计算非递归规则的语义
       8.3.2 计算递归规则的语义
       8.4 查询优化原理及算法
       8.4.1 知识库查询的时间因素
       8.4.2 SemiˉNaive算法
       8.4.3 MagicˉSet算法
       8.4.4 知识库查询的低效性
       8.5 DATALOG的扩充
       8.5.1 否定
       8.5.2 函数
       8.5.3 集合
       8.5.4 其他
       8.6 知识库系统和语言的发展
       8.6.1 Prolog+SQL
       8.6.2 DATALOG及其扩充
       8.6.3 扩充的DATALOG+过程语言
       8.6.4 与面向对象数据库相结合
       8.6.5 知识库系统的体系结构的演变
      
       第9章 数据仓库
      
       9.1 数据仓库的产生
       9.1.1 信息分析处理与操作处理的区别
       9.1.2 为什么需要单独创建一个数据仓库
       9.2 数据仓库概念及其特征
       9.2.1 数据仓库概念
       9.2.2 数据仓库特征
       9.2.3 数据仓库与OLTP数据库系统比较
       9.3 数据仓库系统
       9.3.1 数据仓库的结构、粒度与分割
       9.3.2 数据仓库的数据组织形式
       9.3.3 数据仓库体系化环境
       9.3.4 数据仓库和数据集市
       9.4 数据仓库体系结构
       9.5 元数据
       9.6 将数据抽取到数据仓库
       9.6.1 提取
       9.6.2 转换
       9.6.3 数据清洗
       9.6.4 数据加载
       9.6.5 数据汇总
       9.7 操作型数据存储 1499.7.1 ODS的概念及其特点
       9.7.2 DB、ODS和DW的比较
       9.8 DBMS类型和数据仓库
       9.9 数据仓库设计方法
       9.9.1 DW系统设计与DB系统设计的不同
       9.9.2 数据仓库的数据模型
       9.9.3 数据仓库的创建方法
       9.9.4 数据仓库的创建步骤
       9.10 数据仓库的发展现状和趋势
      
       第10章 联机分析处理
      
       10.1 OLAP发展背景
       10.1.1 OLAP起源
       10.1.2 基本概念
       10.1.3 什么是OLAP
       10.1.4 OLAP特性
       10.2 OLTP与OLAP的关系
       10.3 多维数据模型
       10.3.1 多维数据
       10.3.2 多维数据结构
       10.3.3 OLAP数据索引技术
       10.3.4 OLAP Server分类
       10.4 OLAP多维数据操作
       10.4.1 切片和切块
       10.4.2 钻取
       10.4.3 旋转
       10.5 OLAP三层体系结构
       10.5.1 ROLAP体系结构
       10.5.2 MOLAP体系结构
       10.5.3 HOLAP体系结构
       10.6 OLAP应用开发实例
       10.6.1 ROLLUP操作
       10.6.2 CUBE操作
       10.7 流行的OLAP工具
       10.7.1 OLAP评价准则
       10.7.2 OLAP产品
      
       第11章 数据挖掘
      
       11.1 数据挖掘导论
       11.1.1 数据挖掘的概念
       11.1.2 数据挖掘的起源
       11.1.3 数据挖掘与OLAP的区别与联系
       11.1.4 数据挖掘流程
       11.2 数据预处理
       11.2.1 数据清理
       11.2.2 数据集成
       11.2.3 数据抽取与数据变换
       11.2.4 数据归约
       11.3 数据挖掘算法
       11.3.1 概念描述:特征化与比较
       11.3.2 关联规则挖掘
       11.3.3 分类和预测
       11.3.4 聚类分析
       11.4 模式评价与知识表示
       11.5 数据挖掘的应用
       11.5.1 数据挖掘工具
       11.5.2 数据挖掘商业模型及应用行业
      
       参考书目
      
      
      
      
      
      
      
      
      
      

书评       

   

地址:上海市国权路579号
邮编:200433
电话:021-65642854(社办)
传真:021-65104812

 
 

版权所有©复旦大学出版社,2002-2024年若有问题请与我们 (webmaster@fudanpress.com) 联系! 沪ICP备05015926号