图书介绍

数据挖掘原理与SPSS Clementine应用宝典【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

数据挖掘原理与SPSS Clementine应用宝典
  • 元昌安编著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121086014
  • 出版时间:2009
  • 标注页数:671页
  • 文件大小:97MB
  • 文件页数:693页
  • 主题词:数据采集-理论;数据采集-统计分析-应用软件,SPSS

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘原理与SPSS Clementine应用宝典PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1部分 数据挖掘应用基础1

第1章 数据挖掘概述2

1.1 数据挖掘的社会需求2

1.2 数据挖掘的定义3

1.2.1 数据挖掘的技术定义3

1.2.2 数据挖掘的商业定义4

1.3 数据挖掘系统分类5

1.4 数据挖掘的应用领域6

1.4.1 金融领域7

1.4.2 数据挖掘在营销中的应用7

1.4.3 电子政务领域9

1.4.4 电信领域9

1.4.5 工业生产领域10

1.4.6 生物与医学11

1.5 数据挖掘标准和规范11

1.6 数据挖掘面临的挑战和局限性12

1.7 数据挖掘的发展趋势14

1.7.1 Web挖掘14

1.7.2 空间数据挖掘14

1.7.3 生物信息或基因的数据挖掘14

1.8 小结15

第2章 数据挖掘可挖掘的知识类型16

2.1 概念与类描述16

2.2 关联模式18

2.3 分类19

2.4 聚类分析20

2.5 预测21

2.6 时间序列22

2.7 偏差检测23

2.8 小结23

第3章 数据挖掘的体系结构与模型24

3.1 数据挖掘的体系结构24

3.2 数据挖掘的过程模型25

3.2.1 Fayyad模型25

3.2.2 CRISP-DM模型27

3.3 小结33

第4章 数据选择34

4.1 数据挖掘的对象34

4.1.1 数据库34

4.1.2 数据仓库35

4.1.3 文本36

4.1.4 Web信息36

4.1.5 空间数据37

4.2 选择建模数据37

4.3 构造建模数据集38

4.4 小结39

第5章 数据预处理40

5.1 数据预处理基本功能40

5.1.1 数据清理40

5.1.2 数据集成42

5.1.3 数据变换42

5.1.4 数据归约42

5.2 数据预处理的方法44

5.2.1 基于粗糙集理论的简约方法44

5.2.2 复共线性数据的预处理方法45

5.2.3 基于Hash函数取样的抽样技术数据预处理48

5.2.4 基于遗传算法的预处理方法50

5.2.5 基于神经网络数据预处理方法51

5.2.6 Web挖掘数据预处理方法53

5.3 小结54

第2部分 数据挖掘经典算法55

第6章 回归分析56

6.1 回归分析的基本原理56

6.2 一元线性回归分析58

6.2.1 一元线性回归模型58

6.2.2 模型参数估计和估计平均误差62

6.2.3 回归模型的校验64

6.3 多元线性回归分析68

6.3.1 多元线性回归模型69

6.3.2 参数估计69

6.3.3 多元回归方差分析和显著性检验71

6.3.4 多元回归模型的残差分析74

6.4 非线性回归分析77

6.4.1 非线性模型77

6.4.2 非线性模型的线性化79

6.5 应用实例分析82

6.5.1 算法描述82

6.5.2 实例过程83

6.5.3 结果分析84

6.6 小结85

第7章 贝叶斯分析86

7.1 贝叶斯定理86

7.1.1 贝叶斯理论基础86

7.1.2 贝叶斯定理87

7.2 贝叶斯分类88

7.2.1 贝叶斯分类步骤88

7.2.2 先验概率和后验概率88

7.2.3 贝叶斯分类88

7.2.4 贝叶斯分类器89

7.3 朴素贝叶斯分类90

7.3.1 贝叶斯假设和朴素贝叶斯90

7.3.2 朴素贝叶斯计算90

7.3.3 朴素贝叶斯分类举例91

7.3.4 朴素贝叶斯分类的特点93

7.3.5 朴素贝叶斯网络的扩展94

7.4 EM算法94

7.5 贝叶斯信念网络95

7.5.1 贝叶斯网络结构95

7.5.2 贝叶斯网络应用96

7.5.3 贝叶斯网络特点98

7.6 应用实例分析98

7.6.1 样本数据的选取依据和方法98

7.6.2 使用贝叶斯构造网络算法训练数据98

7.6.3 结果与评价100

7.7 小结100

第8章 聚类分析101

8.1 聚类分析原理101

8.1.1 聚类分析基础101

8.1.2 聚类分析中的数据类型103

8.1.3 区间标度变量104

8.1.4 二元变量105

8.1.5 分类型、序数型变量106

8.1.6 向量对象107

8.2 聚类分析常用算法分类108

8.2.1 划分方法109

8.2.2 层次方法109

8.2.3 基于密度的方法109

8.2.4 基于网格的方法109

8.2.5 基于模型的方法110

8.2.6 高维数据的聚类法110

8.2.7 模糊聚类FCM110

8.3 划分聚类方法110

8.3.1 典型的划分方法:k-means,k-medoids111

8.3.2 算法实现112

8.4 层次聚类方法121

8.4.1 凝聚的和分裂的层次聚类121

8.4.2 BIRCH:利用层次方法的平衡迭代归约和聚类123

8.4.3 ROCK:分类属性的层次聚类算法124

8.4.4 CURE:使用代表点的聚类方法125

8.4.5 ChameIeon:利用动态建模的层次聚类126

8.5 基于密度的聚类方法127

8.5.1 DBSCAN:基于高密度连通区域的聚类127

8.5.2 OPTICS:通过点排序识别聚类结构129

8.5.3 DENCLUE:基于密度分布函数的聚类129

8.6 基于网格的聚类方法131

8.6.1 STING:统计信息网格聚类131

8.6.2 WaveCluster:利用小波变换聚类132

8.7 基于模型的聚类方法132

8.7.1 统计学方法COBWEB132

8.7.2 神经网络方法SOMs133

8.8 高维数据的聚类方法135

8.8.1 CLIQUE:维增长子空间聚类方法135

8.8.2 PROCLUS:雏归约子空间聚类方法136

8.9 模糊聚类FCM136

8.9.1 模糊集基本知识136

8.9.2 模糊C均值聚类137

8.10 应用实例分析138

8.11 小结146

第9章 决策树算法147

9.1 决策树算法原理147

9.2 常用决策树算法151

9.2.1 ID3算法151

9.2.2 C4.5算法153

9.2.3 CART算法157

9.2.4 PUBIC算法159

9.2.5 SLIQ算法159

9.2.6 SPRINT算法160

9.3 决策树剪枝161

9.3.1 预剪枝162

9.3.2 后剪枝162

9.4 由决策树提取分类规则169

9.5 应用实例分析170

9.5.1 类别属性信息熵的计算170

9.5.2 非类别属性信息熵的计算170

9.5.3 递归地创建决策树的树枝和叶子170

9.6 小结174

第10章 关联规则算法176

10.1 关联规则基础176

10.1.1 关联规则定义176

10.1.2 关联规则分类177

10.2 关联规则算法原理178

10.2.1 关联规则挖掘算法的步骤178

10.2.2 基本关联规则算法178

10.2.3 复杂关联规则算法181

10.3 分层搜索经典算法——Apriori算法181

10.3.1 频繁项目集的产生182

10.3.2 产生关联规则185

10.3.3 Apriori算法性能分析186

10.3.4 Apriori算法改进186

10.4 并行挖掘算法187

10.4.1 并行算法思想187

10.4.2 基于Apriori的并行算法188

10.5 增量更新挖掘算法190

10.5.1 增量挖掘190

10.5.2 FUP算法191

10.6 多层关联规则挖掘194

10.6.1 概念层次194

10.6.2 多层关联规则挖掘方法195

10.6.3 多层关联规则的冗余197

10.7 约束性关联规则挖掘197

10.7.1 数据挖掘中约束的作用198

10.7.2 约束的类型199

10.7.3 过滤事务数据库200

10.7.4 算法Separate202

10.7.5 扩展的约束条件203

10.7.6 时态约束关联规则挖掘204

10.8 数量关联规则挖掘205

10.8.1 数量关联规则挖掘问题205

10.8.2 数量关联规则的分类205

10.8.3 数量关联规则挖掘的步骤206

10.8.4 数值属性离散化及算法207

10.9 多维关联规则挖掘208

10.9.1 多维关联规则挖掘原理208

10.9.2 MAQA算法209

10.9.3 确定多属性划分的聚类算法CP210

10.9.4 合并数量属性的相邻值212

10.10 负关联规则挖掘算法213

10.10.1 直接Apriori算法213

10.10.2 “近似”负关联规则算法214

10.11 加权关联规则挖掘算法215

10.11.1 加权关联规则模型215

10.11.2 加权关联规则发现算法——MINWAL(O)算法215

10.12 应用实例分析218

10.12.1 数据准备218

10.12.2 挖掘关联规则219

10.12.3 挖掘结果分析220

10.13 小结220

第11章 粗糙集理论221

11.1 粗糙集基本概念221

11.1.1 知识和知识库221

11.1.2 不可分辨关系222

11.1.3 上、下近似集222

11.2 知识表达223

11.2.1 知识表达系统223

11.2.2 决策表224

11.2.3 属性约简、核集的求取225

11.2.4 属性值约简225

11.2.5 决策规则226

11.2.6 基于可辨识矩阵属性约简算法226

11.2.7 信息熵的属性约简227

11.3 粗糙集在数据预处理中的应用228

11.3.1 属性约简的两种方法228

11.3.2 粗糙集在神经网络中的应用——粗神经网络算法231

11.4 小结233

第12章 神经网络234

12.1 神经网络基本原理234

12.1.1 人工神经元模型234

12.1.2 人工神经网络模型235

12.1.3 神经网络的参数236

12.1.4 神经网络的学习方法237

12.2 BP神经网络239

12.2.1 BP神经网络模型239

12.2.2 BP神经网络的Java实现240

12.2.3 BP神经网络的改进247

12.3 径向基函数神经网络251

12.3.1 RBF神经网络结构251

12.3.2 RBF训练252

12.3.3 RBF神经网络算法分析255

12.3.4 RBF网络的应用257

12.4 Hopfield神经网络258

12.4.1 Hopfield神经网络概述258

12.4.2 离散Hopfield神经网络259

12.4.3 连续Hopfield神经网络259

12.5 自组织神经网络260

12.5.1 SOFM网络模型260

12.5.2 SOFM网络聚类的基本算法261

12.5.3 SOFM算法分析261

12.6 神经网络的应用262

12.6.1 BP神经网络在模式识别中的应用262

12.6.2 基于Hopfield神经网络在优化问题中的应用264

12.7 神经网络在数据挖掘中的应用265

12.7.1 基于神经网络方法的数据挖掘过程266

12.7.2 评价数据挖掘模型实现算法的指标266

12.8 小结267

第13章 遗传算法268

13.1 遗传算法概述268

13.1.1 遗传算法的基本理论268

13.1.2 遗传算法的基本操作271

13.1.3 遗传算法的编码方式272

13.1.4 遗传算法的类型273

13.2 基本遗传算法273

13.2.1 基本遗传算法的流程273

13.2.2 基本遗传算法的Java实现277

13.3 改进遗传算法287

13.3.1 分层遗传算法287

13.3.2 自适应遗传算法289

13.3.3 小生境遗传算法290

13.3.4 并行遗传算法292

13.3.5 混合遗传算法294

13.4 基于遗传算法的数据挖掘297

13.4.1 遗传算法的一般结构297

13.4.2 遗传算法的组成要素298

13.4.3 基于遗传算法的关联规则挖掘299

13.4.4 基于遗传算法的聚类算法300

13.4.5 基于遗传算法的分类算法303

13.4.6 基于模糊遗传算法的建模305

13.5 基因表达式编程307

13.5.1 基因表达式编程国内外研究现状307

13.5.2 基因表达式编程算法描述307

13.5.3 基因表达式编程的主要遗传操作308

13.6 小结310

第14章 支持向量机311

14.1 支持向量机基础311

14.1.1 机器学习的基本问题311

14.1.2 经验风险最小化问题312

14.1.3 VC维与学习一致性理论313

14.1.4 结构化风险最小化315

14.2 支持向量机的基本原理317

14.2.1 线性支持向量机317

14.2.2 广义线性支持向量机320

14.2.3 非线性支持向量机322

14.3 支持向量机的实现技术326

14.3.1 chunking块算法326

14.3.2 Decomposing算法328

14.3.3 SMO算法330

14.3.4 SMO算法源代码331

14.3.5 SMO算法的特点和优势341

14.4 支持向量回归机341

14.4.1 不敏感损失函数342

14.4.2 支持向量回归机(SVR)模型343

14.5 支持向量机的改进算法345

14.5.1 V-SVM算法345

14.5.2 One-class SVM算法346

14.5.3 RSVM算法347

14.5.4 LS-SVM算法347

14.5.5 WSVM算法348

14.5.6 模糊支持向量机算法(FSVM)348

14.5.7 多类值支持向量机算法349

14.6 支持向量机在数据挖掘中的应用352

14.6.1 支持向量机在医疗诊断中的应用353

14.6.2 支持向量机时间序列预测模型354

14.7 小结355

第15章 复杂对象数据挖掘356

15.1 空间数据库挖掘356

15.1.1 空间数据概述356

15.1.2 空间数据挖掘中的基础计算模型358

15.1.3 空间数据挖掘基础363

15.1.4 几种空间数据挖掘算法365

15.2 多媒体数据挖掘368

15.2.1 多媒体数据挖掘概述369

15.2.2 多媒体数据挖掘方法371

15.3 文本挖掘373

15.3.1 文本挖掘概述374

15.3.2 文本的预处理375

15.3.3 文本挖掘方法377

15.4 挖掘互联网380

15.4.1 挖掘Web页面布局结构381

15.4.2 挖掘Web链接结构识别权威Web页面382

15.4.3 挖掘Web上的多媒体数据383

15.4.4 Web文档的自动分类384

15.4.5 Web使用挖掘384

15.5 挖掘数据流386

15.5.1 流数据处理方法和流数据系统386

15.5.2 流OLAP和流数据立方体388

15.5.3 数据流中的频繁模式挖掘389

15.5.4 动态数据流的分类390

15.5.5 聚类演变数据流391

15.6 时间序列数据挖掘393

15.6.1 趋势分析393

15.6.2 时间序列分析中的相似性搜索395

15.7 挖掘事务数据库中的序列模式396

15.7.1 序列模式挖掘396

15.7.2 挖掘序列模式的可伸缩方法398

15.7.3 基于约束的序列模式挖掘399

15.7.4 时间相关序列数据的周期性分析400

15.8 挖掘生物学数据中的序列模式401

15.8.1 生物学序列比对402

15.8.2 生物学序列分析403

15.9 小结409

第3部分 数据挖掘建模与模型411

第16章 数据挖掘建模412

16.1 数据挖掘建模概述412

16.1.1 原型与模型412

16.1.2 模式与模型413

16.1.3 知识层次理论413

16.1.4 模型与数据416

16.1.5 知识结构与框架416

16.1.6 认识决策417

16.2 数据挖掘建模基础419

16.2.1 数据挖掘建模420

16.2.2 建模与挖掘的结合423

16.2.3 模型分类427

16.2.4 建模行为430

16.3 数据挖掘建模原理432

16.3.1 建模要求432

16.3.2 建模原则432

16.3.3 简化模型433

16.3.4 建模流程434

16.3.5 建模素质439

16.4 小结440

第17章 数据挖掘模型评价442

17.1 基于损失函数的标准442

17.1.1 混淆矩阵442

17.1.2 准确率及误差的度量443

17.1.3 两个评价模型成本的可视化工具445

17.1.4 评估分类器的准确率447

17.2 基于统计检验的准则449

17.2.1 统计模型之间的距离449

17.2.2 统计模型的离差451

17.3 基于计分函数的标准453

17.4 贝叶斯标准454

17.5 计算标准455

17.5.1 交叉验证标准455

17.5.2 自展标准456

17.5.3 遗传算法460

17.6 小结461

第4部分 SPSS Clementine数据挖掘实务463

第18章 SPSS Clementine基础464

18.1 认识SPSS Clementine464

18.1.1 SPSS Clementine运行方式465

18.1.2 Clementine的组成构件466

18.1.3 SPSS Clementine选项设置470

18.2 SPSS Clementine应用领域474

18.3 SPSS Clementine数据挖掘入门475

18.3.1 SPSS Clementine中鼠标以及快捷键的使用475

18.3.2 SPSS Clementine中构建数据流476

18.3.3 数据流中节点的设置476

18.3.4 对数据流的设置和操作481

18.4 小结484

第19章 SPSS Clementine数据管理485

19.1 各种格式数据的导入485

19.1.1 从开放数据库中导入数据486

19.1.2 从无格式文本文件中读取数据489

19.1.3 从固定字段的文本文件中读取数据490

19.1.4 导入SPSS文件491

19.1.5 元数据和个例数据的导入491

19.1.6 SAS格式数据的设置493

19.1.7 导入Excel格式的数据494

19.1.8 用户手动创建数据494

19.2 对数据集记录的修改495

19.2.1 选择节点496

19.2.2 对数据的抽样496

19.2.3 修正数据集中的不均匀性497

19.2.4 统计汇总498

19.2.5 对节点数据的排序499

19.2.6 合并节点499

19.2.7 追加节点数据501

19.2.8 区分节点来清除重复记录502

19.2.9 对数据的统计输出实例502

19.3 对字段数据的进一步处理504

19.3.1 类型节点504

19.3.2 对节点数据的过滤509

19.3.3 导出节点数据510

19.3.4 对节点数据的填充514

19.3.5 自动建立新的字段级515

19.3.6 为节点数据设置标志516

19.3.7 时间序列数据的处理517

19.3.8 分析医生开处方药的依据实例517

19.4 小结519

第20章 数据的图形化展示520

20.1 图表类型520

20.1.1 层叠图520

20.1.2 三维图像521

20.1.3 动画效果522

20.2 图表的创建522

20.3 散点图的显示524

20.3.1 定义一个区域526

20.3.2 删除已创建的区域527

20.3.3 编辑图像区域527

20.4 条形图的绘制527

20.5 绘制直方图529

20.5.1 定义变量值的区域530

20.5.2 在一个特定段中选择或标记记录531

20.5.3 为所有区域中的记录生成集合531

20.5.4 编辑图型区域531

20.6 收集图显示531

20.7 多重散点图533

20.8 网络图显示535

20.8.1 调整点537

20.8.2 调整网络图阈值537

20.8.3 创建一个网络图汇总538

20.9 评估节点图538

20.9.1 收益图表539

20.9.2 响应图表539

20.9.3 提升图表540

20.9.4 利润图表540

20.9.5 投资回报率图表540

20.9.6 读取模型评估的结果541

20.10 时间散点图的显示542

20.11 状态检测实例543

20.12 小结546

第21章 SPSS Clementine数据挖掘建模547

21.1 Clementine数据模型工具概览547

21.2 建模前的通用设置547

21.2.1 在数据流中使用生成模型549

21.2.2 使用生成模型浏览器549

21.3 神经网络建模550

21.3.1 神经网络的专家项551

21.3.2 神经网络模型的学习速率554

21.3.3 生成神经网络模型554

21.3.4 生成神经网络模型的汇总555

21.4 C5.0算法生成决策树556

21.5 C&RT基于树的分类预测558

21.5.1 分类回归树专家设置559

21.5.2 分类回归树的构造控制560

21.5.3 分类回归树先验概率的指定560

21.5.4 生成决策树561

21.6 Kohonen网络模型565

21.6.1 Kohonen模型的专家项设置566

21.6.2 生成Kohonen网络567

21.7 K-Means聚类分析568

21.7.1 K-Means模型的专家项设置569

21.7.2 生成K-Means模型569

21.8 TwoStep聚类分析570

21.9 异常节点模型572

21.10 Apriori关联规则573

21.11 GRI关联规则575

21.11.1 未精炼规则模型576

21.11.2 未精炼规则汇总576

21.11.3 生成规则集576

21.12 生成规则集模型577

21.13 序列模型578

21.13.1 序列规则模型582

21.13.2 序列规则汇总582

21.14 主成分/因子分析582

21.14.1 主成分/因子分析节点旋转选项585

21.14.2 主成分/因子分析模型585

21.15 特征选择算法模型587

21.16 回归模型588

21.16.1 回归模型的步进选择590

21.16.2 回归模型的输出选项591

21.16.3 生成回归节点591

21.17 Logistic回归模型593

21.17.1 Logistis回归模型的收敛准则594

21.17.2 Logistic回归模型的输出595

21.17.3 Logistic回归方程模型596

21.18 用神经网络节点和C5.0节点训练和测试597

21.19 小结601

第22章 数据挖掘结果的输出602

22.1 结果输出的概述602

22.2 表节点的输出603

22.2.1 表节点格式设置603

22.2.2 通过表浏览器来操作604

22.3 通过矩阵方式建立关系表605

22.4 评估预测值的输出607

22.5 数据审核报告610

22.6 统计量输出611

22.6.1 统计量输出浏览器612

22.6.2 从统计量中生成过滤节点613

22.7 均值的输出614

22.8 数据的质量报告615

22.8.1 从质量中生成过滤节点616

22.8.2 从质量中生成选择节点617

22.9 格式化的报告输出617

22.10 全局量的输出619

22.11 SPSS导出结果620

22.12 评估模型产生精确预测值的能力621

22.12.1 分析节点的设置621

22.12.2 分析输出浏览器622

22.13 小结624

第23章 数据挖掘项目实施625

23.1 数据挖掘项目实施步骤625

23.1.1 一般实施步骤625

23.1.2 企业解决方案626

23.1.3 标准过程模型628

23.2 数据挖掘项目周期629

23.2.1 数据收集629

23.2.2 数据清理与转换629

23.2.3 模型构建630

23.2.4 模型评估630

23.2.5 报告630

23.2.6 预测630

23.2.7 应用集成630

23.2.8 模型管理631

23.3 建立项目和报告631

23.3.1 项目概述631

23.3.2 建立项目633

23.3.3 建立报告637

23.4 处理缺失值640

23.4.1 指定缺失值641

23.4.2 处理缺失值的技巧642

23.4.3 用CLEM函数处理缺失值644

23.5 导入和导出PMML模型645

23.5.1 支持PMML的模型类型645

23.5.2 导入PMML模型647

23.5.3 导出PMML模型648

23.6 小结649

第24章 SPSS Clementine典型案例分析650

24.1 市场购物篮分析650

24.1.1 定义数据源650

24.1.2 理解数据651

24.1.3 准备数据653

24.1.4 建模653

24.2 利用决策树模型挖掘商业信息656

24.3 利用神经网络对数据进行欺诈探测660

24.3.1 定义数据源661

24.3.2 理解数据661

24.3.3 准备数据662

24.3.4 建模664

24.4 小结667

参考文献668

热门推荐