登录
注册
|
首页
图书资源
视听资源
本馆讯息
读书活动
校本资源
我的图书馆
全部图书资源
>
C 社会科学总论
>
C8 统计学
IBM SPSS Modeler 18.0数据挖掘权威指南
暂无评分
作者:张浩彬,周伟珠编著
出版社:人民邮电出版社
出版日期:2019年04月
ISBN:978-7-115-50759-4
中图分类:C819 ( 社会科学总论 > 统计学 > 统计方法 )
评分:
借阅次数:0
收藏人数:0
推荐次数:0
目录
IBM SPSS Modeler 18.0数据挖掘权威指南
书名:IBM
本书是一本以数据挖掘应用为主导,以SPSS
当人民邮电出版社编辑王峰松找到我和伟珠时,问我们要不要写一本
本书第一个特色是“全”
感谢“探数寻理”的读者关注与支持
由于作者水平有限,本书难免会出现纰漏和不足之处,恳请各位读者
本书由异步社区出品,社区(https://www
本书提供如下资源:
作者和编辑尽最大努力来确保书中内容的准确性,但难免会存在疏漏
我们的联系邮箱是contact@epubit.com.cn。
“异步社区”是人民邮电出版社旗下IT专业图书社区,致力于出版
IBM
SPSS最初称为“Statistical
Modeler的特点
在实际的商业挖掘项目中,数据挖掘绝不仅仅是拿到一份数据后建立
Modeler
Modeler的主界面及基本操作
Modeler连接服务器端
Modeler中获取帮助
本章的实战技巧主要是针对整体配置上的技巧,具体内容包括以下几
数据读取
变量也被称为属性或者字段,是对于一个对象的抽象描述
商业理解是数据项目的第一步,数据读取则是用户开始操作的第一步
1.Demo目录,快速定位
数据整理
在2.1节中,谈到了数据的身份,包括存储类型、测量级别和角色
在读取数据以及设定好字段的测量级别和角色后,用户需要对数据进
在数据挖掘项目当中往往需要从多个不同的数据源抽取数据,这时就
1.类型限制,系统更改
数据整理
4.1.1 功能介绍
4.2.1 参数功能
数据排序特别好理解,设置也很简单,选择需要排序的维度或指标,
在数据挖掘项目中,对数据质量的要求比较高,如果数据中有重复的
4.5.1 功能介绍
数据整理
5.1.1 功能介绍
“填充”节点,顾名思义,对字段内容进行填充,可以是针对空白值
“重新分类”节点,主要是针对分类型指标对类别的内容进行重新组
在数据分析过程中,有些数据涉及保密性,比较敏感,要通过脱敏之
在SPSS
5.6.1 功能介绍
5.7.1 功能介绍
5.8.1 功能介绍
5.9.1 功能介绍
字排重排很好理解,就是对原来的表格字段的顺序重新进行排列,方
5.11.1 功能介绍
在SPSS
图形可视化
本节示例使用本书数据文件“1995-2014GDP
在前面的章节当中,用户已经了解到连续型字段的关系分析可以使用
直方图和条形图在外观上比较类似,但是研究对象却完全不同
在SPSS
考虑到可视化图形种类非常繁多,为每种可视化类型都单独创建一个
在SPSS
描述性统计分析
在本节中,将使用Demo附带的数据文件“telco
可视化图表及描述性统计指标是数据理解阶段最重要的两个利器
前面介绍了如何使用“数据审核”节点检查数据质量,在本节中将进
在“数据审核”节点中,通过设置交叠字段可以更加直观地进行结果
常用的统计检验分析
在第7章中,通过描述性统计指标来研究某个连续型变量的趋势特征
在8
在前面章节分别讨论了连续变量之间的相关关系与分类型变量之间的
在日常使用相关分析的时候,用户需要注意3点。
回归分析
一元线性回归,又被称为简单线性回归,是线性回归中最简单的形式
本示例使用本书附带的数据文件“房产价格分析V1
回顾上一节的分析结果,决定系数R2=0
为了能够更准确地预测房产价格,用户需要引入更多的自变量
在前面的章节中可以看到并不是所有的自变量都是有效的,或者说都
正如9
1.相关分析与回归分析
Logistic回归分析
在上一章中讨论了当因变量是连续型变量的时候如何使用回归分析对
10.2.1 方程的显著性检验
接下来以SPSS
1.利用表格,快速查找
建模前的优化及准备工作
样本的管理与分区在数据挖掘过程中非常重要
在做数据挖掘分析项目的时候,可能有成百甚至上千个可用作输入的
从数据分析比较严谨的角度来说,在使用一些传统算法,例如回归、
在数据挖掘过程中,往往既需要对数据进行分区,也需要对数据进行
RFM分析
决策树
决策树算法是一种有监督的机器学习算法,作为有指导学习算法,它
在1979年,澳大利亚的计算机科学家罗斯·昆兰(J
CART(Classification
13.4.1 生成规则集
神经网络
感知机是一个简单的两层神经网络
如前面章节所讨论,由于只有一层用于计算的神经元,因此对于线性
以SPSS
在经过建模分析后,最终的结果如果要以报告的形式输出,例如ht
集成学习算法
Bagging(Boostrap
如果说Bagging是最为经典的并行集成算法,那么Boost
如果说决策树的最终输出是一棵树,那么随机森林的最终输出就是一
以SPSS
通过前面的介绍,相信用户已经对集成学习算法有了较为深入的理解
聚类分析
前面的章节当中主要介绍了一些常用的有监督算法,这些算法的特点
在聚类方法中,常用距离来判断样本间的相似程度
16.3.1 K-means算法原理
以SPSS
当用户要进行每个聚类群的对比时,除了可以利用模型块节点中的平
KNN分类器
回顾一下上一章节的K-means聚类算法
考虑到KNN同样是以距离计算为基础的算法,因此同样以SPSS
关联分析
以某超市购物篮分析为例子,从中选择部分客户的购物记录
通过购物篮数据,用户能够生成大量的关联规则
定义好有效性的评估指标后,对于每一条关联规则,我们都可以通过
以SPSS
在SPSS
自动建模
19.1.1 功能介绍
19.2.1 功能介绍
19.3.1 功能介绍
蒙特卡罗模拟法
20.1.1 功能介绍
20.2.1 功能介绍
20.3.1 功能介绍
SPSS
Modeler与R、Python集成
21.2.1 定制对话框简介
Modeler扩展功能
SPSS
在模型构建完成之后,要如何部署模型是非常重要的
22.2.1 功能介绍
Modeler服务器安装及管理(For
Modeler官方支持的数据库和Hadoop平台
性能优化
在使用SPSS
在SPSS
23.3.1 功能介绍
在“导出”面板的“数据库”节点,默认情况下是通过ODBC连接
..更多
全部评论
评论
推荐图书
各国特种警察格斗术训练全解
魏峰
北京体育大学出版社
丹尼尔斯经典跑步训练法:世界最佳跑步教练的跑步公式
(美)杰克·丹尼尔斯(Jack Daniels)著 , 沈慧译
浙江人民出版社
VR虚拟现实:重构用户体验与商业新生态
王赓著
人民邮电出版社
FBI教你实用防身技巧
(美)查克·乔伊纳(Chuck Joyner)著 , 姚长红译
中华工商联合出版社
酸痛拉筋解剖书:你的私人拉筋保健指南、拉筋与肌肉解剖学相结合的专业图解书
(澳)布拉德沃克
北京联合出版公司
终极平板支撑 终极平板支撑101式
(美)珍妮弗·德·科廷编
山东科学技术出版社
李小龙技击法
李小龙著 , 水户上原编辑整理
北京联合出版公司
精准拉伸 疼痛消除和损伤预防的针对性练习
【美】克里斯蒂安·博格(Kristian Berg)
人民邮电出版社
©中文在线
服务条款
|
关于我们
|
管理登录
返回顶部
用户指南
下载APP
关注我们