《Python数据挖掘》
作者:洪金珠,徐蔼婷,陈宜治,张子天,蒋献,汪盈,诸葛斌
定价:69.8元
●浙江省普通本科高校“十四五”重点立项建设教材
●教育部—阿里云产学合作协同育人项目支持
●配套微课视频、教学大纲、教学课件、源代码等教学资源
内容简介
本书力求为读者呈现一部兼具理论深度和实践指导性的数据挖掘教材,在内容安排上既注重基础知识的讲解,又强调实际应用能力的培养。每章都包括理论阐述、算法原理、实践案例和基于Python的代码实现等诸多内容,旨在帮助读者全面理解和掌握相关知识和技能。此外,本书还关注数据挖掘领域的最新发展和前沿技术,将AI代码自动生成融入其中,使读者能够紧跟时代步伐,掌握最前沿的知识和技能。
读者对象
本书内容丰富、结构清晰、实践性强,既适合作为高等院校相关专业的教材使用,也适合广大数据挖掘爱好者自学参考。无论是初学者还是有一定基础的读者,都能从本书中获得宝贵的知识和经验。
目录
第1章 绪论
1.1 数据挖掘基础
1.1.1 数据挖掘概述
1.1.2 数据挖掘演进脉络
1.1.3 数据挖掘应用领域
1.2 基于Python的数据挖掘
1.2.1 本地环境安装
1.2.2 简单案例实践
1.2.3 本书常用方法
1.3 天池平台操作概述
1.3.1 天池AI实训平台介绍
1.3.2 课程配套环境操作
1.3.3 天池数据集介绍
习题1
第2章 数据可视化
2.1 数据可视化概述
2.1.1 数据可视化的概念
2.1.2 数据可视化的作用
2.1.3 Python数据可视化实战准备
2.2 matplotlib绘制简单图表
2.2.1 matplotlib简介
2.2.2 绘图属性设置
2.2.3 简单图形的绘制
2.3 高级图表绘制
2.3.1 subplot子区
2.3.2 Seaborn
2.3.3 词云图
2.3.4 mplot3d模块
习题2
第3章 数据预处理
3.1 数据预处理概述
3.1.1 数据预处理的概念
3.1.2 数据预处理在数据挖掘中的作用
3.1.3 数据预处理的主要任务
3.2 数据清洗
3.2.1 缺失值处理
3.2.2 噪声数据处理
3.2.3 异常值处理
3.3 数据集成
3.3.2 数据格式统一化
3.3.3 数据冗余与相关性分析
3.4 数据变换
3.4.1 数据变换概述
3.4.2 数据编码应用示例
3.4.3 规范化应用示例
3.5 数据预处理应用案例
习题3
第4章 回归分析
4.1 回归分析基本问题
4.1.1 回归分析介绍
4.1.2 回归分析的种类
4.1.3 回归分析的发展史
4.2 线性回归模型
4.2.1 模型的相关概念
4.2.2 一元线性回归分析
4.2.3 多元线性回归分析
4.2.4 实战准备
4.2.5 模型案例分析
4.3 其他回归模型
4.3.1 Lasso回归模型
4.3.2 岭回归模型
4.3.3 逻辑回归模型
4.3.4 实战准备
4.3.5 模型案例分析
习题4
第5章 关联规则分析
5.1 关联规则分析概述
5.1.1 概念
5.1.2 原理步骤
5.1.3 应用领域
5.2 Apriori算法
5.2.1 基本原理
5.2.2 算法流程
5.2.3 实战准备
5.2.4 Apriori算法案例
5.3 FP-growth算法
5.3.1 基本原理
5.3.2 算法流程
5.3.3 实战准备
5.3.4 FP-growth算法案例
5.4 关联规则分析案例
习题5
第6章 聚类分析
6.1 聚类分析概述
6.1.1 聚类分析的基本概念
6.1.2 聚类分析的原理和步骤
6.2 基于划分的聚类
6.2.1 k-means算法
6.2.2 k-means++算法
6.2.3 实战准备
6.2.4 划分聚类案例
6.3 基于层次的聚类
6.3.1 层次聚类的基本概念
6.3.2 凝聚层次算法: AGNES算法
6.3.3 分裂层次算法: DIANA算法
6.3.4 实战准备
6.3.5 层次聚类案例
6.4 基于密度的聚类
6.4.1 密度聚类的基本概念
6.4.2 DBSCAN 算法
6.4.3 实战准备
6.4.4 密度聚类案例
习题6
第7章 随机森林
7.1 随机森林概述
7.1.1 决策树概论
7.1.2 随机森林概论
7.1.3 决策树与随机森林
7.2 决策树
7.2.1 sklearn中的决策树模型
7.2.2 分类决策树
7.2.3 回归决策树
7.3 随机森林实践
7.3.1 随机森林实践准备
7.3.2 随机森林案例分析
7.3.3 随机森林的应用案例
习题7
第8章 神经网络
8.1 神经网络概述
8.1.1 概念
8.1.2 发展历程
8.1.3 应用领域
8.2 长短期记忆网络算法
8.2.1 基本原理
8.2.2 算法流程
8.2.3 LSTM算法案例
8.3 BP反向传播算法
8.3.1 基本原理
8.3.2 算法流程
8.3.3 BP算法案例
习题8
第9章 贝叶斯分类
9.1 贝叶斯分类概述
9.1.1 贝叶斯定理
9.1.2 贝叶斯分类步骤及优点
9.1.3 应用领域
9.2 朴素贝叶斯算法
9.2.1 基本原理
9.2.2 算法分类
9.2.3 实战准备
9.2.4 朴素贝叶斯算法案例
9.3 贝叶斯网络
9.3.1 基本原理
9.3.2 算法流程及实战准备
9.3.3 贝叶斯网络算法案例
习题9
第10章 文本挖掘
10.1 文本挖掘概述
10.1.1 基本介绍
10.1.2 应用领域
10.1.3 基本流程
10.2 文本预处理
10.2.1 文本清洗
10.2.2 分词和词性标注
10.2.3 特征选取
10.2.4 词向量表示方法
10.3 文本挖掘方法实现
10.3.1 文本分类
10.3.2 文本聚类
10.4 文本挖掘结果可视化
10.4.1 知识图谱
10.4.2 词云图
10.5 文本挖掘算法案例
习题10
第11章 综合案例实战
11.1 代码自动生成
11.2 租房案例概述
11.2.1 案例背景
11.2.2 案例研究目的
11.3 数据采集及预处理
11.3.1 选取及提取网页
11.3.2 使用Scrapy解析页面内容
11.3.3 数据清理及存储
11.4 数据分析与可视化
11.4.1 房源租金可视化分析
11.4.2 区域租金均价分布可视化
11.5 代码自动生成的租房决策实现
11.5.1 找准区域
11.5.2 找准商圈
11.5.3 找准户型
11.5.4 找准朝向
11.5.5 找准设施
11.5.6 得出结果
11.6 数据挖掘应用发布和实践
11.6.1 基于Web服务器的应用发布
11.6.2 基于钉钉低代码的应用发布
精彩样章




