在编写本教材的过程中,我们力求做到系统、全面且深入浅出。全教材共分为七章,每一章均围绕着机器学习的核心概念展开,逐步构建起一个完整的知识体系。无论你是对机器学习充满好奇的初学者,还是希望系统掌握这一技能的学生,或是正在或准备从事相关领域工作的研究人员,本教材都将为你提供有力的支持。
在第一章中,介绍了机器学习的基本概念和一般流程。这不仅是为后续章节打下基础,更是为了帮助读者建立起对机器学习的整体认识。随后的章节中,深入探讨了有监督学习、无监督学习以及关联规则与推荐系统等关键领域,通过丰富的案例和算法介绍,使读者能够更加直观地理解这些技术的原理和应用。本教材不仅注重理论知识的传授,更强调实践操作的重要性,包括第二章中Python环境搭建及相关库的使用、机器学习算法在各种实际场景中的应用。无论是回归、分类、聚类还是推荐系统,我们希望通过生动的案例和详细的解析,让读者能够感受到机器学习技术的强大与实用。
本教材由谢崇波、李武担任主编。编写分工如下:第一章至第二章由李武编写,第三章由何雪锋编写,第四章由贾宁编写,第五章由谢崇波编写,第六章由叶茂编写,第七章由肖芸编写。本教材由谢崇波统稿。
在本教材编写过程中,参考了很多国内外的著作和文献,在此对作者致以由衷的谢意。同时得到了很多人的帮助和支持,在此感谢我的合作者们辛勤、严谨的劳动。
限于作者水平,教材中错误和缺点在所难免,欢迎广大读者提出宝贵意见和建议,我们不胜感激。
第1章机器学习基本概念1
1.1机器学习简介1
1.1.1任务概述1
1.1.2任务分析1
1.1.3相关知识2
1.2机器学习的一般流程9
1.2.1任务概述9
1.2.2任务分析9
1.2.3相关知识10
1.3机器学习策略13
1.3.1任务概述13
1.3.2任务分析13
1.3.3相关知识14
1.4性能评估17
1.4.1任务概述17
1.4.2任务分析17
1.4.3相关知识17
1.5本章小结25
1.6拓展提高26
1.7练习实训27
第2章机器学习基础29
2.1Python环境搭建29
2.1.1任务概述29
2.1.2任务分析29
2.1.3相关知识30
2.1.4工作任务39
2.2NumPy40
2.2.1任务概述40
2.2.2任务分析40
2.2.3相关知识41
2.2.4工作任务46
2.3Pandas47
2.3.1任务概述47
2.3.2任务分析47
2.3.3相关知识48
2.3.4工作任务56
2.4Matplotlib60
2.4.1任务概述60
2.4.2任务分析61
2.4.3相关知识61
2.4.4工作任务71
2.5Scikitlearn77
2.5.1任务概述77
2.5.2任务分析77
2.5.3相关知识77
2.5.4工作任务83
2.6本章小结84
目录2.7拓展提高85
2.8练习实训88
第3章有监督学习:回归90
3.1线性回归90
3.1.1任务概述90
3.1.2任务分析90
3.1.3相关知识91
3.1.4工作任务97
3.2岭回归和Lasso回归101
3.2.1任务概述101
3.2.2任务分析101
3.2.3相关知识102
3.2.4工作任务104
3.3梯度下降110
3.3.1任务概述110
3.3.2任务分析111
3.3.3相关知识111
3.3.4工作任务118
3.4Logistic回归121
3.4.1任务概述121
3.4.2任务分析122
3.4.3相关知识122
3.4.4工作任务126
3.5本章小结130
3.6拓展提高131
3.7练习实训133
第4章有监督学习:分类136
4.1决策树136
4.1.1任务概述136
4.1.2任务分析137
4.1.3相关知识137
4.1.4工作任务153
4.2随机森林157
4.2.1任务概述157
4.2.2任务分析157
4.2.3相关知识158
4.2.4工作任务164
4.3自适应增强167
4.3.1任务概述167
4.3.2任务分析167
4.3.3相关知识167
4.3.4工作任务171
4.4本章小结174
4.5拓展提高175
4.6练习实训176
第5章无监督学习:聚类180
5.1聚类算法概述180
5.1.1任务概述180
5.1.2任务分析180
5.1.3相关知识181
5.2Kmeans算法186
5.2.1任务概述186
5.2.2任务分析186
5.2.3相关知识186
5.2.4工作任务195
5.3基于密度的聚类算法199
5.3.1任务概述199
5.3.2任务分析199
5.3.3相关知识200
5.3.4工作任务207
5.4本章小结211
5.5拓展提高212
5.5.1Kmedoids算法212
5.5.2BIRCH算法214
5.6练习实训216
第6章有监督学习:支持向量机219
6.1支持向量机基础219
6.1.1任务概述219
6.1.2任务分析219
6.1.3相关知识220
6.1.4工作任务223
6.2基本概念225
6.2.1任务概述225
6.2.2任务分析226
6.2.3相关知识226
6.2.4工作任务229
6.3核方法与非线性支持向量机232
6.3.1任务概述232
6.3.2任务分析232
6.3.3相关知识233
6.3.4工作任务240
6.4支持向量回归245
6.4.1任务概述245
6.4.2任务分析245
6.4.3相关知识245
6.4.4工作任务250
6.5本章小结253
6.6拓展提高253
6.7练习实训255
第7章关联规则挖掘与推荐系统259
7.1关联规则学习基础259
7.1.1任务概述259
7.1.2任务分析260
7.1.3相关知识260
7.2关联规则编程实践264
7.2.1任务概述264
7.2.2任务分析264
7.2.3相关知识265
7.2.4工作任务274
7.3推荐系统276
7.3.1任务概述276
7.3.2任务分析276
7.3.3相关知识277
7.3.4工作任务290
7.4本章小结293
7.5拓展提高294
7.5.1推荐系统评估指标294
7.5.2推荐系统评估方法295
7.5.3推荐系统优化策略295
7.6练习实训296
随着数字化时代的蓬勃发展,机器学习技术已逐渐渗透到我们生活的方方面面。从自动驾驶汽车到智能语音助手,从个性化推荐到医疗图像诊断,机器学习技术正在重塑我们的世界。然而,对于许多人来说,机器学习仍然是一个神秘且充满挑战的领域。本教材的目的,正是为了揭开这层神秘的面纱,引导读者逐步深入机器学习的世界。