机器学习技术

机器学习技术 教材名称: 机器学习技术
ISBN号: 978-7-89535-058-8 作者: 李光荣 付志鸿 高伟锋
字数: 200千字 规格: 16k
印制时间: 2022-09-01 出版日期: 2022-09-01
定价: 35 元 样章下载: 机器学习技术—样章.pdf
购买地址:

近年来,随着硬件基础以及算法能力的显著提高,机器学习技术得到了学术界和工业界的广泛关注,其中的许多算法已经大量应用于我们的日常生活中。机器学习作为一门多领域的交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。对于许多机器学习的爱好者和初学者来说,会被复杂的公式和晦涩难懂的术语吓到。此外,面对大量的机器学习算法,在解决实际问题时,即使是经验丰富的数据科学家和机器学习算法开发者也都不能一步到位,因此机器学习的初学者更加需要一些指导,为算法的选择提供一些参考意见。因此,编者认为需要一本面向在校生和初级从业人员的专业教材,便于读者更好地理解和应用各种算法。
编者结合多年的教学和实践经验,通篇图文并茂,带你从理论到实践领略机器学习算法的魅力,浅显易懂又不缺乏专业的指导。本教材一共有八个任务,具体内容如下:
任务一:线性回归,主要介绍一元及多元线性回归的基本概念,线性回归分析的实施过程。
任务二:逻辑斯特回归,主要介绍逻辑斯特回归的基本概念、基本特征,与线性回归之间的区别与联系。
任务三:朴素贝叶斯分类,主要介绍贝叶斯定理,朴素贝叶斯的朴素是什么,如何应用朴素贝叶斯分类器进行分类预测。
任务四:决策树分类,主要介绍决策树分类的基本概念,分类方法,如何应用决策树分类模型进行预测。
任务五:随机森林,主要介绍集成学习的基本概念,集成学习中随机森林相比于决策树分类的优势在哪里,如何应用随机森林模型进行预测。
任务六:支持向量机,主要介绍支持向量机的基本概念,SVM的原理以及建模方法;
任务七:KNN分类,主要介绍KNN分类的思想,与其他分类方法的异同点,并应用KNN模型进行预测。
任务八:K均值聚类,主要介绍聚类分析的适用场景,K均值聚类分析的基本思想和工作原理,并应用K均值聚类完成相应分析。
本教材基于Python语言介绍并实践了回归、分类、聚类三大类分析方法,项目丰富、适用性强,可作为高等院校数据科学、信息类专业的教材。
项目导学1
任务一线性回归2
任务描述2
任务目的2
任务要求2
基础知识3
任务实施6
任务评价13
任务拓展15
任务二逻辑斯特回归21
任务描述21
任务目的21
任务要求21
基础知识22
任务实施24
任务评价33
任务拓展35
任务三朴素贝叶斯分类36
任务描述36
任务目的36
任务要求36
基础知识37
任务实施41
任务评价48
任务拓展50
任务四决策树分类51
任务描述51
任务目的51
任务要求51
基础知识52
任务实施55
任务评价61
任务拓展63
任务五随机森林64
任务描述64
任务目的64
任务要求64
基础知识65
任务实施68
任务评价75
任务拓展77
任务六支持向量机78
任务描述78
任务目的78
任务要求78
基础知识79
任务实施83
任务评价89
任务拓展91
任务七KNN分类92
任务描述92
任务目的92
任务要求92
基础知识93
任务实施96
任务评价104
任务拓展106
任务八K均值聚类107
任务描述107
任务目的107
任务要求107
基础知识108
任务实施110
任务评价116
任务拓展119
参考文献120
 

 

近年来,科学研究与社会生活各个领域中的数据正在以前所未有的速度产生并被广泛收集与存储,如何实现数据的智能化处理从而充分利用数据中蕴含的知识与价值,已成为当前学术界与产业界的共识。机器学习作为一种主流的智能数据处理技术,是实现上述目标的核心途径之一。
机器学习是计算科学与人工智能的重要分支领域。近年来,随着数据的不断丰富和计算能力的提升,机器学习的发展日新月异,已经成为一种解决诸多问题的有效工具,广泛应用于多学科交叉领域。如零售商分析他们过去的销售数据,了解顾客行为,以便改善顾客关系管理。金融机构分析过去的交易,以便预测顾客的信用风险。机器学习的最基本的做法是使用算法来解析数据、从中学习,然后对真实的世界中的事件做出决策和预测,机器学习往往需要使用大量的数据来进行“训练”,通过各种算法从数据中学习完成任务。
本教材内容均为机器学习的基础方法和模型,适用于机器学习的初学者,目的是让爱好机器学习的计算机专业、数据科学与大数据技术专业、人工智能专业以及相关专业的学生熟悉机器学习的过程,掌握机器学习过程中常用的算法模型及数据处理方式。本教材知识点的介绍通过基础理论及概念讲解、应用案例、习题等进行,其主要特点有:
(1)通过对机器学习知识点的理论讲解,让学生抓住概念的本质和思想的源头;
(2)通过应用案例,能够加深对算法的过程的深刻理解;
(3)通过习题,能够巩固相应知识点的学习。
本教材注重机器学习的基础实践,为学生后续学习打下基础。由于编者水平有限,教材中难免存在不妥之处,恳请读者批评指正,多提宝贵意见。