主要观点总结
本文介绍了机器学习的概述、基本名词、算法分类、模型评估与选择等方面的内容,包括分类、回归、聚类、降维等机器学习技术的核心概念和实际应用。
关键观点总结
关键观点1: 机器学习概述
机器学习是一门涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多学科的交叉学科。它通过数据自动学习规律,并利用学习到的规律对未知数据进行预测。
关键观点2: 机器学习基本名词
包括监督学习、无监督学习、强化学习等。监督学习是从标记的训练数据集中学习模型;无监督学习则从无标记的数据集中学习模型;强化学习则通过与环境互动来学习最佳行为策略。
关键观点3: 机器学习算法分类
包括分类、回归、聚类、降维等。分类用于预测离散值,回归用于预测连续值,聚类用于将数据分为多个类别,降维则用于简化数据结构。
关键观点4: 机器学习模型评估与选择
包括经验误差、过拟合、偏差、方差、性能度量指标、评估方法等。偏差衡量模型与真实模型的差异,方差衡量模型的复杂度和对数据变动的敏感性。合理的评估方法如留出法、交叉验证法、自助法等,可以帮助我们获得可靠的测试集数据,从而评估模型的性能。
文章预览
1. 机器学习概述 1)什么是机器学习 人工智能 (Artificial intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是一个笼统而宽泛的概念,人工智能的最终目标是使计算机能够模拟人的思维方式和行为。 大概在上世纪50年代,人工智能开始兴起,但是受限于数据和硬件设备等限制,当时发展缓慢。 机器学习 (Machine learning)是人工智能的子集,是实现人工智能的一种途径,但并不是唯一的途径。它是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。大概在上世纪80年代开始蓬勃发展,诞生了一大批数学统计相关的机器学习模型。 深度学习 (Deep learning)是机器学习的子集,灵感来自人脑,由人工神经网
………………………………