Appearance
介绍
1. 人工智能、机器学习、深度学习的关系
机器学习是人工智能的一个子领域, 深度学习是机器学习的一个分支

2. 关键组件
机器学习中的关键组件
无论什么类型的机器学习问题,都会遇到这些组件:
机器学习组件:
3. 主要类型
机器学习的主要类型
3.1. 监督学习
老师给学生一些问题和答案,学生根据问题的特征,自己学习并预测答案。
也就是需要有带标签的数据。
监督学习主要解决问题:
- 回归: 预测具体的数值,多少
- 预测房价、天气
- 预测股票价格
- 分类: 预测离散的类别
- 预测垃圾邮件,
- 判断手写数字是 0-9 中的哪一个
- 图片分类: 预测图片所属的类别
- 语音识别: 预测语音所属的类别
3.2. 无监督学习
学生自己根据问题的特征,学习并预测答案。
给机器一堆原始数据,让机器自己发现数据中的模式。不需要预先知道答案。
无监督学习主要解决问题:
- 聚类;
- 图像分割
- 降维
- 人脸识别
- 关联规则挖掘
3.3. 强化学习
机器通过与环境的交互,学习如何执行任务。
智能体做一个动作,环境会返回一个奖励或惩罚。智能体的目标是最大化总奖励。
强化学习主要解决问题:
- 游戏: 让机器学习如何玩游戏
- 机器人: 让机器学习如何移动
- 自动驾驶: 让机器学习如何驾驶汽车
- 推荐系统: 让机器学习如何推荐商品
4. 深度学习
深度学习是机器学习的一个分支,依赖深度神经网络(如CNN、RNN)自动提取特征,特别擅长处理图像、语音、文本等非结构化数据。
和机器学习对比
机器学习是基础,适合结构化数据和中小规模任务。
深度学习是进阶,依赖大数据和算力,在非结构化数据中表现更强。
| 维度 | 机器学习 | 深度学习 |
|---|---|---|
| 数据需求 | 对数据量要求灵活,小数据集也能用。 | 需要大量数据才能发挥优势。 |
| 模型复杂度 | 模型相对简单(如决策树、SVM)。 | 模型复杂,参数多,依赖GPU/TPU训练。 |
| 应用场景 | 适合结构化数据,如金融分析、推荐系统。 | 擅长非结构化数据,如计算机视觉、自然语言处理。 |
| 可解释性 | 模型通常更易解释(如决策树)。 | 模型复杂,常被视为“黑箱”,可解释性研究在进行中。 |
深度学习的核心模型
- CNN:擅长图像处理,通过卷积核提取特征。
- RNN:处理序列数据(如文本、语音),LSTM/GRU解决长程依赖问题。
- Transformer:基于自注意力机制,在NLP领域表现突出。
主流框架概览
TensorFlow是由Google Brain团队开发的一个开源深度学习框架,自2015年发布以来已成为业界最受欢迎的深度学习框架之一。TensorFlow支持多种硬件设备,包括CPU、GPU和TPU,可以轻松扩展到大型分布式系统。Keras是一个高层神经网络API,它是用Python编写的,可以运行在TensorFlow、Microsoft Cognitive Toolkit、Theano等深度学习框架之上。Keras的核心思想是简单、易用、高度模块化,使得快速构建和测试神经网络变得简单PyTorch是一个基于Python的开源深度学习框架,由Facebook的AI研究团队开发。它具有灵活性和动态计算图特性,使得研究人员和开发人员能够更容易地构建和实验复杂的神经网络。PyTorch的优势在于其简洁的API设计、良好的社区支持以及易于调试的特点。
后续代码基于PyTorch框架。