深度学习
Deep Learning
深度学习是机器学习的重要分支,指基于多层人工神经网络构建的非线性特征提取与模式识别方法。
能够自动从大规模数据中学习多层次、逐级抽象的特征表达,显著提升了机器在图像、语音、自然语言等复杂任务中的表现。
核心思想
通过多层神经网络结构,逐层提取数据的隐含特征。每一层输出为下一层的输入,形成逐级抽象的特征空间。
使用深层神经网络来学习复杂的数据表示。
神经网络的结构: 一个典型的神经网络由以下部分组成:
- 输入层 (Input Layer): 接收外部输入数据。
- 隐藏层 (Hidden Layer): 通过一系列权重和激活函数对输入数据进行处理和转换。一个神经网络可以有一个或多个隐藏层。
- 输出层 (Output Layer): 生成最终的预测或分类结果。
学习数据高层次的抽象 Learing Feature Representations
表征学习,对数据的自动特征提取、自动学习和理解
自动学习数据的层次化表征
Hierarchical Representations 逐层表征抽象
End-to-End Learning 端对端学习
深度学习的网络结构
神经网络
CNN:卷积神经网络
RNN:循环神经网络
LSTM:长短时记忆网络
Auto-Encoder:自编码器
GAN:生成对抗网络
GNN:图神经网络
Transformer:非传统递归结构,基于自注意力机制