深度学习

Deep Learning

深度学习是机器学习的重要分支,指基于多层人工神经网络构建的非线性特征提取模式识别方法。

能够自动从大规模数据中学习多层次、逐级抽象的特征表达,显著提升了机器在图像、语音、自然语言等复杂任务中的表现。

核心思想

通过多层神经网络结构,逐层提取数据的隐含特征。每一层输出为下一层的输入,形成逐级抽象的特征空间

使用深层神经网络来学习复杂的数据表示。

神经网络的结构: 一个典型的神经网络由以下部分组成:

  1. 输入层 (Input Layer): 接收外部输入数据。
  2. 隐藏层 (Hidden Layer): 通过一系列权重和激活函数对输入数据进行处理和转换。一个神经网络可以有一个或多个隐藏层。
  3. 输出层 (Output Layer): 生成最终的预测或分类结果。

Pasted image 20240516120207.png

学习数据高层次的抽象 Learing Feature Representations
表征学习,对数据的自动特征提取、自动学习和理解
自动学习数据的层次化表征
Hierarchical Representations 逐层表征抽象
End-to-End Learning 端对端学习

深度学习的网络结构

神经网络
CNN:卷积神经网络
RNN:循环神经网络
LSTM:长短时记忆网络
Auto-Encoder:自编码器
GAN:生成对抗网络
GNN:图神经网络
Transformer:非传统递归结构,基于自注意力机制