诗笺Poemenchanter

机器学习

深度学习:从感知机到 Transformer

系统重学深度学习的基础脉络,配套手写实现与论文精读笔记。

状态 学习中
进度 65%
开始 2026年3月1日

学习目标

不止于会调 API,而是真正理解每个组件为什么这样设计。从最基础的感知机出发,手写实现关键模块,再回到经典论文。

进度

  • 感知机与反向传播(手写 NumPy 实现)
  • CNN:卷积、池化、经典架构(LeNet → ResNet)
  • RNN / LSTM 与梯度问题
  • 注意力机制的直觉
  • Transformer 完整手写实现(进行中)
  • 预训练与微调范式
  • 多模态架构概览

阶段心得

最大的收获不是某个具体模型,而是意识到:几乎所有进步都来自对「信息如何流动」的重新设计。残差连接、注意力、归一化,本质都在回答同一个问题——如何让梯度和信息更顺畅地传递。