机器学习
深度学习:从感知机到 Transformer
系统重学深度学习的基础脉络,配套手写实现与论文精读笔记。
状态 学习中
进度 65%
开始 2026年3月1日
学习目标
不止于会调 API,而是真正理解每个组件为什么这样设计。从最基础的感知机出发,手写实现关键模块,再回到经典论文。
进度
- 感知机与反向传播(手写 NumPy 实现)
- CNN:卷积、池化、经典架构(LeNet → ResNet)
- RNN / LSTM 与梯度问题
- 注意力机制的直觉
- Transformer 完整手写实现(进行中)
- 预训练与微调范式
- 多模态架构概览
阶段心得
最大的收获不是某个具体模型,而是意识到:几乎所有进步都来自对「信息如何流动」的重新设计。残差连接、注意力、归一化,本质都在回答同一个问题——如何让梯度和信息更顺畅地传递。