Wan 学习笔记
2025-10-18
Wan 是最近比较火的视频生成扩散模型,可以理解为”Stable Diffusion 的视频版”。它的核心挑战在于同时建模空间结构(图像内容)和时间一致性(运动轨迹),还要在有限显存下搞定高分辨率视频生成。
9801 字
|
49 分钟
LoRA (Low-Rank Adaptation) 学习笔记
2025-08-14
LoRA是目前最流行的大模型微调技术之一。相比传统的全参数微调,LoRA只需要训练很少的参数就能达到相近的效果,大大降低了计算成本和存储需求。
5976 字
|
30 分钟
反向传播算法
2025-07-30
反向传播(Backpropagation)算法是训练神经网络的核心算法,由Rumelhart、Hinton和Williams在1986年系统化提出。该算法通过链式法则高效计算损失函数对网络中所有参数的梯度,使得深层神经网络的训练成为可能。
5319 字
|
27 分钟
神经网络理论基础
2025-07-30
神经网络是深度学习的核心组成部分,其理论基础可以追溯到20世纪40年代McCulloch和Pitts提出的人工神经元模型。作为一种受生物神经系统启发的计算模型,神经网络通过模拟神经元之间的连接和信息传递机制,实现了对复杂非线性函数的逼近能力。
6278 字
|
31 分钟
模型评估和选择
2025-07-29
在机器学习的学习路径中,掌握了各种算法后,下一个关键问题就是:如何知道我的模型好不好?如何在多个模型中选择最优的? 这就是模型评估和选择的核心问题。
8301 字
|
42 分钟
支持向量机进阶
2025-07-29
继续我的机器学习之旅,今天深入学习了支持向量机(SVM)的进阶内容。如果说线性SVM是在二维平面上画一条最优直线分割数据,那么非线性SVM就像是给我们一副”魔法眼镜”,让我们能在更高维的空间中看到数据的线性可分性。这种”升维”的思想不仅优雅,而且在实际应用中非常强大。
5920 字
|
30 分钟