计算机图形学笔记(一)：数学基础与理论根基#

说实话，刚开始学图形学的时候，看到那些密密麻麻的数学公式真的头大。这一部分主要整理了线性代数、几何变换、投影几何和微积分在图形学中的应用。

目录#

线性代数基础 - 向量、矩阵、齐次坐标系统
几何变换数学原理 - 平移、旋转、缩放的数学本质
投影几何学 - 透视投影与视图变换的完整推导
微积分在图形学中的应用 - 曲线曲率与渲染积分

线性代数基础#

1.1 向量的数学定义与几何意义#

1.1.1 向量的基本概念#

数学定义：向量是具有大小和方向的量，在n维欧几里得空间 $\mathbb{R}^n$ 中可以表示为：

$\vec{v} = \begin{pmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{pmatrix} \in \mathbb{R}^n$

向量的模长（欧几里得范数）： $\|\vec{v}\| = \sqrt{v_1^2 + v_2^2 + \cdots + v_n^2} = \sqrt{\sum_{i=1}^{n} v_i^2}$

单位向量： $\hat{v} = \frac{\vec{v}}{\|\vec{v}\|}, \quad \|\hat{v}\| = 1$

几何意义与性质：

位置表示：向量可以看作从原点指向某点的有向线段
方向性：向量的方向由其各分量的比值决定，与起点无关
平移不变性：向量表示的是相对位移，不依赖于坐标系原点
线性性：向量空间满足加法和数乘的线性性质

在计算机图形学中的核心应用：

位置向量：表示3D空间中顶点的坐标 $p = (x, y, z)^T$
方向向量：表示光线方向、法向量、视线方向等
位移向量：表示物体的平移变换
颜色向量：RGB/RGBA颜色空间的表示
纹理坐标：UV坐标的二维向量表示

1.1.2 向量运算的数学原理#

向量加法（Vector Addition）#

数学定义：对于 n 维向量 $u$ 和 $v$ ，其和定义为： $u + v = \begin{pmatrix} u_1 + v_1 \\ u_2 + v_2 \\ \vdots \\ u_n + v_n \end{pmatrix}$

几何解释：

平行四边形法则： $u + v$ 是以 $u$ 和 $v$ 为邻边的平行四边形的对角线
三角形法则：将 $v$ 的起点放在 $u$ 的终点，连接 $u$ 的起点和 $v$ 的终点

代数性质：

交换律： $u + v = v + u$
结合律： $(u + v) + w = u + (v + w)$
零元素： $u + 0 = u$
逆元素： $u + (-u) = 0$

GAMES101项目实现：

1
// Eigen库中的向量加法
2
Eigen::Vector3f u(1.0f, 2.0f, 3.0f);
3
Eigen::Vector3f v(4.0f, 5.0f, 6.0f);
4
Eigen::Vector3f result = u + v;  // (5, 7, 9)
5

6
// 在光栅化中的应用：顶点位置变换
7
Eigen::Vector3f vertex_position = base_position + displacement;

向量数乘（Scalar Multiplication）#

数学定义：对于标量 $k \in \mathbb{R}$ 和向量 $\vec{v} \in \mathbb{R}^n$ ： $k\vec{v} = \begin{pmatrix} kv_1 \\ kv_2 \\ \vdots \\ kv_n \end{pmatrix}$

几何效果分析：

$k > 1$ ：向量伸长 $k$ 倍，方向不变
$0 < k < 1$ ：向量缩短为原长度的 $k$ 倍，方向不变
$k = 0$ ：得到零向量
$k < 0$ ：向量反向并缩放 $|k|$ 倍

重要应用：

单位向量计算： $\hat{v} = \frac{1}{\|\vec{v}\|}\vec{v}$
缩放变换：在几何变换中实现物体的放大缩小
插值计算：线性插值 $\vec{p}(t) = (1-t)\vec{p_0} + t\vec{p_1}$

点积（内积/数量积）#

数学定义：对于向量 $\vec{u}, \vec{v} \in \mathbb{R}^n$ ，点积定义为： $\vec{u} \cdot \vec{v} = \sum_{i=1}^{n} u_i v_i = u_1v_1 + u_2v_2 + \cdots + u_nv_n$

几何形式： $\vec{u} \cdot \vec{v} = \|\vec{u}\| \|\vec{v}\| \cos \theta$ 其中 $\theta$ 是两向量间的夹角 $(0 \leq \theta \leq \pi)$

几何意义深度解析：

投影解释： $\vec{u} \cdot \vec{v} = \|\vec{u}\| \cdot \text{proj}_{\vec{v}}\vec{u}$
标量结果：点积的结果是标量，不是向量
角度计算： $\cos \theta = \frac{\vec{u} \cdot \vec{v}}{\|\vec{u}\| \|\vec{v}\|}$

重要代数性质：

交换律： $\vec{u} \cdot \vec{v} = \vec{v} \cdot \vec{u}$
分配律： $\vec{u} \cdot (\vec{v} + \vec{w}) = \vec{u} \cdot \vec{v} + \vec{u} \cdot \vec{w}$
结合律： $(k\vec{u}) \cdot \vec{v} = k(\vec{u} \cdot \vec{v})$
正定性： $\vec{u} \cdot \vec{u} = \|\vec{u}\|^2 \geq 0$ ，等号成立当且仅当 $\vec{u} = \vec{0}$

几何判断准则：

$\vec{u} \cdot \vec{v} = 0 \iff \vec{u} \perp \vec{v}$ （垂直判断）
$\vec{u} \cdot \vec{v} > 0 \iff \theta < 90°$ （锐角）
$\vec{u} \cdot \vec{v} < 0 \iff \theta > 90°$ （钝角）

GAMES101项目中的关键应用：

1
// 1. 计算两向量夹角
2
float dot_product = u.dot(v);
3
float angle = std::acos(std::clamp(dot_product / (u.norm() * v.norm()), -1.0f, 1.0f));
4

5
// 2. 光照计算中的Lambert余弦定律
6
float cos_theta = std::max(0.0f, normal.dot(light_direction));
7
Vector3f diffuse_color = albedo * light_color * cos_theta;
8

9
// 3. 视锥体裁剪中的平面测试
10
float distance_to_plane = point.dot(plane_normal) + plane_d;
11
bool is_inside = distance_to_plane >= 0;
12

13
// 4. 背面剔除
14
Vector3f view_direction = camera_position - vertex_position;
15
bool is_front_facing = face_normal.dot(view_direction) > 0;

叉积（外积/向量积）#

数学定义：对于三维向量 $\vec{u}, \vec{v} \in \mathbb{R}^3$ ，叉积定义为： $\vec{u} \times \vec{v} = \begin{pmatrix} u_2v_3 - u_3v_2 \\ u_3v_1 - u_1v_3 \\ u_1v_2 - u_2v_1 \end{pmatrix}$

行列式表示：

叉积可以表示为形式行列式：

第1行： $(\vec{i}, \vec{j}, \vec{k})$ - 单位向量
第2行： $(u_1, u_2, u_3)$ - 向量 $\vec{u}$ 的分量
第3行： $(v_1, v_2, v_3)$ - 向量 $\vec{v}$ 的分量

$\vec{u} \times \vec{v} = \text{determinant expansion}$

几何意义深度解析：

方向：遵循右手定则，垂直于 $\vec{u}$ 和 $\vec{v}$ 构成的平面
大小： $\|\vec{u} \times \vec{v}\| = \|\vec{u}\| \|\vec{v}\| \sin \theta$
面积解释： $\|\vec{u} \times \vec{v}\|$ 等于以 $\vec{u}$ 和 $\vec{v}$ 为邻边的平行四边形面积

重要代数性质：

反交换律： $\vec{u} \times \vec{v} = -\vec{v} \times \vec{u}$
分配律： $\vec{u} \times (\vec{v} + \vec{w}) = \vec{u} \times \vec{v} + \vec{u} \times \vec{w}$
标量结合律： $(k\vec{u}) \times \vec{v} = k(\vec{u} \times \vec{v}) = \vec{u} \times (k\vec{v})$
平行判断： $\vec{u} \times \vec{v} = \vec{0} \iff \vec{u} \parallel \vec{v}$
垂直性： $(\vec{u} \times \vec{v}) \cdot \vec{u} = 0$ 且 $(\vec{u} \times \vec{v}) \cdot \vec{v} = 0$

标量三重积：

标量三重积等于三个向量构成的行列式：

第1行： $(u_1, u_2, u_3)$ - 向量 $\vec{u}$ 的分量
第2行： $(v_1, v_2, v_3)$ - 向量 $\vec{v}$ 的分量
第3行： $(w_1, w_2, w_3)$ - 向量 $\vec{w}$ 的分量

$\vec{u} \cdot (\vec{v} \times \vec{w}) = \text{scalar triple product}$

表示以三个向量为邻边的平行六面体的有向体积。

GAMES101项目中的核心应用：

1
// 1. 计算三角形法向量（Assignment 2/3中的关键操作）
2
Eigen::Vector3f edge1 = vertex2 - vertex1;
3
Eigen::Vector3f edge2 = vertex3 - vertex1;
4
Eigen::Vector3f normal = edge1.cross(edge2).normalized();
5

6
// 2. 判断点在三角形内部（重心坐标计算的基础）
7
Vector3f v0 = C - A, v1 = B - A, v2 = P - A;
8
Vector3f cross1 = v0.cross(v1);  // 三角形面积向量
9
Vector3f cross2 = v0.cross(v2);  // 子三角形面积向量
10
float area_ratio = cross2.dot(cross1) / cross1.squaredNorm();
11

12
// 3. 构建坐标系（相机变换中的应用）
13
Vector3f forward = (target - eye).normalized();
14
Vector3f right = forward.cross(up).normalized();
15
Vector3f camera_up = right.cross(forward);
16

17
// 4. 计算三角形面积
18
float triangle_area = 0.5f * edge1.cross(edge2).norm();

1.2 矩阵理论基础#

1.2.1 矩阵的定义与基本运算#

矩阵定义： $m \times n$ 矩阵是由 $m$ 行 $n$ 列实数排列成的矩形阵列:

$A = (a_{ij})_{m \times n} \text{ where } a_{ij} \text{ is the element in row } i \text{ and column } j$

矩阵乘法的严格定义：对于矩阵 $A \in \mathbb{R}^{m \times p}$ 和 $B \in \mathbb{R}^{p \times n}$ ，乘积 $C = AB \in \mathbb{R}^{m \times n}$ 的元素为： $c_{ij} = \sum_{k=1}^{p} a_{ik} b_{kj}, \quad i = 1,2,\ldots,m; \quad j = 1,2,\ldots,n$

矩阵乘法的几何意义：

线性变换复合： $(AB)\vec{x} = A(B\vec{x})$ 表示先应用变换 $B$ ，再应用变换 $A$
基向量变换：矩阵 $A$ 的第 $j$ 列是标准基向量 $\vec{e_j}$ 经过变换 $A$ 后的结果
坐标系变换：从一个坐标系到另一个坐标系的映射

矩阵乘法的重要性质：

结合律： $(AB)C = A(BC)$
分配律： $A(B + C) = AB + AC$ ， $(A + B)C = AC + BC$
非交换性：一般情况下 $AB \neq BA$
与标量乘法的关系： $(kA)B = k(AB) = A(kB)$

1.2.2 特殊矩阵类型#

单位矩阵（Identity Matrix）#

定义： $n \times n$ 单位矩阵 $I_n$ 定义为对角线元素为1，其他元素为0的矩阵：

$(I_n)_{ij} = \delta_{ij}$

其中 $\delta_{ij}$ 是Kronecker delta函数：

当 $i = j$ 时： $\delta_{ij} = 1$

当 $i \neq j$ 时： $\delta_{ij} = 0$

基本性质：

乘法单位元： $AI = IA = A$ （当维度匹配时）
几何意义：恒等变换，不改变任何向量
特征值：所有特征值都是1

转置矩阵（Transpose Matrix）#

定义：矩阵 $A$ 的转置 $A^T$ 定义为： $(A^T)_{ij} = A_{ji}$

重要性质：

对合性： $(A^T)^T = A$
乘积转置： $(AB)^T = B^T A^T$
和的转置： $(A + B)^T = A^T + B^T$
标量乘法： $(kA)^T = kA^T$

几何意义：

对于旋转矩阵： $R^T = R^{-1}$ （正交矩阵性质）
反映了线性变换的”逆向”操作

逆矩阵（Inverse Matrix）#

定义：对于方阵 $A \in \mathbb{R}^{n \times n}$ ，如果存在矩阵 $A^{-1}$ 使得： $AA^{-1} = A^{-1}A = I_n$ 则称 $A^{-1}$ 为 $A$ 的逆矩阵。

存在性条件：

行列式非零： $\det(A) \neq 0$
满秩条件： $\text{rank}(A) = n$
线性无关： $A$ 的列向量线性无关

计算方法：

伴随矩阵法： $A^{-1} = \frac{1}{\det(A)} \text{adj}(A)$
高斯-约旦消元法： $[A|I] \to [I|A^{-1}]$
LU分解法：适用于大型矩阵

重要性质：

$(A^{-1})^{-1} = A$
$(AB)^{-1} = B^{-1}A^{-1}$
$(A^T)^{-1} = (A^{-1})^T$
$\det(A^{-1}) = \frac{1}{\det(A)}$

1.2.3 齐次坐标系统#

齐次坐标的数学基础#

引入动机：

统一变换表示：将平移、旋转、缩放等变换统一为矩阵乘法
透视投影简化：用线性代数处理非线性的透视除法
变换复合：多个变换的复合简化为矩阵乘法
无穷远点表示：优雅地处理平行线相交于无穷远点

齐次坐标的数学定义：对于 $n$ 维欧几里得空间中的点，其齐次坐标是 $(n+1)$ 维向量：

齐次坐标 $(x, y, z, w)$ 对应笛卡尔坐标 $(x/w, y/w, z/w)$ ，其中 $w \neq 0$

齐次坐标的分类：

点的表示： $(x, y, z, 1)$ - 第四个分量为1
向量的表示： $(x, y, z, 0)$ - 第四个分量为0
无穷远点： $(x, y, z, 0)$ 且 $(x, y, z) \neq (0, 0, 0)$

齐次坐标的等价性：所有非零标量倍数表示同一个点：

$k(x, y, z, w) \sim (x, y, z, w) \quad (k \neq 0)$

齐次坐标的运算规则#

点与向量的区别：

点 + 向量 = 点： $(x_1, y_1, z_1, 1) + (x_2, y_2, z_2, 0) = (x_1+x_2, y_1+y_2, z_1+z_2, 1)$
点 - 点 = 向量： $(x_1, y_1, z_1, 1) - (x_2, y_2, z_2, 1) = (x_1-x_2, y_1-y_2, z_1-z_2, 0)$
向量 + 向量 = 向量： $(x_1, y_1, z_1, 0) + (x_2, y_2, z_2, 0) = (x_1+x_2, y_1+y_2, z_1+z_2, 0)$

仿射组合：点的仿射组合（权重和为1）仍为点：

对于点 $P_i = (x_i, y_i, z_i, 1)$ ，其仿射组合为： $\sum_{i} \alpha_i P_i = \left(\sum_i \alpha_i x_i, \sum_i \alpha_i y_i, \sum_i \alpha_i z_i, \sum_i \alpha_i\right)$

当 $\sum_i \alpha_i = 1$ 时，结果是有效的点。

GAMES101项目中的实际应用#

变换矩阵的统一表示：

1
// 不使用齐次坐标的变换（需要分别处理）
2
Vector3f transformed_point = rotation_matrix * point + translation_vector;
3
Vector3f transformed_vector = rotation_matrix * vector;  // 向量不受平移影响
4

5
// 使用齐次坐标的统一变换
6
Matrix4f transformation = translation * rotation * scaling;
7
Vector4f homogeneous_point(point.x, point.y, point.z, 1.0f);
8
Vector4f homogeneous_vector(vector.x, vector.y, vector.z, 0.0f);
9

10
Vector4f transformed_point = transformation * homogeneous_point;
11
Vector4f transformed_vector = transformation * homogeneous_vector;
12

13
// 转换回笛卡尔坐标
14
Vector3f result_point = transformed_point.head<3>() / transformed_point.w();
15
Vector3f result_vector = transformed_vector.head<3>();  // w分量为0，不需要除法

MVP变换链的实现：

1
// Assignment 1中的核心变换
2
Matrix4f mvp = projection * view * model;
3
for (auto& vertex : vertices) {
4
    Vector4f clip_coord = mvp * Vector4f(vertex.x, vertex.y, vertex.z, 1.0f);
5

6
    // 透视除法（齐次坐标到NDC）
7
    Vector3f ndc_coord = clip_coord.head<3>() / clip_coord.w();
8

9
    // 视口变换
10
    Vector3f screen_coord = viewport_transform * ndc_coord;
11
}

1.3 基础光栅化算法#

1.3.1 Bresenham直线算法#

算法背景与动机#

问题描述：给定两个端点 $(x_0, y_0)$ 和 $(x_1, y_1)$ ，在离散的像素网格上绘制连接这两点的直线。

核心挑战：

像素网格是离散的，而数学直线是连续的
需要选择最接近理想直线的像素点
算法必须高效，避免浮点运算和除法

数学原理推导#

直线方程： $y = mx + b, \quad m = \frac{y_1 - y_0}{x_1 - x_0}$

决策变量的引入：对于当前像素 $(x_i, y_i)$ ，下一个像素可能是 $(x_i+1, y_i)$ 或 $(x_i+1, y_i+1)$ 。

定义决策变量： $d_i = 2(y_i - y_{ideal}) \cdot (x_1 - x_0)$

其中 $y_{ideal} = y_0 + m(x_i + 1 - x_0)$ 是理想直线在 $x = x_i + 1$ 处的y值。

决策规则：

如果 $d_i < 0$ ，选择 $(x_i+1, y_i)$
如果 $d_i \geq 0$ ，选择 $(x_i+1, y_i+1)$

递推关系：

当 $d_i < 0$ 时： $d_{i+1} = d_i + 2(y_1 - y_0)$

当 $d_i \geq 0$ 时： $d_{i+1} = d_i + 2(y_1 - y_0) - 2(x_1 - x_0)$

初始值： $d_0 = 2(y_1 - y_0) - (x_1 - x_0)$

GAMES101项目实现分析#

1
// Assignment 1中的Bresenham算法实现
2
void rst::rasterizer::draw_line(Eigen::Vector3f begin, Eigen::Vector3f end) {
3
    auto x1 = begin.x(), y1 = begin.y();
4
    auto x2 = end.x(), y2 = end.y();
5

6
    Eigen::Vector3f line_color = {255, 255, 255};
7

8
    int x, y, dx, dy, dx1, dy1, px, py, xe, ye, i;
9

10
    // 计算增量
11
    dx = x2 - x1;  // $\Delta x$
12
    dy = y2 - y1;  // $\Delta y$
13
    dx1 = fabs(dx);  // $|\Delta x|$
14
    dy1 = fabs(dy);  // $|\Delta y|$
15

16
    // 初始决策变量
17
    px = 2 * dy1 - dx1;  // 对应水平主导情况
18
    py = 2 * dx1 - dy1;  // 对应垂直主导情况
19

20
    // 根据斜率选择主导方向
21
    if (dy1 <= dx1) {  // |斜率| ≤ 1，水平主导
22
        // 确保从左到右绘制
23
        if (dx >= 0) { x = x1; y = y1; xe = x2; }
24
        else { x = x2; y = y2; xe = x1; }
25

26
        set_pixel(Eigen::Vector3f(x, y, 1.0f), line_color);
27

28
        for (i = 0; x < xe; i++) {
29
            x = x + 1;
30
            if (px < 0) {
31
                px = px + 2 * dy1;  // 选择水平像素
32
            } else {
33
                // 选择对角像素，y坐标需要根据方向调整
34
                if ((dx < 0 && dy < 0) || (dx > 0 && dy > 0)) {
35
                    y = y + 1;
36
                } else {
37
                    y = y - 1;
38
                }
39
                px = px + 2 * (dy1 - dx1);
40
            }
41
            set_pixel(Eigen::Vector3f(x, y, 1.0f), line_color);
42
        }
43
    } else {  // |斜率| > 1，垂直主导
44
        // 类似处理，但以y为主导方向
45
        // ... 垂直主导的实现
46
    }
47
}

算法优化与变种#

整数优化：

所有计算都使用整数运算
避免浮点数和除法运算
时间复杂度： $O(max(|x_1-x_0|, |y_1-y_0|))$

对称性处理：

通过交换坐标处理不同象限的直线
统一处理各种斜率情况

抗锯齿扩展：

Wu’s算法：考虑像素覆盖面积
超采样：提高采样率后下采样

几何变换数学原理#

2.1 线性变换理论#

2.1.1 线性变换的数学定义#

严格数学定义：设 $V$ 和 $W$ 是向量空间，映射 $T: V \to W$ 称为线性变换，当且仅当对于任意 $\vec{u}, \vec{v} \in V$ 和标量 $k$ ，满足：

加法保持性（可加性）： $T(\vec{u} + \vec{v}) = T(\vec{u}) + T(\vec{v})$
数乘保持性（齐次性）： $T(k\vec{u}) = kT(\vec{u})$

等价条件：线性变换也可以用单一条件表示： $T(\alpha\vec{u} + \beta\vec{v}) = \alpha T(\vec{u}) + \beta T(\vec{v})$

矩阵表示定理：对于有限维向量空间，任何线性变换 $T: \mathbb{R}^n \to \mathbb{R}^m$ 都可以唯一地表示为矩阵乘法： $T(\vec{v}) = A\vec{v}$ 其中 $A \in \mathbb{R}^{m \times n}$ 是变换矩阵。

变换矩阵的构造：变换矩阵 $A$ 的第 $j$ 列是标准基向量 $\vec{e_j}$ 的像： $A = [T(\vec{e_1}) \quad T(\vec{e_2}) \quad \cdots \quad T(\vec{e_n})]$

线性变换的重要性质：

零向量保持： $T(\vec{0}) = \vec{0}$
线性组合保持： $T(\sum_i \alpha_i \vec{v_i}) = \sum_i \alpha_i T(\vec{v_i})$
子空间保持：线性子空间的像仍是线性子空间
平行线保持：平行线变换后仍平行（或重合）
原点固定：线性变换总是将原点映射到原点

2.1.2 基本线性变换#

缩放变换（Scaling Transform）#

数学定义：缩放变换是一种线性变换，将向量的各个分量分别乘以对应的缩放因子： $S(s_x, s_y, s_z): \begin{pmatrix} x \\ y \\ z \end{pmatrix} \mapsto \begin{pmatrix} s_x \cdot x \\ s_y \cdot y \\ s_z \cdot z \end{pmatrix}$

齐次坐标矩阵表示：

缩放变换矩阵 $S(s_x, s_y, s_z)$ 是一个 $4 \times 4$ 对角矩阵：

对角线元素： $(s_x, s_y, s_z, 1)$
其他元素均为0

$S(s_x, s_y, s_z) = \text{diag}(s_x, s_y, s_z, 1)$

几何效果分析：

均匀缩放： $s_x = s_y = s_z = s$ $s_{x} = s_{y} = s_{z} = s$
- $s > 1$ ：物体放大 $s$ 倍
- $0 < s < 1$ ：物体缩小为原来的 $s$ 倍
- $s = 1$ ：恒等变换
非均匀缩放： $s_x, s_y, s_z$ $s_{x}, s_{y}, s_{z}$ 不全相等
- 改变物体的长宽高比例
- 可能导致圆变椭圆等形变
反射缩放：某个 $s_i < 0$ $s_{i} < 0$
- $s_i = -1$ ：沿第 $i$ 轴反射
- $s_i < -1$ ：反射并放大
- $-1 < s_i < 0$ ：反射并缩小

重要性质：

可逆性：当所有 $s_i \neq 0$ 时， $S^{-1}(s_x, s_y, s_z) = S(1/s_x, 1/s_y, 1/s_z)$
行列式： $\det(S) = s_x \cdot s_y \cdot s_z$ （体积缩放因子）
特征值：对角元素 $s_x, s_y, s_z$ 就是特征值
交换性：缩放矩阵之间满足交换律

GAMES101项目实现：

1
Eigen::Matrix4f create_scaling_matrix(float sx, float sy, float sz) {
2
    Eigen::Matrix4f scaling = Eigen::Matrix4f::Identity();
3
    scaling(0, 0) = sx;
4
    scaling(1, 1) = sy;
5
    scaling(2, 2) = sz;
6
    return scaling;
7
}
8

9
// 应用示例：在Assignment 1中缩放三角形
10
Matrix4f model = create_scaling_matrix(1.5f, 1.5f, 1.5f);  // 放大1.5倍
11
for (auto& vertex : triangle_vertices) {
12
    Vector4f scaled_vertex = model * Vector4f(vertex.x, vertex.y, vertex.z, 1.0f);
13
    vertex = scaled_vertex.head<3>();
14
}

特殊缩放变换：

各向同性缩放： $S(s, s, s)$ - 保持形状，只改变大小
沿轴缩放： $S(s, 1, 1)$ - 只沿x轴缩放
镜像变换： $S(-1, 1, 1)$ - 沿x轴镜像

旋转变换（Rotation Transform）#

绕坐标轴旋转的数学推导#

绕Z轴旋转的详细推导：设点 $P(x, y)$ 绕原点逆时针旋转角度 $\theta$ 到点 $P'(x', y')$ 。

极坐标方法：将点 $P$ 表示为极坐标形式：

$P: (r\cos\phi, r\sin\phi)$ ，其中 $r = \sqrt{x^2 + y^2}$ ， $\phi = \arctan(y/x)$
$P': (r\cos(\phi + \theta), r\sin(\phi + \theta))$

利用三角恒等式：

对于 x 坐标： $x' = r\cos(\phi + \theta) = r(\cos\phi\cos\theta - \sin\phi\sin\theta) = x\cos\theta - y\sin\theta$

对于 y 坐标： $y' = r\sin(\phi + \theta) = r(\sin\phi\cos\theta + \cos\phi\sin\theta) = x\sin\theta + y\cos\theta$

矩阵形式：

绕 z 轴旋转矩阵 $R_z(\theta)$ 的结构：

左上角 $2 \times 2$ 子矩阵：标准2D旋转矩阵，元素为 $(\cos\theta, -\sin\theta; \sin\theta, \cos\theta)$
z 坐标不变：第3行第3列为1
齐次坐标：第4行第4列为1
其他元素为0

$R_z(\theta) = \text{rotation matrix around z-axis}$

其他坐标轴旋转：

绕 x 轴旋转 $R_x(\theta)$ ：

x 坐标不变：第1行第1列为1
yz 平面内旋转：第2,3行第2,3列为 $2 \times 2$ 旋转矩阵
齐次坐标：第4行第4列为1

绕 y 轴旋转 $R_y(\theta)$ ：

y 坐标不变：第2行第2列为1
xz 平面内旋转：注意 $\sin\theta$ 的符号与其他轴相反
齐次坐标：第4行第4列为1

旋转矩阵的重要性质：

正交性： $R^T R = I$ ，即 $R^{-1} = R^T$
行列式： $\det(R) = 1$ （保持定向）
长度保持： $\|R\vec{v}\| = \|\vec{v}\|$
角度保持： $\vec{u} \cdot \vec{v} = (R\vec{u}) \cdot (R\vec{v})$

GAMES101 Assignment 1实现：

1
Eigen::Matrix4f get_model_matrix(float rotation_angle) {
2
    Eigen::Matrix4f model = Eigen::Matrix4f::Identity();
3

4
    // 角度转弧度
5
    float angle_rad = rotation_angle * MY_PI / 180.0f;
6
    float cos_a = std::cos(angle_rad);
7
    float sin_a = std::sin(angle_rad);
8

9
    // 绕Z轴旋转矩阵
10
    model(0, 0) = cos_a;   model(0, 1) = -sin_a;
11
    model(1, 0) = sin_a;   model(1, 1) = cos_a;
12

13
    return model;
14
}

任意轴旋转（Rodrigues旋转公式）#

问题描述：给定单位向量 $\vec{n}$ 和角度 $\theta$ ，求绕轴 $\vec{n}$ 旋转 $\theta$ 角度的旋转矩阵。

Rodrigues公式推导：对于任意向量 $\vec{v}$ ，绕单位轴 $\vec{n}$ 旋转 $\theta$ 角度后的结果为： $\vec{v}_{rot} = \vec{v}\cos\theta + (\vec{n} \times \vec{v})\sin\theta + \vec{n}(\vec{n} \cdot \vec{v})(1-\cos\theta)$

矩阵形式的Rodrigues公式： $R(\vec{n}, \theta) = I\cos\theta + [\vec{n}]_{\times}\sin\theta + \vec{n}\vec{n}^T(1-\cos\theta)$

其中 $[\vec{n}]_{\times}$ 是 $\vec{n} = (n_x, n_y, n_z)$ 的反对称矩阵（叉积矩阵）：

反对称矩阵的结构：

对角线元素全为0
第1行： $(0, -n_z, n_y)$
第2行： $(n_z, 0, -n_x)$
第3行： $(-n_y, n_x, 0)$

$[\vec{n}]_{\times} = \text{skew-symmetric matrix of } \vec{n}$

公式的几何意义：

$\vec{n}\vec{n}^T(1-\cos\theta)$ ：向量在旋转轴上的投影分量（不变部分）
$I\cos\theta$ ：垂直于旋转轴的分量的余弦部分
$[\vec{n}]_{\times}\sin\theta$ ：垂直于旋转轴的分量的正弦部分

推导过程：

将向量 $\vec{v}$ 分解为平行和垂直于 $\vec{n}$ 的分量： $\vec{v} = \vec{v}_{\parallel} + \vec{v}_{\perp}$ 其中 $\vec{v}_{\parallel} = (\vec{v} \cdot \vec{n})\vec{n}$ ， $\vec{v}_{\perp} = \vec{v} - \vec{v}_{\parallel}$
平行分量不受旋转影响： $\vec{v}_{\parallel}' = \vec{v}_{\parallel}$
垂直分量在垂直于 $\vec{n}$ 的平面内旋转： $\vec{v}_{\perp}' = \vec{v}_{\perp}\cos\theta + (\vec{n} \times \vec{v}_{\perp})\sin\theta$

GAMES101项目实现：

1
Eigen::Matrix4f get_rotation(Vector3f axis, float angle) {
2
    // 确保轴向量为单位向量
3
    axis.normalize();
4
    float theta = angle * MY_PI / 180.0f;
5

6
    // 构建3x3旋转矩阵
7
    Eigen::Matrix3f I = Eigen::Matrix3f::Identity();
8

9
    // 反对称矩阵 [n]×
10
    Eigen::Matrix3f N;
11
    N << 0, -axis[2], axis[1],
12
         axis[2], 0, -axis[0],
13
         -axis[1], axis[0], 0;
14

15
    // 外积矩阵 nnᵀ
16
    Eigen::Matrix3f nnT = axis * axis.transpose();
17

18
    // Rodrigues公式
19
    Eigen::Matrix3f R = I * cos(theta) +
20
                        N * sin(theta) +
21
                        nnT * (1 - cos(theta));
22

23
    // 扩展为4x4齐次矩阵
24
    Eigen::Matrix4f rotation_matrix = Eigen::Matrix4f::Identity();
25
    rotation_matrix.block<3,3>(0,0) = R;
26

27
    return rotation_matrix;
28
}

特殊情况验证：

当 $\vec{n} = (0,0,1)$ 时，退化为绕Z轴旋转
当 $\theta = 0$ 时， $R = I$ （恒等变换）
当 $\theta = \pi$ 时， $R = 2\vec{n}\vec{n}^T - I$ （关于轴的180°旋转）

2.2 仿射变换理论#

2.2.1 仿射变换的数学特性#

仿射变换的严格定义#

数学定义：仿射变换是线性变换与平移的复合，对于向量空间 $\mathbb{R}^n$ ，仿射变换 $T: \mathbb{R}^n \to \mathbb{R}^n$ 定义为： $T(\vec{v}) = A\vec{v} + \vec{b}$ 其中 $A \in \mathbb{R}^{n \times n}$ 是线性变换矩阵， $\vec{b} \in \mathbb{R}^n$ 是平移向量。

仿射空间的概念：仿射空间是没有固定原点的几何空间，仿射变换在仿射空间中具有特殊意义：

点的变换： $P' = AP + \vec{b}$
向量的变换： $\vec{v}' = A\vec{v}$ （向量不受平移影响）

仿射变换的几何性质#

保持性质（不变量）：

直线性保持：直线 $L: \vec{p}(t) = \vec{p_0} + t\vec{d}$ 变换后仍为直线 $L': \vec{p}'(t) = A\vec{p_0} + \vec{b} + tA\vec{d}$
平行性保持：平行直线变换后仍平行
- 证明：平行线具有相同方向向量， $A\vec{d}$ 保持方向关系
比例保持：线段上的比例关系保持不变
- 若 $\vec{p} = (1-t)\vec{p_1} + t\vec{p_2}$ ，则 $\vec{p}' = (1-t)\vec{p_1}' + t\vec{p_2}'$
重心保持：点集的重心变换后仍为变换后点集的重心

不保持的性质：

长度： $\|\vec{v}'\| \neq \|\vec{v}\|$ （除非 $A$ 是正交矩阵）
角度： $\angle(\vec{u}, \vec{v}) \neq \angle(\vec{u}', \vec{v}')$ （除非 $A$ 是相似变换）
面积/体积：缩放因子为 $|\det(A)|$

仿射变换的分类#

按几何效果分类：

刚体变换（Rigid Transform）： $A$ 是正交矩阵， $\det(A) = 1$
- 保持长度、角度、面积
- 只包含旋转和平移
相似变换（Similarity Transform）： $A = sR$ ， $s > 0$ ， $R$ 是正交矩阵
- 保持角度和形状
- 包含均匀缩放、旋转、平移
一般仿射变换：任意可逆矩阵 $A$
- 可能包含剪切、非均匀缩放等

按变换分解分类：任何仿射变换都可以分解为基本变换的复合： $T = T_{trans} \circ T_{rot} \circ T_{scale} \circ T_{shear}$

2.2.2 平移变换的深度分析#

平移变换的数学本质#

为什么平移不是线性变换：线性变换必须满足：

$T(\vec{0}) = \vec{0}$ （零向量保持）
$T(\alpha\vec{u} + \beta\vec{v}) = \alpha T(\vec{u}) + \beta T(\vec{v})$ （线性性）

但平移变换 $T(\vec{v}) = \vec{v} + \vec{t}$ 不满足第一个条件： $T(\vec{0}) = \vec{0} + \vec{t} = \vec{t} \neq \vec{0} \quad (\text{当} \vec{t} \neq \vec{0})$

仿射变换的引入：为了统一处理线性变换和平移，引入仿射变换： $T(\vec{v}) = A\vec{v} + \vec{t}$

齐次坐标中的平移表示#

齐次坐标矩阵：

平移变换矩阵 $T(t_x, t_y, t_z)$ 的结构：

左上角 $3 \times 3$ 子矩阵为单位矩阵
第4列前三个元素为平移向量 $(t_x, t_y, t_z)$
第4行为 $(0, 0, 0, 1)$

$T(t_x, t_y, t_z) = \text{translation matrix}$

变换过程的数学验证：

对于点 $(x, y, z, 1)$ ，平移变换的结果为： $(x, y, z, 1) \xrightarrow{T(t_x, t_y, t_z)} (x + t_x, y + t_y, z + t_z, 1)$

向量与点的区别：

点的平移： $(x, y, z, 1) \to (x+t_x, y+t_y, z+t_z, 1)$
向量的平移： $(x, y, z, 0) \to (x, y, z, 0)$ （向量不受平移影响）

这正确反映了几何直觉：向量表示方向和大小，与位置无关。

平移变换的性质#

群论性质：平移变换构成一个交换群 $(T, \circ)$ ：

封闭性： $T(\vec{a}) \circ T(\vec{b}) = T(\vec{a} + \vec{b})$
结合律： $(T(\vec{a}) \circ T(\vec{b})) \circ T(\vec{c}) = T(\vec{a}) \circ (T(\vec{b}) \circ T(\vec{c}))$
单位元： $T(\vec{0})$ 是恒等变换
逆元： $T(\vec{a})^{-1} = T(-\vec{a})$
交换律： $T(\vec{a}) \circ T(\vec{b}) = T(\vec{b}) \circ T(\vec{a})$

矩阵表示的优势：

1
// 传统方法：需要特殊处理
2
Vector3f translate_point(const Vector3f& point, const Vector3f& translation) {
3
    return point + translation;
4
}
5

6
Vector3f translate_vector(const Vector3f& vector, const Vector3f& translation) {
7
    return vector;  // 向量不受平移影响
8
}
9

10
// 齐次坐标方法：统一处理
11
Matrix4f translation_matrix = create_translation_matrix(tx, ty, tz);
12
Vector4f result_point = translation_matrix * Vector4f(point.x, point.y, point.z, 1.0f);
13
Vector4f result_vector = translation_matrix * Vector4f(vector.x, vector.y, vector.z, 0.0f);

GAMES101项目中的应用#

创建平移矩阵：

1
Eigen::Matrix4f create_translation_matrix(float tx, float ty, float tz) {
2
    Eigen::Matrix4f translation = Eigen::Matrix4f::Identity();
3
    translation(0, 3) = tx;
4
    translation(1, 3) = ty;
5
    translation(2, 3) = tz;
6
    return translation;
7
}
8

9
// Assignment 1中的视图变换
10
Eigen::Matrix4f get_view_matrix(Eigen::Vector3f eye_pos) {
11
    Eigen::Matrix4f view = Eigen::Matrix4f::Identity();
12

13
    // 平移到原点（相机位置的逆变换）
14
    Eigen::Matrix4f translate = create_translation_matrix(-eye_pos[0], -eye_pos[1], -eye_pos[2]);
15

16
    view = translate * view;
17
    return view;
18
}

2.2.3 变换复合的数学理论#

变换复合的基本原理#

函数复合的定义：对于变换 $T_1, T_2, T_3$ ，复合变换定义为： $(T_3 \circ T_2 \circ T_1)(\vec{v}) = T_3(T_2(T_1(\vec{v})))$

矩阵乘法对应关系：在齐次坐标系统中，变换复合对应矩阵乘法： $T_3 \circ T_2 \circ T_1 \longleftrightarrow M_3 M_2 M_1$

重要注意：矩阵乘法的顺序与变换应用顺序相反！

变换应用顺序： $T_1 \to T_2 \to T_3$
矩阵乘法顺序： $M_3 M_2 M_1$

变换顺序的重要性#

非交换性证明：考虑平移 $T(1,0,0)$ 和绕Z轴旋转90°的复合：

顺序1：先平移后旋转 $R_{90°} \circ T(1,0,0): (0,0,0) \to (1,0,0) \to (0,1,0)$

顺序2：先旋转后平移 $T(1,0,0) \circ R_{90°}: (0,0,0) \to (0,0,0) \to (1,0,0)$

结果不同，说明变换顺序至关重要！

标准变换序列（SRT分解）#

Scale-Rotate-Translate顺序： $M_{total} = T \cdot R \cdot S$

为什么采用SRT顺序：

缩放（Scale）：在局部坐标系中进行，不影响物体的朝向
旋转（Rotate）：在缩放后的坐标系中进行，保持物体形状
平移（Translate）：最后移动到世界坐标系中的目标位置

数学验证：

1
// 错误顺序：RST（旋转-缩放-平移）
2
Matrix4f wrong_order = T * S * R;
3
// 问题：缩放会影响已经旋转的物体，可能导致非均匀拉伸
4

5
// 正确顺序：SRT（缩放-旋转-平移）
6
Matrix4f correct_order = T * R * S;
7
// 优势：每个变换都在合适的坐标系中进行

图形学中的变换链#

完整的MVP变换链： $\text{屏幕坐标} = M_{viewport} \cdot M_{projection} \cdot M_{view} \cdot M_{model} \cdot \text{局部坐标}$

各阶段的作用：

模型变换（Model）：局部坐标 → 世界坐标
视图变换（View）：世界坐标 → 观察坐标
投影变换（Projection）：观察坐标 → 裁剪坐标
视口变换（Viewport）：NDC → 屏幕坐标

GAMES101项目实现#

Assignment 1中的变换链：

1
// 构建完整的MVP矩阵
2
Eigen::Matrix4f get_model_matrix(float rotation_angle) {
3
    // 模型变换：只包含旋转
4
    Eigen::Matrix4f model = Eigen::Matrix4f::Identity();
5
    float angle_rad = rotation_angle * MY_PI / 180.0f;
6

7
    model(0, 0) = cos(angle_rad);   model(0, 1) = -sin(angle_rad);
8
    model(1, 0) = sin(angle_rad);   model(1, 1) = cos(angle_rad);
9

10
    return model;
11
}
12

13
Eigen::Matrix4f get_view_matrix(Eigen::Vector3f eye_pos) {
14
    // 视图变换：相机移动到原点
15
    Eigen::Matrix4f view = Eigen::Matrix4f::Identity();
16
    Eigen::Matrix4f translate;
17
    translate << 1, 0, 0, -eye_pos[0],
18
                 0, 1, 0, -eye_pos[1],
19
                 0, 0, 1, -eye_pos[2],
20
                 0, 0, 0, 1;
21
    view = translate * view;
22
    return view;
23
}
24

25
// 在渲染循环中应用变换
26
Matrix4f mvp = projection * view * model;
27
for (auto& vertex : vertices) {
28
    Vector4f clip_coord = mvp * Vector4f(vertex.x, vertex.y, vertex.z, 1.0f);
29
    // 透视除法和视口变换...
30
}

变换分解的实际应用：

1
// 复杂物体的变换分解
2
Matrix4f create_complex_transform(Vector3f scale, Vector3f rotation_angles, Vector3f translation) {
3
    // 1. 创建基本变换矩阵
4
    Matrix4f S = create_scaling_matrix(scale.x, scale.y, scale.z);
5
    Matrix4f Rx = create_rotation_x(rotation_angles.x);
6
    Matrix4f Ry = create_rotation_y(rotation_angles.y);
7
    Matrix4f Rz = create_rotation_z(rotation_angles.z);
8
    Matrix4f T = create_translation_matrix(translation.x, translation.y, translation.z);
9

10
    // 2. 按SRT顺序复合（注意矩阵乘法顺序）
11
    Matrix4f R = Rz * Ry * Rx;  // 旋转顺序：X→Y→Z
12
    Matrix4f transform = T * R * S;
13

14
    return transform;
15
}

投影几何学#

3.1 投影变换的数学基础#

3.1.1 投影的几何原理#

投影定义：将高维空间的点映射到低维空间的过程

投影类型：

平行投影：投影线平行
- 正交投影：投影线垂直于投影平面
- 斜投影：投影线不垂直于投影平面
透视投影：投影线汇聚于一点（视点）

3.1.2 透视投影的完整数学推导#

透视投影的几何基础#

问题设定：给定观察点（视点） $E$ 和投影平面 $\Pi$ ，将3D空间中的点投影到2D平面上。

标准设置：

视点位于坐标原点： $E = (0, 0, 0)$
投影平面垂直于Z轴： $\Pi: z = -d$ （ $d > 0$ ）
观察方向沿负Z轴方向

相似三角形推导#

几何分析：对于空间中的点 $P(x, y, z)$ （其中 $z < 0$ ），从视点 $E$ 向点 $P$ 发出的射线与投影平面 $\Pi$ 的交点为 $P'(x', y', -d)$ 。

X坐标推导：在XZ平面内，考虑三角形：

大三角形：顶点为 $(0,0)$ 、 $(x, z)$ 、 $(x, 0)$
小三角形：顶点为 $(0,0)$ 、 $(x', -d)$ 、 $(x', 0)$

由相似三角形性质： $\frac{x'}{x} = \frac{d}{-z} \implies x' = -\frac{dx}{z}$

Y坐标推导：类似地，在YZ平面内： $\frac{y'}{y} = \frac{d}{-z} \implies y' = -\frac{dy}{z}$

透视除法的本质：透视投影的核心是除法运算： $(x, y, z) \to (-dx/z, -dy/z, -d)$

齐次坐标中的透视投影#

问题：如何用矩阵表示包含除法的透视投影？

解决方案：利用齐次坐标的性质齐次坐标 $(x, y, z, w)$ 对应笛卡尔坐标 $(x/w, y/w, z/w)$

透视投影矩阵构造：我们希望找到矩阵 $P$ ，使得：

对输入点 $(x, y, z, 1)$ ，输出齐次坐标 $(x', y', z', w')$

其中透视除法后得到： $(-dx/z, -dy/z, -d)$

矩阵推导：设 $w' = -z/d$ ，则：

$x'/w' = -dx/z \implies x' = -dx/z \cdot (-z/d) = x$
$y'/w' = -dy/z \implies y' = -dy/z \cdot (-z/d) = y$
$z'/w' = -d \implies z' = -d \cdot (-z/d) = z$

因此透视投影矩阵为：

简单透视投影矩阵 $P_{simple}$ 的结构：

前三行为单位矩阵的前三行
第4行为 $(0, 0, -1/d, 0)$
其他元素为0

$P_{simple} = \text{simple perspective projection matrix}$

验证：对输入向量 $(x, y, z, 1)$ ，变换结果为 $(x, y, z, -z/d)$

透视除法后： $(x/(-z/d), y/(-z/d), z/(-z/d)) = (-dx/z, -dy/z, -d)$ ✓

透视投影的深度问题#

深度信息的保持：简单透视投影会丢失深度信息，因为所有点都被投影到 $z = -d$ 平面。

解决方案：修改Z分量的计算，使其保持深度顺序： $z' = \alpha z + \beta$

其中 $\alpha, \beta$ 是待定常数，需要满足：

近平面 $z = -n$ 映射到 $z' = -1$
远平面 $z = -f$ 映射到 $z' = 1$

求解过程：

建立线性方程组：

当 $z = -n$ 时： $\alpha(-n) + \beta = -1$

当 $z = -f$ 时： $\alpha(-f) + \beta = 1$

解得： $\alpha = -\frac{2}{f-n}, \quad \beta = -\frac{f+n}{f-n}$

因此： $z' = -\frac{2z}{f-n} - \frac{f+n}{f-n} = -\frac{2z + f + n}{f-n}$

但在齐次坐标中，我们需要： $\frac{z'}{w'} = -\frac{2z + f + n}{f-n} \cdot \frac{d}{-z} = \frac{d(2z + f + n)}{z(f-n)}$

这导致了标准透视投影矩阵中Z行的复杂形式。

3.1.3 标准透视投影矩阵的完整推导#

视锥体（View Frustum）的定义#

视锥体参数：

$\text{fov}$ ：垂直视场角（Field of View），单位为度
$\text{aspect}$ ：宽高比 $= \frac{\text{width}}{\text{height}}$
$n$ ：近裁剪面距离（near plane）
$f$ ：远裁剪面距离（far plane）

视锥体的几何形状：视锥体是一个截头锥体（frustum），由6个平面围成：

近平面： $z = -n$
远平面： $z = -f$
左平面、右平面、上平面、下平面

投影平面尺寸的计算#

近平面尺寸推导：在近平面 $z = -n$ 处，视锥体的尺寸为：

$\text{top} = n \cdot \tan\left(\frac{\text{fov}}{2}\right)$ $\text{bottom} = -\text{top}$ $\text{right} = \text{top} \cdot \text{aspect}$ $\text{left} = -\text{right}$

几何解释：

$\tan(\text{fov}/2) = \text{top}/n$ ，因此 $\text{top} = n \cdot \tan(\text{fov}/2)$
对称视锥体： $\text{left} = -\text{right}$ ， $\text{bottom} = -\text{top}$

一般透视投影矩阵推导#

目标：将视锥体内的点 $(x, y, z)$ 映射到标准立方体 $[-1,1]^3$

X坐标变换：近平面上的点 $x \in [\text{left}, \text{right}]$ 应映射到 $[-1, 1]$ ： $x_{ndc} = \frac{2x - (\text{right} + \text{left})}{\text{right} - \text{left}}$

但透视投影中， $x$ 坐标会被 $z$ 缩放，因此： $x_{ndc} = \frac{2x/(-z) - (\text{right} + \text{left})/(-z)}{(\text{right} - \text{left})/(-z)}$

整理得： $x_{ndc} = \frac{2x + z(\text{right} + \text{left})/n}{z(\text{right} - \text{left})/n}$

Y坐标变换：类似地： $y_{ndc} = \frac{2y + z(\text{top} + \text{bottom})/n}{z(\text{top} - \text{bottom})/n}$

Z坐标变换： Z坐标的变换需要保持深度顺序： $z_{ndc} = \frac{\alpha z + \beta}{z}$

边界条件：

$z = -n \implies z_{ndc} = -1$
$z = -f \implies z_{ndc} = 1$

解得： $\alpha = -(f+n)$ ， $\beta = -2fn$

齐次坐标矩阵形式#

一般透视投影矩阵：

透视投影矩阵 $P$ 的结构：

第1行： $(\frac{2n}{r-l}, 0, \frac{r+l}{r-l}, 0)$
第2行： $(0, \frac{2n}{t-b}, \frac{t+b}{t-b}, 0)$
第3行： $(0, 0, -\frac{f+n}{f-n}, -\frac{2fn}{f-n})$
第4行： $(0, 0, -1, 0)$

$P = \text{general perspective projection matrix}$

其中： $n=\text{near}$ , $f=\text{far}$ , $l=\text{left}$ , $r=\text{right}$ , $t=\text{top}$ , $b=\text{bottom}$

对称视锥体的简化#

对称条件： $l = -r$ , $b = -t$

此时： $r + l = 0$ , $t + b = 0$ ，矩阵简化为：

对称透视投影矩阵 $P_{symmetric}$ 的结构：

第1行： $(\frac{1}{\text{aspect} \cdot \tan(\text{fov}/2)}, 0, 0, 0)$
第2行： $(0, \frac{1}{\tan(\text{fov}/2)}, 0, 0)$
第3行： $(0, 0, -\frac{f+n}{f-n}, -\frac{2fn}{f-n})$
第4行： $(0, 0, -1, 0)$

$P_{symmetric} = \text{symmetric perspective projection matrix}$

推导验证：

$\frac{2n}{r-l} = \frac{2n}{2r} = \frac{n}{r} = \frac{n}{n \cdot \tan(\text{fov}/2) \cdot \text{aspect}} = \frac{1}{\text{aspect} \cdot \tan(\text{fov}/2)}$
$\frac{2n}{t-b} = \frac{2n}{2t} = \frac{n}{t} = \frac{n}{n \cdot \tan(\text{fov}/2)} = \frac{1}{\tan(\text{fov}/2)}$

GAMES101 Assignment 1项目实现#

完整的透视投影矩阵实现：

1
Eigen::Matrix4f get_projection_matrix(float eye_fov, float aspect_ratio,
2
                                      float zNear, float zFar) {
3
    // 创建单位矩阵作为基础
4
    Eigen::Matrix4f projection = Eigen::Matrix4f::Identity();
5

6
    // 将视场角从度转换为弧度
7
    float eye_fov_rad = eye_fov * MY_PI / 180.0f;
8

9
    // 计算 tan(fov/2)，这是推导中的关键量
10
    float t = std::tan(eye_fov_rad / 2.0f);
11

12
    // 根据对称视锥体的简化公式填充矩阵元素
13
    projection(0, 0) = 1.0f / (aspect_ratio * t);  // X缩放因子
14
    projection(1, 1) = 1.0f / t;                   // Y缩放因子
15
    projection(2, 2) = -(zFar + zNear) / (zFar - zNear);     // Z变换系数A
16
    projection(2, 3) = -2.0f * zFar * zNear / (zFar - zNear); // Z变换系数B
17
    projection(3, 2) = -1.0f;                      // 透视除法触发器
18
    projection(3, 3) = 0.0f;                       // 清除原有的1
19

20
    return projection;
21
}

矩阵元素的几何意义：

projection(0,0) = 1/(aspect*tan(fov/2))：X方向的缩放，将视锥体宽度映射到[-1,1]
projection(1,1) = 1/tan(fov/2)：Y方向的缩放，将视锥体高度映射到[-1,1]
projection(2,2) = -(f+n)/(f-n)：Z坐标的线性部分
projection(2,3) = -2fn/(f-n)：Z坐标的常数部分
projection(3,2) = -1：使得w’ = -z，实现透视除法

变换过程验证：

1
// 测试近平面上的点
2
Vector4f near_point(0, 0, -zNear, 1);
3
Vector4f projected = projection * near_point;
4
// projected = (0, 0, zNear, zNear)
5
// 透视除法后: (0, 0, 1) - 正确映射到近平面
6

7
// 测试远平面上的点
8
Vector4f far_point(0, 0, -zFar, 1);
9
Vector4f projected_far = projection * far_point;
10
// 透视除法后的z坐标应该接近-1

在渲染管线中的应用：

1
// Assignment 1中的完整变换链
2
void rasterizer::draw(pos_buf_id pos_buffer, ind_buf_id ind_buffer, Primitive type) {
3
    auto& buf = pos_buf[pos_buffer.pos_id];
4
    auto& ind = ind_buf[ind_buffer.ind_id];
5

6
    // 构建MVP矩阵
7
    Eigen::Matrix4f mvp = projection * view * model;
8

9
    for (auto& i : ind) {
10
        Triangle t;
11

12
        // 应用MVP变换到三角形的三个顶点
13
        Eigen::Vector4f v[] = {
14
            mvp * to_vec4(buf[i[0]], 1.0f),  // 齐次坐标变换
15
            mvp * to_vec4(buf[i[1]], 1.0f),
16
            mvp * to_vec4(buf[i[2]], 1.0f)
17
        };
18

19
        // 透视除法：从齐次坐标转换到NDC
20
        for (auto& vec : v) {
21
            vec /= vec.w();  // 关键的透视除法步骤
22
        }
23

24
        // 视口变换：从NDC转换到屏幕坐标
25
        for (auto& vert : v) {
26
            vert.x() = 0.5f * width * (vert.x() + 1.0f);   // [-1,1] -> [0,width]
27
            vert.y() = 0.5f * height * (vert.y() + 1.0f);  // [-1,1] -> [0,height]
28
            vert.z() = vert.z() * f1 + f2;  // 深度缓冲区映射
29
        }
30

31
        // 设置三角形顶点并进行光栅化
32
        for (int i = 0; i < 3; ++i) {
33
            t.setVertex(i, v[i].head<3>());
34
        }
35

36
        rasterize_wireframe(t);
37
    }
38
}

3.1.4 深度值的非线性分布#

问题：透视投影后的深度值分布不均匀

数学分析：投影后的z坐标为： $z' = -\frac{f+n}{f-n} + \frac{-2fn}{z(f-n)}$

深度精度分析：

近处物体：深度精度高
远处物体：深度精度低
大部分精度集中在近裁剪面附近

解决方案：

合理设置near/far比值
使用反向Z缓冲
对数深度缓冲

3.2 视图变换#

3.2.1 摄像机模型#

摄像机参数：

eye：摄像机位置
target：观察目标点
up：上方向向量

局部坐标系构建：

1
Vector3f forward = (target - eye).normalized();  // 前方向（-z轴）
2
Vector3f right = forward.cross(up).normalized(); // 右方向（x轴）
3
Vector3f camera_up = right.cross(forward);       // 上方向（y轴）

3.2.2 视图矩阵推导#

目标：将世界坐标系变换到摄像机坐标系

两步变换：

平移：将摄像机移动到原点
旋转：将摄像机坐标轴与世界坐标轴对齐

平移矩阵：

视图变换平移矩阵 $\mathbf{T}$ 的结构：

左上角 $3 \times 3$ 子矩阵为单位矩阵
第4列前三个元素为 $(-eye_x, -eye_y, -eye_z)$
第4行为 $(0, 0, 0, 1)$

$\mathbf{T} = \text{view translation matrix}$

旋转矩阵：

视图变换旋转矩阵 $\mathbf{R}$ 的结构：

第1行： $(right_x, right_y, right_z, 0)$ - 右向量
第2行： $(up_x, up_y, up_z, 0)$ - 上向量
第3行： $(-forward_x, -forward_y, -forward_z, 0)$ - 负前向量
第4行： $(0, 0, 0, 1)$ - 齐次坐标

$\mathbf{R} = \text{view rotation matrix}$

完整视图矩阵： $\mathbf{V} = \mathbf{R} \times \mathbf{T}$

项目简化实现：

1
Eigen::Matrix4f get_view_matrix(Eigen::Vector3f eye_pos) {
2
    Eigen::Matrix4f view = Eigen::Matrix4f::Identity();
3

4
    Eigen::Matrix4f translate;
5
    translate << 1, 0, 0, -eye_pos[0],
6
                 0, 1, 0, -eye_pos[1],
7
                 0, 0, 1, -eye_pos[2],
8
                 0, 0, 0, 1;
9

10
    view = translate * view;
11
    return view;
12
}

3.1.4 深度缓冲区与Z-Fighting问题#

深度值的非线性分布#

问题分析：透视投影后的深度值在 $[0, 1]$ 范围内呈非线性分布，这会导致深度精度问题。

深度变换函数：经过透视投影和透视除法后，原始深度 $z$ 变换为： $z_{buffer} = \frac{1}{2}\left(\frac{-(f+n)z - 2fn}{-z(f-n)} + 1\right)$

简化为： $z_{buffer} = \frac{1}{2}\left(\frac{f+n}{f-n} + \frac{2fn}{z(f-n)}\right)$

非线性特性分析：

当 $z \to -n$ （近平面）时， $z_{buffer} \to 0$
当 $z \to -f$ （远平面）时， $z_{buffer} \to 1$
深度精度在近平面附近最高，在远平面附近最低

精度分布计算：深度精度定义为 $\frac{dz_{buffer}}{dz}$ ： $\frac{dz_{buffer}}{dz} = \frac{fn}{z^2(f-n)}$

这表明深度精度与 $z^2$ 成反比，距离越远精度越低。

Z-Fighting现象#

定义：当两个表面非常接近时，由于深度缓冲区精度限制，会出现闪烁现象。

产生原因：

有限精度：深度缓冲区通常使用24位或32位浮点数
非线性分布：远处物体的深度精度极低
数值误差：浮点运算的舍入误差

数学分析：设两个表面的深度分别为 $z_1$ 和 $z_2$ ，且 $|z_1 - z_2| < \epsilon$ ，其中 $\epsilon$ 是深度缓冲区的精度。

当 $\frac{fn}{z^2(f-n)} \cdot |z_1 - z_2| < \frac{1}{2^{24}}$ 时，两个表面在深度缓冲区中无法区分。

解决Z-Fighting的方法#

1. 优化近远平面比值： $\text{精度} \propto \frac{n}{f-n}$

减小 $f/n$ 比值可以提高整体精度：

1
// 不好的设置
2
float near = 0.1f, far = 10000.0f;  // 比值 = 100000
3

4
// 更好的设置
5
float near = 1.0f, far = 1000.0f;   // 比值 = 1000

2. 多边形偏移（Polygon Offset）：

1
// OpenGL中的多边形偏移
2
glEnable(GL_POLYGON_OFFSET_FILL);
3
glPolygonOffset(factor, units);
4
// 修改深度值：z' = z + factor * dz/dx + units * r

3. 对数深度缓冲区：使用对数分布改善深度精度： $z_{log} = \frac{\log(z/n)}{\log(f/n)}$

4. 反向Z缓冲区：将远平面映射到0，近平面映射到1，利用浮点数在0附近精度更高的特性。

GAMES101项目中的深度处理#

1
// Assignment 2中的深度测试实现
2
void rst::rasterizer::rasterize_triangle(const Triangle& t) {
3
    // 获取三角形的屏幕空间包围盒
4
    auto v = t.toVector4();
5

6
    // 遍历包围盒内的每个像素
7
    for (int x = bbox_min_x; x <= bbox_max_x; x++) {
8
        for (int y = bbox_min_y; y <= bbox_max_y; y++) {
9
            // 计算重心坐标
10
            auto [alpha, beta, gamma] = computeBarycentric2D(x, y, t.v);
11

12
            // 检查点是否在三角形内
13
            if (alpha >= 0 && beta >= 0 && gamma >= 0) {
14
                // 插值计算深度值
15
                float z_interpolated = alpha * v[0].z() + beta * v[1].z() + gamma * v[2].z();
16

17
                // 深度测试
18
                if (z_interpolated < depth_buf[get_index(x, y)]) {
19
                    // 更新深度缓冲区
20
                    depth_buf[get_index(x, y)] = z_interpolated;
21

22
                    // 设置像素颜色
23
                    set_pixel(Vector3f(x, y, 1.0f), t.getColor());
24
                }
25
            }
26
        }
27
    }
28
}

深度精度优化建议：

合理设置近远平面：避免过大的 $f/n$ 比值
使用32位深度缓冲区：相比24位有更高精度
分层渲染：将场景分为多个深度层分别渲染
避免共面几何体：设计时避免两个表面完全重合

微积分在图形学中的应用#

4.1 参数曲线的微分几何理论#

4.1.1 参数曲线的数学表示#

参数曲线的基本定义#

参数方程的一般形式：三维空间中的参数曲线可以表示为： $\vec{r}(t) = \begin{pmatrix} x(t) \\ y(t) \\ z(t) \end{pmatrix}, \quad t \in [a, b]$

其中 $x(t)$ 、 $y(t)$ 、 $z(t)$ 是关于参数 $t$ 的连续可微函数。

参数化的优势：

统一表示：直线、圆、椭圆等都可用参数方程统一描述
方向性：参数增加方向给出曲线的自然定向
计算便利：微分、积分运算转化为对参数的运算

切向量与速度向量#

一阶导数（切向量）： $\vec{r}'(t) = \frac{d\vec{r}}{dt} = \begin{pmatrix} x'(t) \\ y'(t) \\ z'(t) \end{pmatrix}$

几何与物理意义：

几何意义： $\vec{r}'(t)$ 是曲线在点 $\vec{r}(t)$ 处的切向量
物理意义：若 $t$ 表示时间，则 $\vec{r}'(t)$ 是质点的瞬时速度向量
方向：指向参数增加的方向

单位切向量： $\vec{T}(t) = \frac{\vec{r}'(t)}{\|\vec{r}'(t)\|}$

当 $\|\vec{r}'(t)\| \neq 0$ 时， $\vec{T}(t)$ 是单位长度的切向量。

4.1.2 曲率理论与计算#

曲率的数学定义#

曲率的几何定义：曲率 $\kappa(t)$ 描述曲线在某点处偏离直线的程度，定义为单位切向量的变化率： $\kappa(t) = \left\|\frac{d\vec{T}}{dt}\right\| = \left\|\frac{d}{dt}\left(\frac{\vec{r}'(t)}{\|\vec{r}'(t)\|}\right)\right\|$

计算公式推导：利用向量微分的商法则： $\frac{d\vec{T}}{dt} = \frac{d}{dt}\left(\frac{\vec{r}'}{\|\vec{r}'\|}\right) = \frac{\vec{r}'' \|\vec{r}'\| - \vec{r}'(\vec{r}' \cdot \vec{r}'') / \|\vec{r}'\|}{\|\vec{r}'\|^2}$

经过化简得到： $\kappa(t) = \frac{\|\vec{r}'(t) \times \vec{r}''(t)\|}{\|\vec{r}'(t)\|^3}$

二维情况的特殊形式：对于平面曲线 $y = f(x)$ ： $\kappa = \frac{|f''(x)|}{(1 + (f'(x))^2)^{3/2}}$

曲率的几何意义与应用#

几何解释：

$\kappa = 0$ ：曲线为直线
$\kappa > 0$ ：曲线弯曲，数值越大弯曲程度越大
$\kappa = 1/R$ ： $R$ 为曲率半径，即密切圆的半径

在计算机图形学中的应用：

自适应曲线细分：

1
float compute_curvature(const Vector3f& p0, const Vector3f& p1, const Vector3f& p2) {
2
    Vector3f v1 = p1 - p0;
3
    Vector3f v2 = p2 - p1;
4
    Vector3f cross_product = v1.cross(v2);
5

6
    float numerator = cross_product.norm();
7
    float denominator = std::pow(v1.norm(), 3);
8

9
    return (denominator > 1e-6) ? numerator / denominator : 0.0f;
10
}
11

12
void adaptive_subdivision(const BezierCurve& curve, float tolerance) {
13
    for (float t = 0; t < 1.0; ) {
14
        float curvature = compute_curvature_at(curve, t);
15
        float step = std::min(tolerance / std::max(curvature, 1e-3), 0.1f);
16

17
        // 在高曲率处使用更小的步长
18
        render_curve_segment(curve, t, t + step);
19
        t += step;
20
    }
21
}

动画路径平滑：通过控制曲率连续性确保动画的平滑过渡。

4.2 积分理论在渲染中的应用#

4.2.1 渲染方程的数学基础#

渲染方程的物理推导#

能量守恒原理：在稳态条件下，表面某点的出射辐射度等于自发光加上所有入射光线经反射后的贡献。

渲染方程的完整形式： $L_o(\mathbf{p}, \omega_o) = L_e(\mathbf{p}, \omega_o) + \int_{\Omega} f_r(\mathbf{p}, \omega_i, \omega_o) L_i(\mathbf{p}, \omega_i) \cos\theta_i \, d\omega_i$

符号说明：

$L_o(\mathbf{p}, \omega_o)$ ：点 $\mathbf{p}$ 沿方向 $\omega_o$ 的出射辐射度
$L_e(\mathbf{p}, \omega_o)$ ：点 $\mathbf{p}$ 的自发光辐射度
$f_r(\mathbf{p}, \omega_i, \omega_o)$ ：双向反射分布函数（BRDF）
$L_i(\mathbf{p}, \omega_i)$ ：沿方向 $\omega_i$ 的入射辐射度
$\Omega$ ：以点 $\mathbf{p}$ 为中心的上半球立体角
$\theta_i$ ：入射方向与表面法向量的夹角

BRDF的数学性质#

BRDF的定义： $f_r(\mathbf{p}, \omega_i, \omega_o) = \frac{dL_o(\mathbf{p}, \omega_o)}{dE_i(\mathbf{p}, \omega_i)}$

其中 $dE_i$ 是微分辐照度。

重要性质：

非负性： $f_r(\mathbf{p}, \omega_i, \omega_o) \geq 0$
互易性： $f_r(\mathbf{p}, \omega_i, \omega_o) = f_r(\mathbf{p}, \omega_o, \omega_i)$
能量守恒： $\int_{\Omega} f_r(\mathbf{p}, \omega_i, \omega_o) \cos\theta_o \, d\omega_o \leq 1$

4.2.2 蒙特卡洛积分理论#

蒙特卡洛方法的数学基础#

基本原理：对于积分 $I = \int_D f(\mathbf{x}) d\mathbf{x}$ ，蒙特卡洛估计为： $\hat{I} = \frac{1}{N} \sum_{i=1}^N \frac{f(\mathbf{X}_i)}{p(\mathbf{X}_i)}$

其中 $\mathbf{X}_i$ 是根据概率密度函数 $p(\mathbf{x})$ 采样的随机变量。

估计量的性质：

无偏性： $E[\hat{I}] = I$
方差： $\text{Var}[\hat{I}] = \frac{1}{N} \int_D \left(\frac{f(\mathbf{x})}{p(\mathbf{x})} - I\right)^2 p(\mathbf{x}) d\mathbf{x}$
收敛性： $\hat{I} \xrightarrow{P} I$ 当 $N \to \infty$

重要性采样的数学优化#

方差最小化：最优的概率密度函数为： $p^*(\mathbf{x}) = \frac{|f(\mathbf{x})|}{\int_D |f(\mathbf{y})| d\mathbf{y}}$

此时方差为零，但实际中难以实现。

实用的重要性采样策略：选择 $p(\mathbf{x}) \propto |f(\mathbf{x})|$ 可以显著减少方差。

在路径追踪中的实现#

1
Vector3f monte_carlo_integration(const Intersection& hit_point, int samples) {
2
    Vector3f color(0, 0, 0);
3
    const Vector3f& normal = hit_point.normal;
4

5
    for (int i = 0; i < samples; ++i) {
6
        // 重要性采样：按余弦分布采样
7
        Vector3f sample_dir = cosine_weighted_hemisphere_sample();
8

9
        // 计算采样概率密度
10
        float cos_theta = std::max(0.0f, normal.dot(sample_dir));
11
        float pdf = cos_theta / M_PI;  // 余弦加权采样的PDF
12

13
        if (pdf > 1e-6) {
14
            // 计算BRDF值
15
            Vector3f brdf_value = evaluate_brdf(hit_point, sample_dir);
16

17
            // 递归追踪光线
18
            Vector3f incoming_radiance = trace_ray(hit_point.position, sample_dir);
19

20
            // 蒙特卡洛估计
21
            color += brdf_value * incoming_radiance * cos_theta / pdf;
22
        }
23
    }
24

25
    return color / static_cast<float>(samples);
26
}
27

28
// 余弦加权半球采样
29
Vector3f cosine_weighted_hemisphere_sample() {
30
    float u1 = random_float();
31
    float u2 = random_float();
32

33
    float cos_theta = std::sqrt(u1);
34
    float sin_theta = std::sqrt(1.0f - u1);
35
    float phi = 2.0f * M_PI * u2;
36

37
    return Vector3f(sin_theta * std::cos(phi),
38
                   sin_theta * std::sin(phi),
39
                   cos_theta);
40
}