8571 字

43 分钟

计算机图形学笔记(二)：光栅化渲染管线

2025-07-22

计算机图形学

C++

/

编程

/

计算机图形学

/

OpenGL

NOTE
光栅化是整个图形学流水线里最”接地气”的一环——从一堆三角形到屏幕上的每一个像素，中间的每一步都既涉及几何与代数，也关心工程上怎么做得快。本部分按管线→几何阶段→裁剪→光栅化核心→深度→光照→纹理的顺序展开，所有关键推导都保留完整过程。

目录#

渲染管线总览 — 三大阶段、MVP 变换链、可编程着色器
几何阶段 — 顶点数据组织、法向量变换代码、TRS 分解
图元装配与裁剪 — 齐次空间裁剪、Sutherland-Hodgman 算法
光栅化核心 — Bresenham 画线、三角形光栅化、重心坐标、透视校正
深度测试 — Z-Buffer、深度精度、Z-Fighting 与反向 Z
光照模型 — Phong、Blinn-Phong、着色频率
纹理映射 — 采样、过滤、Mipmap、法线贴图、环境映射

五、渲染管线总览#

5.1 管线三大阶段#

现代 GPU 的光栅化管线概念上可以拆成三个大阶段，它们之间通过固定的数据格式交接。

应用阶段（Application Stage, CPU）

场景管理、视锥剔除（粗粒度）、LOD 选择
动画更新（骨骼、顶点变形）
最终提交给 GPU 的是顶点缓冲 + 索引 + 绘制调用

几何阶段（Geometry Stage, GPU）

顶点着色器：顶点变换（MVP）、法向量变换、属性传递
可选曲面细分 / 几何着色器
投影、裁剪、屏幕映射

光栅化阶段（Rasterization Stage, GPU）

三角形设置：边方程与重心坐标系数
三角形遍历：决定哪些像素被覆盖
片段着色器：按像素计算颜色
输出合并：深度测试、模板测试、混合

TIP
把”谁做什么”记清楚对写 Shader 非常关键：Vertex Shader 一个顶点跑一次、Fragment Shader 一个像素跑一次，两者之间的属性通过光栅化阶段的插值衔接。

5.2 坐标空间变换链#

图形学里最经典的一张图：

\underbrace{\text{模型坐标}}_{\text{Local}} \xrightarrow{\mathbf{M}} \underbrace{\text{世界坐标}}_{\text{World}} \xrightarrow{\mathbf{V}} \underbrace{\text{观察坐标}}_{\text{View}} \xrightarrow{\mathbf{P}} \underbrace{\text{裁剪坐标}}_{\text{Clip}} \xrightarrow{\div w} \underbrace{\text{NDC}}_{[-1,1]^3} \xrightarrow{\text{视口}} \underbrace{\text{屏幕坐标}}_{\text{Screen}}

每一步的矩阵推导在 Part 1：数学基础里有完整细节（ $mathbf{M,V,P}$ 的构造分别见 Part 1 §2.2、§3.2、§3.1），这里只记住两个要点：

一、复合矩阵的顺序

\vec{v}_{clip} = \mathbf{P} \cdot \mathbf{V} \cdot \mathbf{M} \cdot \vec{v}_{local}

矩阵乘法从右往左作用，所以写代码的时候也必须按 P * V * M 构造。

二、透视除法触发点

投影矩阵最后一行通常是 $(0, 0, -1, 0)$ （OpenGL 约定），这会把 $-z_{view}$ 放进 $w_{clip}$ 。只有在裁剪完成之后，硬件才做 $(x, y, z) / w$ 的除法得到 NDC——这个顺序不能反，否则会把视锥外的点除到视锥内，产生透视裁剪 bug。

视口变换将 NDC 映射到屏幕坐标：

\mathbf{S} = \begin{pmatrix} w/2 & 0 & 0 & w/2 \\ 0 & h/2 & 0 & h/2 \\ 0 & 0 & (f_2-f_1)/2 & (f_2+f_1)/2 \\ 0 & 0 & 0 & 1 \end{pmatrix}

其中 $w, h$ 是屏幕宽高， $[f_1, f_2]$ 是深度缓冲区映射范围（OpenGL 默认 $[0,1]$ ）。

5.3 可编程着色器#

5.3.1 顶点着色器（Vertex Shader）#

每个顶点运行一次，职责是把顶点从模型空间送进裁剪空间。

1
#version 330 core
2
layout (location = 0) in vec3 aPos;
3
layout (location = 1) in vec3 aNormal;
4
layout (location = 2) in vec2 aTexCoord;
5

6
uniform mat4 uModel;
7
uniform mat4 uView;
8
uniform mat4 uProjection;
9
uniform mat3 uNormalMatrix;   // inverse-transpose of upper-left 3x3 of uModel
10

11
out vec3 vWorldPos;
12
out vec3 vNormal;
13
out vec2 vTexCoord;
14

15
void main() {
16
    vec4 worldPos = uModel * vec4(aPos, 1.0);
17
    vWorldPos = worldPos.xyz;
18
    vNormal   = normalize(uNormalMatrix * aNormal);
19
    vTexCoord = aTexCoord;
20
    gl_Position = uProjection * uView * worldPos;
21
}

WARNING
法向量必须用 (M⁻¹)ᵀ 的左上 3×3 去变换，不能直接乘 uModel。完整推导见 Part 1 §2.3，本部分 §6.2 只放工程实现。

5.3.2 片段着色器（Fragment Shader）#

光栅化器每覆盖一个像素就调一次。Vertex Shader 的 out 变量到这里已经是透视校正插值过的结果。

1
#version 330 core
2
in vec3 vWorldPos;
3
in vec3 vNormal;
4
in vec2 vTexCoord;
5

6
uniform sampler2D uAlbedo;
7
uniform vec3 uLightPos;
8
uniform vec3 uViewPos;
9
out vec4 FragColor;
10

11
void main() {
12
    vec3 N = normalize(vNormal);
13
    vec3 L = normalize(uLightPos - vWorldPos);
14
    vec3 V = normalize(uViewPos  - vWorldPos);
15
    vec3 H = normalize(L + V);                 // 半角向量（Blinn-Phong）
16

17
    vec3  albedo   = texture(uAlbedo, vTexCoord).rgb;
18
    float diff     = max(dot(N, L), 0.0);
19
    float spec     = pow(max(dot(N, H), 0.0), 64.0);
20
    vec3  ambient  = 0.1 * albedo;
21
    vec3  diffuse  = diff * albedo;
22
    vec3  specular = vec3(0.3) * spec;
23

24
    FragColor = vec4(ambient + diffuse + specular, 1.0);
25
}

六、几何阶段细节#

6.1 顶点数据组织#

一个几何体在 GPU 上的常见表示：

1
struct Vertex {
2
    Eigen::Vector3f position;   // 模型空间坐标
3
    Eigen::Vector3f normal;     // 顶点法向量
4
    Eigen::Vector2f texCoord;   // UV
5
    Eigen::Vector3f tangent;    // 切向量（法线贴图需要）
6
};

VBO（Vertex Buffer Object）：连续存放所有顶点属性的 GPU 缓冲区。

EBO（Element Buffer Object）：索引数组，让多个三角形共享同一个顶点，避免重复。

VAO（Vertex Array Object）：记录 VBO/EBO 的绑定关系和顶点属性的内存布局，绘制时只用绑 VAO 就能恢复全部状态。

1
unsigned int VAO, VBO, EBO;
2
glGenVertexArrays(1, &VAO);
3
glGenBuffers(1, &VBO);
4
glGenBuffers(1, &EBO);
5

6
glBindVertexArray(VAO);
7

8
glBindBuffer(GL_ARRAY_BUFFER, VBO);
9
glBufferData(GL_ARRAY_BUFFER, vertices.size() * sizeof(Vertex),
10
             vertices.data(), GL_STATIC_DRAW);
11

12
glBindBuffer(GL_ELEMENT_ARRAY_BUFFER, EBO);
13
glBufferData(GL_ELEMENT_ARRAY_BUFFER, indices.size() * sizeof(unsigned int),
14
             indices.data(), GL_STATIC_DRAW);
15

16
// location 0: 位置
17
glEnableVertexAttribArray(0);
18
glVertexAttribPointer(0, 3, GL_FLOAT, GL_FALSE, sizeof(Vertex),
19
                      (void*)offsetof(Vertex, position));
20
// location 1: 法向量
21
glEnableVertexAttribArray(1);
22
glVertexAttribPointer(1, 3, GL_FLOAT, GL_FALSE, sizeof(Vertex),
23
                      (void*)offsetof(Vertex, normal));
24
// location 2: UV
25
glEnableVertexAttribArray(2);
26
glVertexAttribPointer(2, 2, GL_FLOAT, GL_FALSE, sizeof(Vertex),
27
                      (void*)offsetof(Vertex, texCoord));

6.2 法向量变换（仅工程实现）#

NOTE
完整推导见 Part 1 §2.3（切平面垂直条件 → 逆转置），本节只保留工程代码和易错点。

1
// 从 4x4 模型矩阵计算 3x3 法向量矩阵
2
Eigen::Matrix3f compute_normal_matrix(const Eigen::Matrix4f& model) {
3
    return model.block<3, 3>(0, 0).inverse().transpose();
4
}
5

6
// 把模型空间法向量变到世界空间
7
Eigen::Vector3f transform_normal(const Eigen::Vector3f& n,
8
                                 const Eigen::Matrix4f& model) {
9
    return (compute_normal_matrix(model) * n).normalized();
10
}

易错点清单

❌ 直接 model * n（非均匀缩放下不垂直切平面）
❌ 忘记取左上 3×3（把平移项混进去会搞坏方向向量）
❌ 忘记最后归一化（缩放会改变法向量长度，后续光照计算失败）
✅ 纯旋转时， $(mathbf{M}^{-1})^T = mathbf{M}$ ，法向量矩阵退化为原矩阵

6.3 变换矩阵的 TRS 分解#

场景：从一个任意仿射矩阵反推原始的 Translation / Rotation / Scale，用于动画插值、编辑器 Gizmo、骨骼系统。

分解定理：任何可逆仿射矩阵可以唯一分解为

\mathbf{M} = \mathbf{T} \cdot \mathbf{R} \cdot \mathbf{S}

算法步骤

提取平移： $vec{t} = mathbf{M}[0{:}3, 3]$
提取线性部分： $mathbf{A} = mathbf{M}[0{:}3, 0{:}3]$ （上 3×3）
计算缩放因子： $s_k = |mathbf{A}_{[:,k]}|$ （每列的模长）
检测反射：若 $det(mathbf{A}) < 0$ ，把 $s_z$ 取负，避免把反射当成旋转
提取旋转： $mathbf{R}*{[:,k]} = mathbf{A}*{[:,k]} / s_k$

1
struct Transform {
2
    Eigen::Vector3f    translation;
3
    Eigen::Quaternionf rotation;
4
    Eigen::Vector3f    scale;
5
};
6

7
Transform decompose(const Eigen::Matrix4f& M) {
8
    Transform out;
9
    out.translation = M.block<3, 1>(0, 3);
10

11
    Eigen::Matrix3f A = M.block<3, 3>(0, 0);
12
    out.scale.x() = A.col(0).norm();
13
    out.scale.y() = A.col(1).norm();
14
    out.scale.z() = A.col(2).norm();
15

16
    // 处理反射：把负号归到 Z
17
    if (A.determinant() < 0.0f) out.scale.z() = -out.scale.z();
18

19
    Eigen::Matrix3f R;
20
    R.col(0) = A.col(0) / out.scale.x();
21
    R.col(1) = A.col(1) / out.scale.y();
22
    R.col(2) = A.col(2) / out.scale.z();
23
    out.rotation = Eigen::Quaternionf(R);
24

25
    return out;
26
}

WARNING
这个”极分解”在存在切变（shear） 时会失败——切变无法用 TRS 表达。真要支持切变需要完整的极分解 $mathbf{A} = mathbf{R} cdot mathbf{U}$ ，其中 $\mathbf{U}$ 是正定对称矩阵。工程上通常约定导出器不产生切变。

七、图元装配与裁剪#

7.1 图元类型#

GPU 只认识三种基本图元：点、线段、三角形。其他几何体（四边形、圆、贝塞尔曲线）都要先转成这三种。

常用的三角形拓扑：

GL_TRIANGLES：每 3 个顶点一个三角形
GL_TRIANGLE_STRIP：相邻三角形共享两个顶点， $n$ 个顶点定义 $n-2$ 个三角形
GL_TRIANGLE_FAN：所有三角形共享第一个顶点，适合凸多边形

7.2 齐次空间裁剪#

为什么要裁剪？ 视锥外的三角形不能直接丢掉：横跨视锥边界的三角形必须被切开，否则透视除法会产生错误的屏幕坐标（尤其是经过相机后方的点， $w < 0$ 会导致坐标翻转）。

齐次空间视锥（OpenGL 约定）的六个半空间：

\begin{aligned} -w \leq x \leq w \quad (\text{左、右}) \\ -w \leq y \leq w \quad (\text{下、上}) \\ -w \leq z \leq w \quad (\text{近、远}) \end{aligned}

直接在齐次坐标 $(x, y, z, w)$ 下做裁剪，不需要先除 $w$ ——这是整个管线能正确处理跨视锥三角形的关键。

点的裁剪测试：

1
bool point_inside_frustum(const Eigen::Vector4f& p) {
2
    float w = p.w();
3
    return  p.x() >= -w && p.x() <= w
4
         && p.y() >= -w && p.y() <= w
5
         && p.z() >= -w && p.z() <= w;
6
}

点到某个裁剪平面的带符号距离（用来求三角形与平面的交点参数）：

\begin{array}{ll} \text{左}:\ d = w + x, & \text{右}:\ d = w - x \\ \text{下}:\ d = w + y, & \text{上}:\ d = w - y \\ \text{近}:\ d = w + z, & \text{远}:\ d = w - z \\ \end{array}

7.3 Sutherland-Hodgman 多边形裁剪#

算法思想：对每一个裁剪平面，把输入多边形切一刀，结果多边形再作为下一个平面的输入。六个平面处理完就得到最终裁剪结果。

单平面裁剪的四种情况（遍历每条边 $P_{prev} to P_{curr}$ ）：

$P_{prev}$	$P_{curr}$	输出
内	内	输出 $P_{curr}$
内	外	输出交点
外	内	输出交点，再输出 $P_{curr}$
外	外	什么都不输出

交点的参数计算：设前后两点到平面的带符号距离为 $d_1, d_2$ ，则交点参数

t = \frac{d_1}{d_1 - d_2}, \quad P_{\text{cross}} = P_{prev} + t(P_{curr} - P_{prev})

WARNING
交点不仅位置要插值，所有顶点属性（UV、颜色、法向量）都要按同一个 $t$ 线性插值——否则裁剪出来的片段会出现纹理错位。

1
struct ClipVertex {
2
    Eigen::Vector4f pos;       // 齐次裁剪坐标
3
    Eigen::Vector3f normal;
4
    Eigen::Vector2f uv;
5
};
6

7
// 对某个裁剪平面计算带符号距离
8
using DistFn = std::function<float(const Eigen::Vector4f&)>;
9

10
std::vector<ClipVertex> clip_against_plane(const std::vector<ClipVertex>& in,
11
                                           DistFn dist) {
12
    std::vector<ClipVertex> out;
13
    if (in.empty()) return out;
14

15
    for (size_t i = 0; i < in.size(); ++i) {
16
        const ClipVertex& curr = in[i];
17
        const ClipVertex& prev = in[(i + in.size() - 1) % in.size()];
18

19
        float d_curr = dist(curr.pos);
20
        float d_prev = dist(prev.pos);
21

22
        bool curr_inside = d_curr >= 0.0f;
23
        bool prev_inside = d_prev >= 0.0f;
24

25
        if (curr_inside != prev_inside) {
26
            float t = d_prev / (d_prev - d_curr);
27
            ClipVertex cross;
28
            cross.pos    = prev.pos    + t * (curr.pos    - prev.pos);
29
            cross.normal = prev.normal + t * (curr.normal - prev.normal);
30
            cross.uv     = prev.uv     + t * (curr.uv     - prev.uv);
31
            out.push_back(cross);
32
        }
33
        if (curr_inside) out.push_back(curr);
34
    }
35
    return out;
36
}

依次对六个平面调用 clip_against_plane，得到裁剪后的凸多边形。若顶点数 $> 3$ ，再做三角形扇化（Triangle Fan）即可。

八、光栅化核心#

8.1 Bresenham 画线算法（规范推导位置）#

8.1.1 问题#

给定两个整数端点 $(x_0, y_0)$ 和 $(x_1, y_1)$ ，在像素网格上画出一条近似直线，要求：

每列（或每行）只点亮一个像素，避免断线
只用整数加减和比较，没有除法和浮点

8.1.2 从直线方程出发#

设 $Delta x = x_1 - x_0 > 0$ ， $Delta y = y_1 - y_0 > 0$ ，斜率 $m = Delta y / Delta x in (0, 1]$ 。直线方程写成隐式：

F(x, y) = \Delta y \cdot x - \Delta x \cdot y + (\Delta x \cdot y_0 - \Delta y \cdot x_0) = 0

$F > 0$ ：点在直线下方
$F < 0$ ：点在直线上方
$F = 0$ ：点在直线上

8.1.3 中点判据#

假设已经点亮了 $(x_k, y_k)$ ，下一个像素只能在 $(x_k+1, y_k)$ 或 $(x_k+1, y_k+1)$ 二选一。取两者的中点 $M = (x_k+1, y_k+0.5)$ ，代入 $F$ ：

d_k = F(x_k+1,\ y_k+0.5) = \Delta y (x_k+1) - \Delta x (y_k+0.5) + C

$d_k < 0$ ：中点在直线上方 → 直线更靠下 → 选 $(x_k+1, y_k)$
$d_k geq 0$ ：中点在直线下方 → 直线更靠上 → 选 $(x_k+1, y_k+1)$

8.1.4 增量化（关键一步）#

直接算 $d_k$ 还有浮点。相邻两步的判据差值是纯整数：

情况 A： $d_k < 0$ ，选 $(x_k+1, y_k)$

d_{k+1} - d_k = \Delta y(x_k+2) - \Delta x(y_k+0.5) - [\Delta y(x_k+1) - \Delta x(y_k+0.5)] = \Delta y

情况 B： $d_k geq 0$ ，选 $(x_k+1, y_k+1)$

d_{k+1} - d_k = \Delta y(x_k+2) - \Delta x(y_k+1.5) - [\Delta y(x_k+1) - \Delta x(y_k+0.5)] = \Delta y - \Delta x

初值： $d_0 = F(x_0+1, y_0+0.5) = Delta y - 0.5Delta x$ 。为了消去 $0.5$ ，两边同乘 2，得到全整数版本：

d_0 = 2\Delta y - \Delta x

d_{k+1} = \begin{cases} d_k + 2\Delta y & \text{若 } d_k < 0 \\ d_k + 2(\Delta y - \Delta x) & \text{若 } d_k \geq 0 \end{cases}

8.1.5 工程实现#

1
void bresenham_line(int x0, int y0, int x1, int y1,
2
                    std::function<void(int, int)> set_pixel) {
3
    // 保证 x 方向递增；对 |m|>1 的情况交换 x/y 扫描
4
    bool steep = std::abs(y1 - y0) > std::abs(x1 - x0);
5
    if (steep)            { std::swap(x0, y0); std::swap(x1, y1); }
6
    if (x0 > x1)          { std::swap(x0, x1); std::swap(y0, y1); }
7

8
    int dx    = x1 - x0;
9
    int dy    = std::abs(y1 - y0);
10
    int d     = 2 * dy - dx;          // 初值 d_0
11
    int ystep = (y0 < y1) ? 1 : -1;
12
    int y     = y0;
13

14
    for (int x = x0; x <= x1; ++x) {
15
        if (steep) set_pixel(y, x);    // 还原坐标轴交换
16
        else       set_pixel(x, y);
17

18
        if (d > 0) { y += ystep; d -= 2 * dx; }
19
        d += 2 * dy;
20
    }
21
}

TIP
Bresenham 的思想——用整数增量替代浮点计算——在后面的圆/椭圆画法、DDA 光栅化、各向异性过滤里都会反复出现。

8.2 三角形光栅化#

8.2.1 边方程（Edge Function）#

三角形 $\triangle ABC$ 的有向边 $\overrightarrow{AB}$ 对应一条直线，其边函数

E_{AB}(P) = (y_A - y_B)(x_P - x_A) + (x_B - x_A)(y_P - y_A)

几何意义： $E_{AB}(P)$ 等于 2 × 三角形 $\triangle ABP$ 的有向面积（逆时针为正）。

点 $P$ 在三角形内的判据（三角形逆时针）：

E_{AB}(P) \geq 0 \ \land\ E_{BC}(P) \geq 0 \ \land\ E_{CA}(P) \geq 0

8.2.2 包围盒遍历#

现代光栅化不再用扫描线，而是轴对齐包围盒 + 边方程测试：

1
void rasterize_triangle(const Vector3f v[3],
2
                        std::function<void(int, int, float, float, float)> shade) {
3
    // 计算整数包围盒（注意屏幕边界裁剪）
4
    int x_min = std::max(0,        (int)std::floor(std::min({v[0].x(), v[1].x(), v[2].x()})));
5
    int x_max = std::min(width -1, (int)std::ceil (std::max({v[0].x(), v[1].x(), v[2].x()})));
6
    int y_min = std::max(0,        (int)std::floor(std::min({v[0].y(), v[1].y(), v[2].y()})));
7
    int y_max = std::min(height-1, (int)std::ceil (std::max({v[0].y(), v[1].y(), v[2].y()})));
8

9
    for (int y = y_min; y <= y_max; ++y) {
10
        for (int x = x_min; x <= x_max; ++x) {
11
            // 以像素中心 (x+0.5, y+0.5) 做测试
12
            auto [a, b, g] = barycentric_2d(x + 0.5f, y + 0.5f, v);
13
            if (a >= 0 && b >= 0 && g >= 0) {
14
                shade(x, y, a, b, g);
15
            }
16
        }
17
    }
18
}

为什么用包围盒而不是扫描线？

扫描线需要对三角形顶点排序 + 边增量计算，分支多
包围盒 + 边方程对 SIMD/GPU 天然友好，可以 2×2 像素块并行
支持任意三角形朝向（顺时针/逆时针只需切换符号）

8.2.3 Top-Left 规则#

相邻三角形共享边时，如果两边都严格用 $geq$ ，会导致共享像素被画两次；用 $>$ 又会漏画。DirectX/OpenGL 约定Top-Left Fill Rule：

只有左边（从下到上的边）和顶边（水平、从左到右的边）上的像素算作”内部”
其他边上的像素算作”外部”

这样任何一个像素只会被恰好一个三角形覆盖，避免闪烁与双重着色。

8.3 重心坐标系（规范推导位置）#

NOTE
本节是全系列重心坐标的规范位置。Part 1 §1.1 只做了简要引用，详细推导、透视校正都在这里。

8.3.1 定义#

对三角形 $\triangle ABC$ 内任意一点 $P$ ，存在唯一的一组非负数 $(\alpha, \beta, \gamma)$ 满足：

P = \alpha A + \beta B + \gamma C, \quad \alpha + \beta + \gamma = 1

这就是 $P$ 的重心坐标。三个权重分别对应三个顶点的”影响力”。

8.3.2 面积比公式（完整推导）#

核心引理： $alpha, beta, gamma$ 等于 $P$ 关于对顶边所切分出的子三角形面积比。

证明：固定 $alpha + beta + gamma = 1$ ，将 $P = \alpha A + \beta B + \gamma C$ 代入 $overrightarrow{CP} = P - C$ ：

\overrightarrow{CP} = \alpha(A - C) + \beta(B - C) = \alpha \overrightarrow{CA} + \beta \overrightarrow{CB}

用 $\overrightarrow{CB}$ 叉乘两边：

\overrightarrow{CP} \times \overrightarrow{CB} = \alpha (\overrightarrow{CA} \times \overrightarrow{CB})

两边取模：

\alpha = \frac{\|\overrightarrow{CP} \times \overrightarrow{CB}\|}{\|\overrightarrow{CA} \times \overrightarrow{CB}\|} = \frac{2 \cdot \text{Area}(\triangle PBC)}{2 \cdot \text{Area}(\triangle ABC)} = \frac{\text{Area}(\triangle PBC)}{\text{Area}(\triangle ABC)}

同理：

\beta = \frac{\text{Area}(\triangle APC)}{\text{Area}(\triangle ABC)}, \quad \gamma = \frac{\text{Area}(\triangle ABP)}{\text{Area}(\triangle ABC)}

8.3.3 二维情形的标准公式#

二维下用 $z=0$ 的叉积求面积： $text{Area}(triangle ABC) = frac{1}{2}left|(x_B-x_A)(y_C-y_A) - (x_C-x_A)(y_B-y_A)right|$ 。记三角形总面积的两倍为 $D$ ，则

\alpha = \frac{(x_B - x_P)(y_C - y_P) - (x_C - x_P)(y_B - y_P)}{D}

\beta = \frac{(x_C - x_P)(y_A - y_P) - (x_A - x_P)(y_C - y_P)}{D}

\gamma = 1 - \alpha - \beta

8.3.4 工程实现#

1
// GAMES101 Assignment 2 风格，已整理
2
std::tuple<float, float, float>
3
barycentric_2d(float x, float y, const Eigen::Vector3f v[3]) {
4
    float x0 = v[0].x(), y0 = v[0].y();
5
    float x1 = v[1].x(), y1 = v[1].y();
6
    float x2 = v[2].x(), y2 = v[2].y();
7

8
    float denom = (y1 - y2) * (x0 - x2) + (x2 - x1) * (y0 - y2);
9
    float a = ((y1 - y2) * (x  - x2) + (x2 - x1) * (y  - y2)) / denom;
10
    float b = ((y2 - y0) * (x  - x2) + (x0 - x2) * (y  - y2)) / denom;
11
    float c = 1.0f - a - b;
12
    return {a, b, c};
13
}

8.3.5 属性插值的通用公式#

已知三角形三个顶点的属性 $f_A, f_B, f_C$ （深度、颜色、法向量、UV 等），三角形内部任一点的属性值：

f(P) = \alpha f_A + \beta f_B + \gamma f_C

但这只在屏幕空间线性的属性上成立——颜色这种无所谓，深度和 UV 需要透视校正（见 §8.4）。

8.4 透视校正插值#

8.4.1 为什么屏幕空间线性插值是错的#

透视投影后，世界空间里等距的三个点，在屏幕上不等距。直接在屏幕空间线性插值 UV，结果会在倾斜面上明显”挤”在一起（远处纹理被拉长）。

8.4.2 深度倒数线性#

关键数学事实：

\frac{1}{z} \text{ 在屏幕空间是线性的（即 } \alpha, \beta, \gamma \text{ 的线性组合）}

这是因为透视投影本质上是 $z' = az + b / z$ 形式，其中 $1/z$ 对应于投影空间中的线性量。因此：

\frac{1}{z_P} = \alpha \frac{1}{z_A} + \beta \frac{1}{z_B} + \gamma \frac{1}{z_C}

8.4.3 任意属性的透视校正#

对任意顶点属性 $f$ （UV、世界空间坐标、法向量）， $f/z$ 也在屏幕空间线性：

\frac{f(P)}{z_P} = \alpha \frac{f_A}{z_A} + \beta \frac{f_B}{z_B} + \gamma \frac{f_C}{z_C}

所以正确的插值是：

\boxed{f(P) = \frac{\alpha f_A / z_A + \beta f_B / z_B + \gamma f_C / z_C}{\alpha / z_A + \beta / z_B + \gamma / z_C}}

8.4.4 工程实现#

1
// alpha, beta, gamma: 屏幕空间重心坐标
2
// z_a/b/c: 三个顶点在相机空间的深度（正值）
3
// f_a/b/c: 三个顶点上待插值的属性
4
template <typename T>
5
T perspective_correct(float alpha, float beta, float gamma,
6
                      float z_a, float z_b, float z_c,
7
                      const T& f_a, const T& f_b, const T& f_c) {
8
    float inv_z = alpha / z_a + beta / z_b + gamma / z_c;
9
    T     num   = alpha * f_a / z_a + beta * f_b / z_b + gamma * f_c / z_c;
10
    return num / inv_z;
11
}

WARNING
深度值本身的插值比较特殊：在光栅化里，传进深度缓冲的 $z_{NDC}$ 可以直接用重心坐标线性插值（因为投影矩阵已经让 $z_{NDC}$ 在屏幕空间线性）。但 UV / 世界坐标 / 法向量必须走透视校正公式。

8.5 现代 GPU 的并行光栅化#

8.5.1 Tile-Based 光栅化#

移动 GPU（Mali, Adreno, PowerVR, Apple GPU）和部分桌面 GPU 把屏幕切成 16×16 或 32×32 的 tile，每个 tile 独立光栅化。好处：

Tile 内的 Framebuffer 能装进片上 SRAM，带宽消耗大幅降低
同一个 tile 的像素天然 SIMD
适合大规模并行

8.5.2 Early-Z 与 Hi-Z#

Early-Z：如果片段着色器不修改深度（没有 discard、没有 gl_FragDepth），硬件会在 FS 之前就做深度测试，被遮挡的片段直接跳过 FS，节省大量计算。

Hi-Z（Hierarchical Z）：对深度缓冲建 Mipmap，每个 tile 记录最大/最小深度。三角形进入前先查 Hi-Z，能批量剔除整块被遮挡的像素。

1
bool hiz_reject(int tile_x, int tile_y, int level,
2
                float tri_z_near) {
3
    float tile_z_max = hi_z[level][tile_y * tile_stride[level] + tile_x];
4
    return tri_z_near > tile_z_max;   // 整个 tile 都在三角形前面 → 剔除
5
}

8.5.3 2×2 像素 Quad#

片段着色器实际上以 2×2 像素为最小单位执行。这是因为硬件需要相邻像素的属性差来估算 $\partial u/\partial x, \partial u/\partial y$ 等导数，用于 Mipmap 选级和各向异性过滤。

WARNING
正因如此，分支内调用 texture() 是危险的——如果同 Quad 中有的像素走 if 分支、有的走 else 分支，导数就不对了。常见症状是树叶、栅栏的 Alpha Test 边缘出现 Mipmap 错误。

九、深度测试与隐藏面消除#

9.1 Z-Buffer 算法#

核心思想：为每个像素维护一个深度值 depth_buffer[x][y]，只有新片段的深度更近才写入。

1
void draw_triangle(const Triangle& t) {
2
    rasterize_triangle(t.v, [&](int x, int y, float a, float b, float g) {
3
        // 深度插值（NDC 空间可直接线性插值）
4
        float z = a * t.v[0].z() + b * t.v[1].z() + g * t.v[2].z();
5
        int idx = y * width + x;
6
        if (z < depth_buffer[idx]) {
7
            depth_buffer[idx] = z;
8
            color_buffer[idx] = shade(t, a, b, g);
9
        }
10
    });
11
}

优点

与顺序无关：三角形可以任意顺序提交
简单，硬件友好
支持复杂遮挡关系（循环遮挡都没问题）

缺点

需要额外内存（每像素 24/32 位）
对半透明物体失效：必须从远到近手动排序
有精度问题（见 §9.2）

9.2 深度精度与 Z-Fighting#

9.2.1 非线性的深度分布#

透视投影后，NDC 深度与相机空间深度的关系：

z_{NDC} = \frac{f + n}{f - n} - \frac{2fn}{(f-n) z_{view}}

求导得精度分布：

\frac{dz_{NDC}}{dz_{view}} = \frac{2fn}{(f-n) z_{view}^2}

这个精度与 $z_{view}^2$ 成反比——远处精度急剧下降。

9.2.2 Z-Fighting 的数学条件#

24 位深度缓冲区的最小可分辨单位：

\Delta z_{NDC}^{min} = \frac{1}{2^{24} - 1} \approx 5.96 \times 10^{-8}

在相机空间距离 $z$ 处，两个表面可区分的最小间距：

\Delta z_{view}^{min} = \frac{z^2(f - n)}{2fn} \cdot \Delta z_{NDC}^{min}

举例： $n = 0.1, f = 1000, z = 100$ ， $Delta z_{view}^{min} approx 0.030$ —— 3 cm 以内的两个面会冲突。

9.2.3 三个常用缓解方法#

方法一：收紧近远平面比值

f/n 越大、精度越差。工程经验： $f/n < 1000$ 比较安全， $f/n < 10000$ 可用， $f/n > 10000$ 极易出问题。

方法二：Polygon Offset

1
glEnable(GL_POLYGON_OFFSET_FILL);
2
glPolygonOffset(1.0f, 1.0f);   // 把当前绘制的三角形"推远"一点点

常用于阴影贴图——把遮挡物稍微推远避免自遮挡（shadow acne）。

方法三：反向 Z（Reverse-Z）

把近平面映射到 $z_{NDC} = 1$ ，远平面映射到 $z_{NDC} = 0$ ，配合浮点深度缓冲。利用 IEEE 754 浮点在接近 0 处精度更高的特性，精度分布从”远处差”变成”远处好”，大大缓解远场 Z-Fighting。

1
// 反向 Z 投影矩阵（OpenGL 约定需要 glClipControl 切换裁剪空间）
2
Eigen::Matrix4f reverse_z_projection(float fov, float aspect,
3
                                     float n, float f) {
4
    float t = std::tan(fov * 0.5f);
5
    Eigen::Matrix4f P = Eigen::Matrix4f::Zero();
6
    P(0, 0) =  1.0f / (aspect * t);
7
    P(1, 1) =  1.0f / t;
8
    P(2, 2) =  n / (f - n);                    // 近→1, 远→0
9
    P(2, 3) = (f * n) / (f - n);
10
    P(3, 2) = -1.0f;
11
    return P;
12
}
13

14
// 配合：
15
glClipControl(GL_LOWER_LEFT, GL_ZERO_TO_ONE);
16
glDepthFunc(GL_GREATER);                      // 比较方向反过来
17
glClearDepth(0.0f);                           // 清成 0（代表"最远"）

9.3 其他隐藏面消除#

9.3.1 画家算法#

按深度从远到近绘制。致命弱点：

循环遮挡处理不了（三角形 A 挡 B、B 挡 C、C 挡 A）
穿插的长条三角形无法用单个深度值代表

今天的用法：只用在透明物体的 Sort-Then-Draw 流程里，因为 Z-Buffer 无法正确混合半透明。

9.3.2 BSP 树#

用一系列分割平面把场景递归切成前后两部分，建一棵二叉空间分割树。遍历时按相机和分割平面的位置关系决定先画哪边——能对静态几何得到绝对正确的深度顺序，不需要 Z-Buffer。

经典用途：Doom / Quake 时代的室内渲染。现代 GPU 有 Z-Buffer 后基本被淘汰，但在CSG 布尔运算、碰撞检测中仍有身影。

十、光照模型与着色#

10.1 渲染方程引子#

NOTE
本节只给光照模型的物理引子。完整的辐射度量学（Radiance/Irradiance/Radiant Flux 的严格定义）、BRDF 的三条性质、渲染方程的积分形式与路径追踪求解，全部见 Part 4：光线追踪与全局光照 §20.1。

10.1.1 渲染方程的形式#

Kajiya 1986 提出的渲染方程描述了任何表面点的出射辐射度：

L_o(\mathbf{p}, \omega_o) = L_e(\mathbf{p}, \omega_o) + \int_{\Omega^+} f_r(\mathbf{p}, \omega_i, \omega_o) L_i(\mathbf{p}, \omega_i) \cos\theta_i \, d\omega_i

$L_o$ ：从 $\mathbf{p}$ 点沿 $\omega_o$ 方向的出射辐射度
$L_e$ ：自发光
$f_r$ ：BRDF，描述入射→出射的反射率
$L_i$ ：入射辐射度
$costheta_i = vec{n} cdot omega_i$ ：入射方向与法向量夹角的余弦

10.1.2 光栅化管线的经验近似#

光栅化管线没能力求解这个积分——每个片段只能访问自己的局部信息。于是Phong 模型把积分替换为对少量光源的求和：

L_o \approx L_{ambient} + \sum_{k=1}^{N_{lights}} \left[ L_{diffuse}^{(k)} + L_{specular}^{(k)} \right]

这是一种经验模型，精度低但速度极快。物理正确的 PBR 模型（Cook-Torrance、Disney BRDF）见 Part 6。

10.2 Phong 反射模型#

10.2.1 三分量结构#

I_{total} = \underbrace{k_a I_a}_{\text{环境}} + \underbrace{k_d I_l (\mathbf{n} \cdot \mathbf{l})}_{\text{漫反射}} + \underbrace{k_s I_l (\mathbf{r} \cdot \mathbf{v})^n}_{\text{镜面}}

10.2.2 漫反射：Lambert 定律#

物理假设：理想粗糙表面各方向反射均匀。能量守恒给出 BRDF：

f_r^{Lambert} = \frac{\rho_d}{\pi}, \quad \rho_d \in [0, 1] \text{ 是反照率（albedo）}

推导：出射辐射度 $L_r$ 在半球上积分应等于入射辐照度 $E$ 乘以 $rho_d$ ：

\rho_d E = \int_{\Omega} L_r \cos\theta_r d\omega_r = L_r \int_{\Omega} \cos\theta_r d\omega_r = L_r \cdot \pi

其中半球积分 $int_{Omega} costheta, domega = pi$ 。由 BRDF 定义 $f_r = L_r / E$ ，得 $f_r = rho_d / pi$ 。

10.2.3 镜面反射与反射向量#

给定入射单位向量 $\mathbf{l}$ 和法向量 $mathbf{n}$ ，反射向量 $\mathbf{r}$ 应该：

与 $\mathbf{n}$ 夹角等于 $\mathbf{l}$ 与 $\mathbf{n}$ 的夹角
与 $mathbf{l}$ 、 $mathbf{n}$ 共面

推导：把 $\mathbf{l}$ 分解为平行 $\mathbf{n}$ 和垂直 $\mathbf{n}$ 两个分量：

\mathbf{l} = \underbrace{(\mathbf{n} \cdot \mathbf{l})\mathbf{n}}_{\mathbf{l}_\parallel} + \underbrace{\mathbf{l} - (\mathbf{n} \cdot \mathbf{l})\mathbf{n}}_{\mathbf{l}_\perp}

反射只翻转切向分量 $mathbf{l}_perp$ ：

\mathbf{r} = \mathbf{l}_\parallel - \mathbf{l}_\perp = 2(\mathbf{n} \cdot \mathbf{l})\mathbf{n} - \mathbf{l}

WARNING
GLSL 的 reflect(I, N) 约定 $\mathbf{I}$ 是从光源射入的方向（即 $-mathbf{l}$ ），返回 $mathbf{I} - 2(mathbf{N} cdot mathbf{I})mathbf{N}$ 。符号容易搞错，自己实现时务必验证。

10.2.4 工程实现#

1
Eigen::Vector3f phong_shade(const Eigen::Vector3f& p,       // 世界空间点
2
                            const Eigen::Vector3f& n,       // 单位法向量
3
                            const Eigen::Vector3f& eye_pos,
4
                            const Light&    light,
5
                            const Material& mat) {
6
    Eigen::Vector3f l = (light.position - p).normalized();
7
    Eigen::Vector3f v = (eye_pos        - p).normalized();
8
    Eigen::Vector3f r = 2.0f * n.dot(l) * n - l;
9

10
    // 距离衰减（平方反比定律）
11
    float r2 = (light.position - p).squaredNorm();
12
    Eigen::Vector3f I_eff = light.intensity / r2;
13

14
    Eigen::Vector3f ambient  = mat.ka.cwiseProduct(light.ambient);
15
    Eigen::Vector3f diffuse  = mat.kd.cwiseProduct(I_eff)
16
                             * std::max(0.0f, n.dot(l));
17
    Eigen::Vector3f specular = mat.ks.cwiseProduct(I_eff)
18
                             * std::pow(std::max(0.0f, r.dot(v)), mat.shininess);
19

20
    return ambient + diffuse + specular;
21
}

10.3 Blinn-Phong：半角向量#

10.3.1 动机#

Phong 的 $\mathbf{r} \cdot \mathbf{v}$ 在掠射角（光源几乎平行于表面）附近数值不稳定，同时每个像素都要算一次 $mathbf{r}$ 。Blinn 1977 观察到一个等效替代：

\mathbf{h} = \frac{\mathbf{l} + \mathbf{v}}{\|\mathbf{l} + \mathbf{v}\|}

$\mathbf{h}$ 是入射与视线方向的半角向量。用 $(\mathbf{n} \cdot \mathbf{h})^{n'}$ 替换 $(mathbf{r} cdot mathbf{v})^n$ 。

10.3.2 几何等价性#

微表面理论视角：只有法向量恰好等于 $\mathbf{h}$ 的微面才把光线从 $\mathbf{l}$ 反射到 $mathbf{v}$ 。所以 $\mathbf{n} \cdot \mathbf{h}$ 测量的是”当前宏观法向量”与”完美反射所需微表面法向量”的夹角，物理意义比 $\mathbf{r} \cdot \mathbf{v}$ 更直接。

10.3.3 指数修正#

经验公式 $n_{Blinn} approx 4 n_{Phong}$ ，得到视觉上近似大小的高光。

10.3.4 为什么大家都用 Blinn-Phong#

便宜：省掉 reflect() 的计算
稳定：掠射角下不会突变
可定向光源复用：平行光下 $\mathbf{l}$ 和 $\mathbf{v}$ 都是常数， $mathbf{h}$ 整帧可以预计算
贴近 PBR：微表面 GGX/Beckmann 模型里， $mathbf{n} cdot mathbf{h}$ 是天然的自变量

10.4 着色频率（Shading Frequency）#

同一个光照模型，在”哪里求值”会大幅影响质量：

着色频率	求值位置	质量	成本	典型用途
Flat	三角形一次	★	★	低多边形风格化
Gouraud	顶点	★★	★★	老游戏、性能优先
Phong	片段	★★★	★★★	现代默认

Flat Shading：用面法向量，整个三角形一种颜色。 $mathbf{n}_{face} = frac{(vec{v}_1-vec{v}_0) times (vec{v}_2-vec{v}_0)}{|cdots|}$

Gouraud Shading：顶点法向量（相邻面法向量加权平均），顶点着色后用重心坐标插值颜色。问题：镜面高光如果不落在顶点上就完全丢失。

Phong Shading：顶点存法向量，光栅化时插值法向量，在片段着色器里逐像素计算光照。现代管线默认方式。注意：Phong Shading 和 Phong Lighting Model 是两回事，前者是”在哪算”，后者是”怎么算”。

十一、纹理映射#

11.1 UV 坐标与采样基础#

11.1.1 UV 坐标系#

纹理是一张 $W \times H$ 的图像。UV 坐标 $(u, v) \in [0, 1]^2$ 是归一化的纹理坐标，与具体分辨率解耦。

连续纹理坐标到像素索引的映射（采样点在像素中心）：

x = u \cdot W - 0.5, \quad y = v \cdot H - 0.5

11.1.2 最近邻采样#

T(u, v) = \text{texel}[\text{round}(x), \text{round}(y)]

优点：保真、可见像素细节；缺点：放大时出现明显锯齿 / 阶梯感。

11.1.3 双线性过滤（完整推导）#

在 $(x, y)$ 周围取四个整数邻居 $(x_0, y_0), (x_1, y_0), (x_0, y_1), (x_1, y_1)$ ，其中 $x_0 = lfloor x rfloor, x_1 = x_0 + 1$ 。权重 $f_x = x - x_0, f_y = y - y_0$ 。

先沿 x 插值：

C_0 = (1 - f_x) T_{00} + f_x T_{10}

C_1 = (1 - f_x) T_{01} + f_x T_{11}

再沿 y 插值：

T_{bi}(u, v) = (1 - f_y) C_0 + f_y C_1

展开式（四个 texel 的双线性组合）：

T_{bi} = (1-f_x)(1-f_y) T_{00} + f_x(1-f_y) T_{10} + (1-f_x)f_y T_{01} + f_x f_y T_{11}

1
Eigen::Vector3f sample_bilinear(const Texture& tex, float u, float v) {
2
    float x = u * tex.width  - 0.5f;
3
    float y = v * tex.height - 0.5f;
4
    int   x0 = (int)std::floor(x), y0 = (int)std::floor(y);
5
    int   x1 = x0 + 1,             y1 = y0 + 1;
6
    float fx = x - x0,             fy = y - y0;
7

8
    auto T00 = tex.fetch_wrap(x0, y0);
9
    auto T10 = tex.fetch_wrap(x1, y0);
10
    auto T01 = tex.fetch_wrap(x0, y1);
11
    auto T11 = tex.fetch_wrap(x1, y1);
12

13
    auto C0 = (1 - fx) * T00 + fx * T10;
14
    auto C1 = (1 - fx) * T01 + fx * T11;
15
    return (1 - fy) * C0 + fy * C1;
16
}

11.2 Mipmap 与三线性过滤#

11.2.1 走样问题的来源#

一个屏幕像素覆盖纹理上一大块区域时（远处地面），若只采一个点，就发生欠采样——纹理高频部分出现 Moiré 条纹、闪烁、锯齿。这是奈奎斯特采样定理的直接后果。

11.2.2 Mipmap：预滤波金字塔#

预先构建一系列降采样的纹理：

Level 0：原图 $W \times H$
Level 1： $W/2 times H/2$ ，每个像素取 Level 0 的 2×2 平均
…直到 $1 \times 1$

总存储开销： $W cdot H cdot (1 + 1/4 + 1/16 + ldots) = frac{4}{3} W H$ 。

1
void build_mipmaps(Texture& tex) {
2
    int w = tex.width, h = tex.height;
3
    while (w > 1 || h > 1) {
4
        int nw = std::max(1, w / 2);
5
        int nh = std::max(1, h / 2);
6
        Texture next(nw, nh);
7
        for (int y = 0; y < nh; ++y) {
8
            for (int x = 0; x < nw; ++x) {
9
                auto sum = (tex.fetch(2*x,   2*y  ) + tex.fetch(2*x+1, 2*y)
10
                          + tex.fetch(2*x,   2*y+1) + tex.fetch(2*x+1, 2*y+1));
11
                next.set(x, y, sum * 0.25f);
12
            }
13
        }
14
        tex.mips.push_back(std::move(next));
15
        w = nw; h = nh;
16
    }
17
}

11.2.3 选级 LOD 计算#

GPU 利用 2×2 Quad 的相邻像素差分估算 UV 在屏幕上变化多快：

L = \max\left(\sqrt{(\partial u / \partial x)^2 + (\partial v / \partial x)^2}, \sqrt{(\partial u / \partial y)^2 + (\partial v / \partial y)^2}\right) \cdot W

\text{LOD} = \log_2 L

11.2.4 三线性过滤#

LOD 是连续值，分别在 $\lfloor \text{LOD} \rfloor$ 和 $\lceil \text{LOD} \rceil$ 层做双线性，再在两层结果间线性插值——总共 $2 \times 4 + 1 = 9$ 次样本计算。

11.3 纹理寻址模式#

当 $(u, v)$ 超出 $[0, 1]^2$ 时怎么办？

Repeat： $u' = u - lfloor u rfloor$ ，地板/墙壁等重复纹理

Mirror：镜像重复， $u$ 每加 1 就翻一次方向

Clamp to Edge： $u' = text{clamp}(u, 0, 1)$ ，天空盒接缝必备

Clamp to Border：超出范围用预设边界色

11.4 法线贴图（Normal Mapping）#

11.4.1 思想#

在低多边形模型上用纹理欺骗法向量，造出高频凹凸细节的错觉。一张 RGB 纹理里每个像素存一个切线空间下的法向量 $tilde{mathbf{n}} in [-1, 1]^3$ 。

从 $[0,1]^3$ 的 RGB 映射到法向量： $tilde{mathbf{n}} = 2cdottext{rgb} - 1$

11.4.2 切线空间（TBN）#

每个顶点存 $mathbf{T}$ （tangent）、 $mathbf{B}$ （bitangent）、 $mathbf{N}$ （normal）三个正交单位向量。TBN 矩阵把切线空间向量变到世界空间：

\mathbf{n}_{world} = \text{TBN} \cdot \tilde{\mathbf{n}}, \quad \text{TBN} = \begin{pmatrix} \mathbf{T} & \mathbf{B} & \mathbf{N} \end{pmatrix}

11.4.3 从 UV 构造 T 与 B#

给三角形三个顶点 $\vec{v}_0, \vec{v}_1, \vec{v}_2$ 及其 UV，两条边：

\Delta \vec{v}_1 = \vec{v}_1 - \vec{v}_0, \quad \Delta \mathbf{uv}_1 = \mathbf{uv}_1 - \mathbf{uv}_0

\Delta \vec{v}_2 = \vec{v}_2 - \vec{v}_0, \quad \Delta \mathbf{uv}_2 = \mathbf{uv}_2 - \mathbf{uv}_0

求解 $2 \times 2$ 线性方程组：

\begin{pmatrix} \Delta u_1 & \Delta v_1 \\ \Delta u_2 & \Delta v_2 \end{pmatrix} \begin{pmatrix} \mathbf{T} \\ \mathbf{B} \end{pmatrix} = \begin{pmatrix} \Delta \vec{v}_1 \\ \Delta \vec{v}_2 \end{pmatrix}

逆矩阵解法：

\begin{pmatrix} \mathbf{T} \\ \mathbf{B} \end{pmatrix} = \frac{1}{\Delta u_1 \Delta v_2 - \Delta u_2 \Delta v_1} \begin{pmatrix} \Delta v_2 & -\Delta v_1 \\ -\Delta u_2 & \Delta u_1 \end{pmatrix} \begin{pmatrix} \Delta \vec{v}_1 \\ \Delta \vec{v}_2 \end{pmatrix}

1
// 对每个三角形计算，再按顶点累加再归一化得到顶点 T/B
2
void compute_tbn(const Vertex& v0, const Vertex& v1, const Vertex& v2,
3
                 Eigen::Vector3f& T, Eigen::Vector3f& B) {
4
    auto dv1 = v1.pos - v0.pos, dv2 = v2.pos - v0.pos;
5
    auto du1 = v1.uv  - v0.uv,  du2 = v2.uv  - v0.uv;
6

7
    float det = du1.x() * du2.y() - du2.x() * du1.y();
8
    float inv = (std::abs(det) < 1e-8f) ? 1.0f : 1.0f / det;
9

10
    T = inv * ( du2.y() * dv1 - du1.y() * dv2);
11
    B = inv * (-du2.x() * dv1 + du1.x() * dv2);
12
}

Fragment Shader 里：

1
vec3 tangent_normal = texture(uNormalMap, vTexCoord).rgb * 2.0 - 1.0;
2
mat3 TBN = mat3(normalize(vTangent),
3
                normalize(vBitangent),
4
                normalize(vNormal));
5
vec3 N = normalize(TBN * tangent_normal);
6
// 后续用 N 做光照计算

11.5 环境映射（Environment Mapping）#

让物体”反射”周围场景的技术。核心：把周围环境烘焙成一张纹理，按反射方向采样。

11.5.1 Cubemap#

六张图片：分别对应 $\pm x, \pm y, \pm z$ 六个方向。采样时根据反射方向 $\mathbf{r}$ 分量的最大绝对值选择哪张面：

1
int face; Eigen::Vector2f uv;
2
Eigen::Vector3f a = r.cwiseAbs();
3
if (a.x() >= a.y() && a.x() >= a.z()) {
4
    face = (r.x() > 0) ? 0 : 1;
5
    uv = Eigen::Vector2f(-r.z(), -r.y()) / a.x();
6
    if (face == 1) uv.x() = -uv.x();
7
} else if (a.y() >= a.z()) {
8
    face = (r.y() > 0) ? 2 : 3;
9
    uv = Eigen::Vector2f(r.x(), (r.y() > 0) ? r.z() : -r.z()) / a.y();
10
} else {
11
    face = (r.z() > 0) ? 4 : 5;
12
    uv = Eigen::Vector2f((r.z() > 0) ? r.x() : -r.x(), -r.y()) / a.z();
13
}
14
uv = (uv + Eigen::Vector2f(1, 1)) * 0.5f;

11.5.2 Spherical Mapping#

用单张经纬度投影的 HDR 图像。采样公式：

u = 0.5 + \frac{\arctan2(r_z, r_x)}{2\pi}, \quad v = 0.5 - \frac{\arcsin(r_y)}{\pi}

优点：单图、适合 HDR 光照；缺点：两极有失真和缝合线问题。

11.5.3 典型应用#

Skybox：用视线方向采样，得到天空背景
Reflection：用反射向量 $\mathbf{r} = 2(\mathbf{n}\cdot\mathbf{v})\mathbf{n} - \mathbf{v}$ 采样，伪造镜面反射
IBL（Image-Based Lighting）：预过滤 cubemap 做漫反射/镜面反射环境光照——PBR 的基础，详见 Part 6