大模型算法岗面试中，手撕代码是几乎绕不过去的一环。面试官会盯着你从零实现 Attention、MHA、GQA、LayerNorm、RMSNorm、SafeSoftmax、Cross-Entropy 等模块，既考察你对原理的理解，也考察你是否能在紧张的环境下把数值稳定性、维度对齐、broadcasting 这些细节处理干净。
这篇文章把这些高频手撕题系统梳理一遍：每一节都给出核心原理 → 数学公式 → 从零手写的 PyTorch 实现 → 面试容易追问的点，读完之后这一类题你应该都能在白板上 10 分钟内写出来。

让大模型快 8 倍：从投机解码到 DDTree 的完整原理

7 minute read

Published: April 20, 2026

本文从零开始，带你理解 LLM 推理加速的核心思路，读完之后你会明白：大模型为什么慢、投机解码如何加速、为什么加速后输出质量完全不变，以及 DDTree 这篇 2026 年的新论文究竟做了什么创新。

从 DDPO 到 Flow-GRPO：一文看懂 Diffusion 模型的强化学习过程与发展脉络

7 minute read

Published: April 20, 2026

Diffusion 模型最初是按“去噪 MSE / 似然近似”来训练的，但真正上线时，我们更关心的往往不是似然，而是：

从 Classifier Guidance 到 Classifier-Free Guidance：一文讲清 Diffusion 里的 CFG

8 minute read

Published: April 20, 2026

Diffusion 模型发展到今天，CFG 几乎已经成了文本生成图像系统里的“默认组件”。
但很多人第一次看到它时都会困惑：

Python 利用selenium 控制浏览器自动提交表单

less than 1 minute read

Published: February 07, 2023

Python 启动http服务中文乱码问题

less than 1 minute read

Published: November 25, 2021

二叉树的三种遍历（递归与非递归）

less than 1 minute read

Published: September 29, 2020

How to Build a Personal Website

1 minute read

Published: May 15, 2020

This page provides some resource and my own experience for building a personal website.

李勇志 (Yongzhi Li)

Sitemap

Pages

Page Not Found

About Me

Posts by Year

Posts by Category

Posts by Collection

Page Archive

Projects

Publication

Research Areas

Sitemap

Posts by Tags

Teaching

Terms and Privacy Policy

Blog posts

Jupyter notebook markdown generator

Posts

图解 Wan2.1 I2V：从一张图到一段视频，模型到底发生了什么

大模型面试手撕题全攻略：Attention、Transformer、归一化与损失函数

让大模型快 8 倍：从投机解码到 DDTree 的完整原理

从 DDPO 到 Flow-GRPO：一文看懂 Diffusion 模型的强化学习过程与发展脉络

从 Classifier Guidance 到 Classifier-Free Guidance：一文讲清 Diffusion 里的 CFG

Python 利用selenium 控制浏览器自动提交表单

Python 启动http服务中文乱码问题

二叉树的三种遍历（递归与非递归）

How to Build a Personal Website

portfolio

publications

research-area

talks

teaching