Sitemap

A list of all the posts and pages found on the site. For you robots out there is an XML version available for digesting as well.

Pages

Posts

图解 Wan2.1 I2V:从一张图到一段视频,模型到底发生了什么

9 minute read

Published:

最近视频生成模型卷得很快,Wan2.1 是阿里 Wan 团队开源的那一套。它最常用的场景之一就是 I2V(Image-to-Video):给一张参考图加一句文字 prompt,模型给你生成一段几秒的视频,首帧基本还是那张图,后续的镜头就按你写的文字去演。

大模型面试手撕题全攻略:Attention、Transformer、归一化与损失函数

13 minute read

Published:

大模型算法岗面试中,手撕代码是几乎绕不过去的一环。面试官会盯着你从零实现 Attention、MHA、GQA、LayerNorm、RMSNorm、SafeSoftmax、Cross-Entropy 等模块,既考察你对原理的理解,也考察你是否能在紧张的环境下把数值稳定性、维度对齐、broadcasting 这些细节处理干净。

这篇文章把这些高频手撕题系统梳理一遍:每一节都给出核心原理 → 数学公式 → 从零手写的 PyTorch 实现 → 面试容易追问的点,读完之后这一类题你应该都能在白板上 10 分钟内写出来。

让大模型快 8 倍:从投机解码到 DDTree 的完整原理

7 minute read

Published:

本文从零开始,带你理解 LLM 推理加速的核心思路,读完之后你会明白:大模型为什么慢、投机解码如何加速、为什么加速后输出质量完全不变,以及 DDTree 这篇 2026 年的新论文究竟做了什么创新。

portfolio

publications

research-area

talks

teaching