Page Not Found
Page not found. Your pixels are in another canvas.
A list of all the posts and pages found on the site. For you robots out there is an XML version available for digesting as well.
Page not found. Your pixels are in another canvas.
About me
Published:
最近视频生成模型卷得很快,Wan2.1 是阿里 Wan 团队开源的那一套。它最常用的场景之一就是 I2V(Image-to-Video):给一张参考图加一句文字 prompt,模型给你生成一段几秒的视频,首帧基本还是那张图,后续的镜头就按你写的文字去演。
Published:
大模型算法岗面试中,手撕代码是几乎绕不过去的一环。面试官会盯着你从零实现 Attention、MHA、GQA、LayerNorm、RMSNorm、SafeSoftmax、Cross-Entropy 等模块,既考察你对原理的理解,也考察你是否能在紧张的环境下把数值稳定性、维度对齐、broadcasting 这些细节处理干净。
这篇文章把这些高频手撕题系统梳理一遍:每一节都给出核心原理 → 数学公式 → 从零手写的 PyTorch 实现 → 面试容易追问的点,读完之后这一类题你应该都能在白板上 10 分钟内写出来。
Published:
本文从零开始,带你理解 LLM 推理加速的核心思路,读完之后你会明白:大模型为什么慢、投机解码如何加速、为什么加速后输出质量完全不变,以及 DDTree 这篇 2026 年的新论文究竟做了什么创新。
Published:
Diffusion 模型最初是按“去噪 MSE / 似然近似”来训练的,但真正上线时,我们更关心的往往不是似然,而是:
Published:
Diffusion 模型发展到今天,CFG 几乎已经成了文本生成图像系统里的“默认组件”。
但很多人第一次看到它时都会困惑:
Published:
Published:
Published:
Published:
This page provides some resource and my own experience for building a personal website.