
吕凯风 Kaifeng Lyu
我目前在清华大学交叉信息院担任教研系列助理教授。此前,我曾在加州大学伯克利分校的Simons计算理论研究所担任博士后研究员。我于 2024 年获得普林斯顿大学计算机科学博士学位,师从 Prof. Sanjeev Arora。 本科期间,我就读于清华大学姚班,于2019年毕业并取得计算机科学与技术工学学士学位。本科时的学术研究曾由 李建教授 指导。
研究兴趣
我的主要研究方向为 machine learning theory, AI safety/alignment, optimization.
招生: 我们组正在招收 2027 年秋季入学的博士生。想清楚自己未来的人生目标是不容易的,但如果恰巧跟我下面的愿景有相同之处,欢迎你与我邮件联系!因为工作繁忙,邮件可能无法一一回复,还请谅解。如果怀疑是我漏看了邮件或者忘记回复了,欢迎无限次重发邮件,我会尽快回复。
一个好的理论应 “从实践中来,到实践中去”:我们应从现实世界中重要的实际现象或者问题出发,在理论上解释现象或者解决问题,最后返回到实际中去指导实践。我致力于做理论与实验相结合的研究,希望能与我的学生和合作者们一起,为现代机器学习方法夯实基础,让大模型时代的 AI 更加科学、高效、可靠。
关于深度学习的理论,我研究了很多年,也有不少自己很喜欢的工作。不过在最近几年里,我越发意识到,如果实验上本来很多细节就没有处 理好,或者模型换个环境就不泛化、不安全了,那么无论怎么建设理论,都可能是空中楼阁。这是因为,理论只能证明对的东西。
那么实验上到底哪些事情是对的呢?在大模型时代,实验成本日渐高昂。很多实验细节可能都没有来得及总结出规律,就被新的风口推着往前走了。我双手支持 AGI 的快速发展,但同时我也认为,最终被实现的那个 AGI,应当是通过一套严谨的科学方法训练出来的。又或者,初代的 AGI 应该协助我们,去建设真正科学、高效、可靠的下一代 AGI。
因而,我最近的研究其实将 “科学” 这一关键词的优先级提升到了 “理论” 之前:先带着理论视角去审视大模型训练的各个环节,总结出科学规律,然后我们才会有机会将零散的科学规律逐步拼起来,进而去谈更深刻的理论分析。
下面是一些我目前正在思考或者研究的方向:
-
Science of Large-Scale Training: 大模型训练是极为复杂的,但有哪些普适的规律是我们可以预测的?我们如何让现有的训练过程更加可预测?大语言模型不会是人类所训练的最后一个大模型,有哪些普适规律也许可以迁移到下一次大模型训练中去?我们的往期工作包括:
-
Principles in Data-Centric ML: 大模型能力的进步,一方面来自于训练规模的不断扩大,另一个重要方面则是数据质量的提升。蒸馏是容易的,不断堆叠工程技巧也是能稳定拿到收益的。但除此之外,我们是否能总结出一些能广泛适用的基本原理,来帮助我们更好地选择、混合和生成数据?
-
Foundations of AI Safety/Alignment: 我也对 AI 安全与对齐的问题感兴趣。机器学习通常是在优化一个模型在 “平均情况” 下的性 能,然而 AI 的安全问题会在极端情况下暴露出来。在极端情况下模型犯错的根本原因是什么?目前各类 AI 对齐方法的局限性在哪里,存在哪些无法完全规避的安全隐患?长远来看,是否能够像密码学那样,找到一种系统性的方法,一劳永逸地解决一大类 AI 安全问题?我们的往期工作包括:
以上提到的往期工作,有一大部分是先从理论视角对神经网络的训练过程进行思考,再以一种理论与实验相结合的方式来得到最终的结论。深度学习背后还有很多我非常想解的纯理论问题,没有在上面一一列出,但我其实非常感兴趣。
会议论文
PhD Students:
- Haodong Wen (2025–present)
- Kexian Tang (2025–present)
- Huaijie Wang (2023–present, joined our group in 2026)
- Jinhan Li (incoming)
- Tingkai Yan (incoming)
PhD Students in Close Research Collaboration:
- Kairong Luo (2024–present, advised by Prof. Wenguang Chen)
- Haofeng Huang (incoming, advised by Prof. Andrew Yao)
Master's Student:
- Rui Chen (2025–present, co-advised by Prof. Shuran Zheng)
Alumni / Graduating Soon:
- Xinghan Li (Undergraduate Class of 2026, joining the University of Washington as a PhD student)
- Yiran Zhang (Undergraduate Class of 2026, joining UC Berkeley as a PhD student)
- Xingyu Dang (Undergraduate Class of 2025, now PhD student at Princeton)
- Kaiyue Wen (Undergraduate Class of 2024, now PhD student at Stanford)
讲授课程
- 清华大学 2026 年春季学期:《计算机与人工智能应用数学》
- 清华大学 2025 年秋季学期:《从头训练大语言模型:理论与实践》(教评全校前 5%)
助教经历
- 普林斯顿大学 2024 年春季学期. Teaching Assistant for COS324: Introduction to Machine Learning (by Prof. Sanjeev Arora & Prof. Elad Hazan).
- 普林斯顿大学 2022 年秋季学期. Teaching Assistant for COS521: Advanced Algorithm Design (by Prof. Matt Weinberg & Prof. Huacheng Yu).
- 普林斯顿大学 2021 年春季学期. Teaching Assistant for COS598B: Advanced Topics in Computer Science: Mathematical Understanding of Deep Learning (by Prof. Sanjeev Arora).
- 清华大学 2020 年春季学期. 《计算机应用数学》 助教(授课教师:姚期智教授).
- 清华大学 2019 年春季学期. 《分布式计算:基础与系统》 助教(授课教师:陈卫教授).
Professional Services
- Organizer, NeurIPS 2024 Workshop on Mathematics of Modern Machine Learning (M3L 2024).
- Organizer, NeurIPS 2023 Workshop on Mathematics of Modern Machine Learning (M3L 2023).
- Conference Area Chair: NeurIPS (2025), ICLR (2026).
- Conference Reviewer: ICML (2020-2025), NeurIPS (2020-2023), ICLR (2022-2025), TPAMI, COLT (2020,2025), AAAI (2020), KDD (2022).
- Journal Reviewer: TMLR, JMLR, TPAMI, AIJ.
- Organizer, Yao Class Seminar, Tsinghua University (Fall 2019, Fall 2020, Spring 2021).