我的长期研究兴趣是:智能如何增长、扩展,并在真实世界的复杂环境下得以精准校准?
具体来说,目前我在研究如何用 Agent 合成数据,提高 LLM 在 Science 领域的表现,并进一步建立 Science 需要的 Benchmark。
随着人类已有数据飞速地被压缩入模型智能,合成数据一定是 LLM 自我学习、无限增长的重要手段;同时,我们需要不断提出高质量的 Benchmark 来校准模型智能;当然,Benchmark 本身也是强化学习的终极 Reward,我们提出一个个具有挑战性的 Benchmark,再通过强化学习等手段设计更精细的 Reward 来训练 LLM 的自我学习。
准博士生 (Incoming PhD Student) · 人工智能 · 2026 秋季入学
导师: 张林峰教授。
金融硕士 (金融科技方向) · 2024.09–2026.06
入学奖学金: 55,000 RMB。
“互联网+”复合培养实验班 · 2020.09–2024.06
金融学 + 数据科学与大数据技术双学位。GPA: 91.08/100。国家奖学金。
学术合作项目 · 2025.11–至今
基于 Agent 的数据合成与基准构建。
科学计算实习生 · 2024.06–2024.08
后端开发。
科研助理 · 2024.03–至今
导师: 张林峰教授。