背景
- 北京邮电大学 / 上海交通大学 联合培养(985 / 211 / 双一流 / QS前100)
- 方向:学科专业化大模型、人工智能安全、对齐(Alignment)、RLHF、大模型训练、数据增广
技术技能
- 熟练框架:PyTorch、Langchain、LlamaFactory、Slurm、阿里PAI平台
- 熟悉技术:RLHF、PPO/DPO、CPT/SFT、大模型训练部署、对齐、内容安全
- 硬件经验:128卡A100、千卡级H800
- 竞赛:ATEC大模型比赛全国第五
科研经历
蚂蚁集团实习(内容安全 & AI金融) 2025.04 - 至今
- 方向一:多模态内容理解,舆论管控与伦理治理
- 方向二:大模型在金融风控与辅助决策中的应用与优化
上海人工智能实验室 / OpenLMLab 实习 2024.09 - 2025.05
- InternLM3预训练、模态数据增强、OCR多模态任务优化
- 一作论文投ACM MM(OCR置信度优化);准备AAAI论文(数据合成)
文本生成与隐写水印研究(LLM方向) ACL在投
- 设计解码策略实现语义聚类隐写术,提出鲁棒文本水印方案
- 方法具备多模态扩展性
- 正在构思第二篇语义水印方向文章(目标EMNLP)
香港科技大学科研合作 2024.05 - 2024.12
- 一篇ICLR已接收:SPO算法(非一作)
- 一篇联合一作文章投ICML:对抗强化学习框架(泛化强、拟合稳)
工程与实习经历
清华大学 & 网信办项目(大模型内容合规) 2023.08 - 2024.07
- 与清华电子工程系合作,参与模型安全审计、训练继承检测
- 成果转化为企业“隐拓智安”及国基项目,产品接近蚂蚁“蚁天鉴”
CERT中央项目(多模态内容安全) 2024.04 - 2024.09
- 项目负责人,总体技术方案设计与人员组织
- 审核外网多模态数据(图文视频),支持转发与展示功能
上海孚典智能公司 2023.03 - 2023.09
- 使用 Ray 构建分布式 AIGC 系统,接入 Stable Diffusion
- 构建基于Langchain+向量检索的企业对话AI(服务上海机场、建筑集团)
竞赛获奖
- ATEC 2023 大模型新闻检测赛道:全国第五(队长,蚂蚁 & 中国电子学会)
- 全国大学生算法编程挑战赛:银奖(队长)