个人简介

背景

北京邮电大学 / 上海交通大学联合培养（985 / 211 / 双一流 / QS前100）
- 方向：学科专业化大模型、人工智能安全、对齐（Alignment）、RLHF、大模型训练、数据增广

技术技能

熟练框架：PyTorch、Langchain、LlamaFactory、Slurm、阿里PAI平台
熟悉技术：RLHF、PPO/DPO、CPT/SFT、大模型训练部署、对齐、内容安全
硬件经验：128卡A100、千卡级H800
竞赛：ATEC大模型比赛全国第五

科研经历

蚂蚁集团实习（内容安全 & AI金融） `2025.04 - 至今`

方向一：多模态内容理解，舆论管控与伦理治理
方向二：大模型在金融风控与辅助决策中的应用与优化

上海人工智能实验室 / OpenLMLab 实习 `2024.09 - 2025.05`

InternLM3预训练、模态数据增强、OCR多模态任务优化
一作论文投ACM MM（OCR置信度优化）；准备AAAI论文（数据合成）

文本生成与隐写水印研究（LLM方向） `ACL在投`

设计解码策略实现语义聚类隐写术，提出鲁棒文本水印方案
方法具备多模态扩展性
正在构思第二篇语义水印方向文章（目标EMNLP）

香港科技大学科研合作 `2024.05 - 2024.12`

一篇ICLR已接收：SPO算法（非一作）
一篇联合一作文章投ICML：对抗强化学习框架（泛化强、拟合稳）

工程与实习经历

清华大学 & 网信办项目（大模型内容合规） `2023.08 - 2024.07`

与清华电子工程系合作，参与模型安全审计、训练继承检测
成果转化为企业“隐拓智安”及国基项目，产品接近蚂蚁“蚁天鉴”

CERT中央项目（多模态内容安全） `2024.04 - 2024.09`

项目负责人，总体技术方案设计与人员组织
审核外网多模态数据（图文视频），支持转发与展示功能

上海孚典智能公司 `2023.03 - 2023.09`

使用 Ray 构建分布式 AIGC 系统，接入 Stable Diffusion
构建基于Langchain+向量检索的企业对话AI（服务上海机场、建筑集团）

竞赛获奖

ATEC 2023 大模型新闻检测赛道：全国第五（队长，蚂蚁 & 中国电子学会）
全国大学生算法编程挑战赛：银奖（队长）