个人简介

背景

  • 北京邮电大学 / 上海交通大学 联合培养(985 / 211 / 双一流 / QS前100)
    • 方向:学科专业化大模型、人工智能安全、对齐(Alignment)、RLHF、大模型训练、数据增广

技术技能

  • 熟练框架:PyTorch、Langchain、LlamaFactory、Slurm、阿里PAI平台
  • 熟悉技术:RLHF、PPO/DPO、CPT/SFT、大模型训练部署、对齐、内容安全
  • 硬件经验:128卡A100、千卡级H800
  • 竞赛:ATEC大模型比赛全国第五

科研经历

蚂蚁集团实习(内容安全 & AI金融) 2025.04 - 至今

  • 方向一:多模态内容理解,舆论管控与伦理治理
  • 方向二:大模型在金融风控与辅助决策中的应用与优化

上海人工智能实验室 / OpenLMLab 实习 2024.09 - 2025.05

  • InternLM3预训练、模态数据增强、OCR多模态任务优化
  • 一作论文投ACM MM(OCR置信度优化);准备AAAI论文(数据合成)

文本生成与隐写水印研究(LLM方向) ACL在投

  • 设计解码策略实现语义聚类隐写术,提出鲁棒文本水印方案
  • 方法具备多模态扩展性
  • 正在构思第二篇语义水印方向文章(目标EMNLP)

香港科技大学科研合作 2024.05 - 2024.12

  • 一篇ICLR已接收:SPO算法(非一作)
  • 一篇联合一作文章投ICML:对抗强化学习框架(泛化强、拟合稳)

工程与实习经历

清华大学 & 网信办项目(大模型内容合规) 2023.08 - 2024.07

  • 与清华电子工程系合作,参与模型安全审计、训练继承检测
  • 成果转化为企业“隐拓智安”及国基项目,产品接近蚂蚁“蚁天鉴”

CERT中央项目(多模态内容安全) 2024.04 - 2024.09

  • 项目负责人,总体技术方案设计与人员组织
  • 审核外网多模态数据(图文视频),支持转发与展示功能

上海孚典智能公司 2023.03 - 2023.09

  • 使用 Ray 构建分布式 AIGC 系统,接入 Stable Diffusion
  • 构建基于Langchain+向量检索的企业对话AI(服务上海机场、建筑集团)

竞赛获奖

  • ATEC 2023 大模型新闻检测赛道:全国第五(队长,蚂蚁 & 中国电子学会)
  • 全国大学生算法编程挑战赛:银奖(队长)