个人简介 🙋

中文/EN

香港理工大学 数据科学与人工智能系 / 应用数学系 博士二年级研究生,很荣幸由韩睿渐教授黄坚教授以及袁雁城教授共同指导。

此前,我在 生成式人工智能数学基础研究中心](CMFAI)担任研究助理并由黄坚教授指导。我于2024年获得数据科学与分析专业的硕士学位,并获得了Distinction荣誉,导师为蒋滨雁教授。我于2022年获得计算机科学与技术专业的学士学位,并获得国家奖学金。

我热衷于人工智能,软件开发以及大数据等多个领域,拥有超过2年的行业与科研经验。欢迎志同道合的朋友交流与合作。

研究兴趣 💡

  • 智能体AI:数据科学智能体、多智能体系统、检索增强生成、基准测试。
  • 大语言模型:监督微调与强化学习。
  • AI4Science:科学智能体、健康信息学、医学影像、医学语言模型。

新闻动态 📢

2025年8月22日
我们的论文 基于大语言模型的统计与数据科学智能体综述TAS (The American Statistician) 接收,并入选特邀讨论环节 🎉。
2025年5月16日
论文 LAMBDA: 基于大模型的智能数据分析体 被顶级期刊 JASA 接收 🎉。该论文入选特邀讨论环节(仅2篇),并将在 JSM 2025 上展示。我们深感荣幸的是,David Donoho 教授 将担任本文的特邀讨论嘉宾。
2024年8月30日
正式注册成为香港理工大学博士研究生。
2024年7月15日
以卓越荣誉毕业,获得数据科学与分析硕士学位 🥇。
2023年12月
我的 CSDN 博客粉丝数突破 1000 🔥。

论文&手稿 📰

DSAEval
DSAEval: Evaluating Data Science Agents on a Wide Range of Real-World Data Science Problems
Maojun Sun, Yifei Xie, Yue Wu, Ruijian Han*, Binyan Jiang, Defeng Sun, Yancheng Yuan*, Jian Huang*.
arXiv preprint arXiv:2601.13591, 2026
JASA
LAMBDA
LAMBDA: A Large Model Based Data Agent
Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan*, Jian Huang*.
Accepted. Journal of the American Statistical Association, 2025. (Top Journal)
🏅 Selected with discussion
TAS
Survey
A Survey on Large Language Model-based Agents for Statistics and Data Science
Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan*, Jian Huang*.
Accepted. The American Statistician, 2025. (JCR Q1)
🏅 Selected with discussion
LlamaCare
LlamaCare: A Large Medical Language Model for Enhancing Healthcare Knowledge Sharing
Maojun Sun.
arXiv preprint arXiv:2406.02350, 2024.
Melanoma
Data Enhancement for Melanoma Classification
Maojun Sun, Anxing Jiang, Zixiong Li.
IEEE ICAICE, 2021.

工作经历 🚀

香港理工大学 2024年2月 - 2024年8月
研究助理 & 项目助理
研发用于数据分析的大语言模型。为 IORCMFAIRCNARCQF 开发系统。
香港医院管理局 AI 实验室 2023年7月 - 2023年12月
学生研究员
研发诊断系统中的大语言模型(微调、评估、提示工程)。
巴卡拉能源科技有限公司 2022年6月 - 2022年8月
图像算法实习生
研发风力无人机智能巡检解决方案(目标检测)。
DXC Technology 2021年11月 - 2022年6月
AI 工程师
开发智能网页机器人"小D"。研究简历内容分类与提取算法。

荣誉 🏅

国家奖学金 (0.2%) 2020年12月
浙江省优秀毕业生 (4%) 2022年6月
香港理工大学研究生奖学金 2024年9月
精英奖学金 × 2 (校级最高荣誉, 1%) 2020, 2021年
学业优秀一等奖学金 × 5 2018-2021年
大疆创新 RoboMaster 智能感知赛优胜奖 2022年12月
全国人工智能与创新创业大赛二等奖 2021年5月
三好学生 × 7 2018, 2019, 2020, 2021年
电脑医院协会优科长奖 2020年6月

教学与讲座 👨‍🏫

教学助理, DSAI1102 数据分析基础, 香港理工大学 25/26 S2
教学助理, DSAI5101 统计数据分析, 香港理工大学 25/26 S1
教学助理, 数学学习支持中心, 香港理工大学 24/25 S1
讲座: LAMBDA @ 数学基础人工智能研讨会, 天元数学研究中心, 云南昆明 2024年9月
讲座: 理解大语言模型: 原理、演进与应用 @ 香港理工大学暑期学校 2024年6月

专业技能 🪀

AI & ML:大语言模型微调、图像分类、数据挖掘、目标检测、图像分割等。

编程:Python、Java、SQL、HTML/JS/CSS、C语言等。

开发:FastAPI、Flask、SpringBoot、SpringCloud、Vue、Nginx、Git、Docker、AWS、阿里云等。

大数据:MySQL、Redis、Hadoop、Spark等。

其他 💌

🎓 如有研究合作意向,欢迎通过 mj.sun@connect.polyu.hk 联系我。