孙茂珺

菜鸡轻喷

EN/中文

个人简介🙋‍♂️

研究兴趣💡

  • 大语言模型: 监督式微调,上下文学习(ICL)。
  • AI Agent: 大语言模型智能体, 检索增强生成(RAG)。
  • AI4Science: 健康信息学, 医学影像, 医学大语言模型。

新闻📢

  • 我们最新撰写的大语言模型数据智能体的综述论文已公开在arXiv上, 欢迎提出修改意见📢. Dec 18, 2024
  • 受邀参加为期7天的”人工智能数理基础研讨会(云南昆明)”。有幸在大上报告我们的工作关《LAMBDA: A Large Model Based Data Agent》2024年9月27
  • 正式注册成为香港理工大学应用数学系博士生(现已转到数据科学与人工智能系)。 2024年8月30
  • 从香港理工大学数据科学与分析理学硕士项目毕业,获得Distinction荣誉🥇。 2024年7月15日
  • 很开心的宣布,我将在2024年9月份在香港理工大学攻读博士学位。我的研究方向主要包括大语言模型,多智能体合作,扩散模型等等。欢迎志同道合的朋友讨论😃。 2024年5月16
  • 我在CSDN上的粉丝数量超过了1000🔥。 2023年12月

论文/稿件📰

A Survey on Large Language Model-based Agents for Statistics and Data Science
Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan*, and Jian Huang*.
Under Review. arXiv preprint arXiv:2412.14222, 2024
Paper Repository
LAMBDA: A Large Model Based Data Agent
Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan*, and Jian Huang*.
Under Revision. arXiv preprint arXiv:2407.17535, 2024
Paper Page Code PapersWithCode
LlamaCare: A Large Medical Language Model for Enhancing Healthcare Knowledge Sharing
Maojun Sun.
Technical Report. arXiv preprint arXiv:2406.02350, 2024.
Paper Code HuggingFace PapersWithCode
Data Enhancement for Melanoma Classification
Maojun Sun, Anxing Jiang, and Zixiong Li.
2021 2nd International Conference on Artificial Intelligence and Computer Engineering.
Paper Code

工作/研究经验🚀

  • 香港理工大学 研究助理 2024年2月 - 2024年8月
    LAMBDA: Large Model Based Data Agent:
    负责研究,设计新型多代理数据分析大模型智能体 (LAMBDA)。
    2023年5月 - 2024年5月 研究中心系统开发: (兼职项目助理)
    负责设计以及开发研究中心系统,包括:[IOR],[CMFAI],[RCNA],[RCQF]。
  • 人工智能实验室, 香港医管局 学生研究员 2023年7月 - 2023年12月
    大语言模型在医疗诊断系统中的应用 :
    负责研发与部署最新的开源大语言模型,包括微调,评估以及提示工程。
  • 巴卡拉能源科技 图像算法实习生 2022年6月 - 2022年8月
    智能风电无人机巡检解决方案 :
    负责目标检测与图像分割。包括算法设计,实现,微调,模型部署 (产品详情)。
  • DXC Technology 人工智能工程师 2021年11月 - 2022年6月
    低代码平台智能web机器人小D :
    负责后端开发以及语音识别算法调优。
    实习生管理系统招聘模块 :
    负责后端开发与算法研发,包括简历内容提取与分类,关键信息提取,表单自动填充。
  • 中软国际 软件开发实习生 2020年6月 - 2020年8月
    潮酷Box小程序 (微服务电商系统) :
    负责后端开发。参与性能调优,服务切分以及高并发设计。优化多个高并发场景下的数据一致性问题。

奖项🏅

  • 本科生国家奖学金 (0.2%) 12/2020
  • 浙江省优秀毕业生 (4%) 06/2022
  • 浙江省政府奖学金 (5%) 12/2021
  • 香港理工大学研究生奖学金 09/2024
  • 精英奖学金 × 2 (校级最高荣誉奖学金, 1%) 07/2021 & 07/2020
  • 学业优秀一等奖学金 × 5 (3%) 2018 & 2019 & 2020 & 2021
  • RoboMaster2022无人飞行智能感知技术竞赛优胜奖 (全国第28名) 12/2022
  • “智未来杯”全国人工智能创新大赛二等奖 05/2021
  • 三好学生 × 7 2018 & 2019 & 2020 & 2021

教学服务👨‍🏫

讲座/报告📚

专业技能🪀

  • 熟悉机器学习,深度学习理论; 熟悉数据挖掘, 图像分类, 目标检测, 图像分割, 文本分类, 大语言模型等领域任务; 熟练掌握Pytorch。
  • 熟悉常用数据结构与算法(表,栈,队列,搜索,排序等); 计算机网络协议(TCP, UDP, HTTP, WebSocket等); 以及操作系统(调度, 管理等)。
  • 熟悉编程语言:Python, Java, C, JavaScript, PHP, R; 熟悉标记语言:HTML,CSS; 熟练掌握Linux常用命令。
  • 熟悉开发框架:SSM, SpringBoot, SpringCloud, Flask, VUE; 熟悉常用开发工具及组件: Git, Postman, Docker, Swagger, Aliyun OSS桶等。
  • 熟悉关系型数据库:MySQL (索引, 事务, SQL调优), SQLServer以及非关系型数据库:Redis and MongoDB。
  • 了解分布式系统,微服务架构思想以及消息中间件如RabbitMQ, Kafka;了解高并发设计思想,多线程,锁机制,JUC 并发包。
  • 了解大数据框架以及组件:Hadoop, Hive, Spark, Flink; 了解ETL, 数据湖,以及常用数据分析工具如Tableau。

其他💌