孙茂珺

走了点弯路.

EN/中文

个人简介

研究兴趣

  • 大语言模型: 监督式微调,上下文学习(ICL)。
  • AI智能体: 大语言模型智能体, 检索增强生成(RAG)。
  • AI4Science: 健康信息学, 医学影像, 医学大语言模型。

新闻📢

  • 正式注册成为香港理工大学应用数学系博士生。 2024年8月30
  • 从香港理工大学数据科学与分析理学硕士项目毕业,获得Distinction荣誉🥇。 2024年7月15日
  • 很开心的宣布,我将在2024年9月份在香港理工大学攻读博士学位。我的研究方向主要包括大语言模型,多智能体合作,扩散模型等等。欢迎志同道合的朋友讨论😃。 2024年5月16
  • 我在CSDN上的粉丝数量超过了1000🔥。 2023年12月

论文/稿件📰

  • LAMBDA: A Large Model Based Data Agent
    Maojun Sun, Ruijian Han, Binyan Jiang, Houduo Qi, Defeng Sun, Yancheng Yuan*, and Jian Huang*.
    Under review. arXiv preprint arXiv:2407.17535, 2024
    Paper Page Code PapersWithCode
  • LlamaCare: A Large Medical Language Model for Enhancing Healthcare Knowledge Sharing
    Maojun Sun.
    Technical Report. arXiv preprint arXiv:2406.02350, 2024.
    Paper Code HuggingFace PapersWithCode
  • Data Enhancement for Melanoma Classification
    Maojun Sun, Anxing Jiang, and Zixiong Li.
    2021 2nd International Conference on Artificial Intelligence and Computer Engineering.
    Paper Code

工作/研究经验

  • 香港理工大学 研究助理 2024年2月 - 2024年8月
    LAMBDA: Large Model Based Data Agent: [LAMBDA]
    负责研究,设计新型多代理数据分析大模型智能体。
    2023年5月 - 至今 研究中心系统开发: (兼职项目助理)
    负责设计以及开发研究中心系统,包括:[CMFAI] [RCNA] [RCQF] [CIOR]。
  • 人工智能实验室, 香港医管局 学生研究员 2023年7月 - 2023年12月
    大语言模型在医疗诊断系统中的应用 :
    负责研发与部署最新的开源大语言模型,包括微调,评估以及提示工程。
  • 巴卡拉能源科技 图像算法实习生 2022年6月 - 2022年8月
    智能风电无人机巡检解决方案 : [Page]
    负责目标检测与图像分割。包括算法设计,实现,微调,模型部署。
  • DXC Technology 人工智能工程师 2021年11月 - 2022年6月
    低代码平台智能web机器人小D :
    负责后端开发以及语音识别算法调优。
    实习生管理系统招聘模块 :
    负责后端开发与算法研发,包括简历内容提取与分类,关键信息提取,表单自动填充。
  • 中软国际 软件开发实习生 2020年6月 - 2020年8月
    潮酷Box小程序 (微服务电商系统) :
    负责后端开发。参与性能调优,服务切分以及高并发设计。优化多个高并发场景下的数据一致性问题。

获奖🏅

  • 本科生国家奖学金 (0.2%) 12/2020
  • 浙江省优秀毕业生 (4%) 06/2022
  • 浙江省政府奖学金 (5%) 12/2021
  • 精英奖学金 × 2 (校级最高荣誉奖学金, 1%) 07/2021 & 07/2020
  • 学业优秀一等奖学金 × 5 (3%) 2018 & 2019 & 2020 & 2021
  • RoboMaster2022无人飞行智能感知技术竞赛优胜奖 (全国第28名) 12/2022
  • “智未来杯”全国人工智能创新大赛二等奖 05/2021
  • 三好学生 × 7 2018 & 2019 & 2020 & 2021

专业技能

  • 熟悉机器学习,深度学习理论; 熟悉数据挖掘, 图像分类, 目标检测, 图像分割, 文本分类, 大语言模型等领域任务; 熟练掌握Pytorch。
  • 熟悉常用数据结构与算法(表,栈,队列,搜索,排序等); 计算机网络协议(TCP, UDP, HTTP, WebSocket等); 以及操作系统(调度, 管理等)。
  • 熟悉编程语言:Python, Java, C, JavaScript, PHP, R; 熟悉标记语言:HTML,CSS; 熟练掌握Linux常用命令。
  • 熟悉开发框架:SSM, SpringBoot, SpringCloud, Flask, VUE; 熟悉常用开发工具及组件: Git, Postman, Docker, Swagger, Aliyun OSS桶等。
  • 熟悉关系型数据库:MySQL (索引, 事务, SQL调优), SQLServer以及非关系型数据库:Redis and MongoDB。
  • 了解分布式系统,微服务架构思想以及消息中间件如RabbitMQ, Kafka;了解高并发设计思想,多线程,锁机制,JUC 并发包。
  • 了解大数据框架以及组件:Hadoop, Hive, Spark, Flink; 了解ETL, 数据湖,以及常用数据分析工具如Tableau。

其他