个人简介🙋♂️
- 香港理工大学 (PolyU) 数据科学与人工智能系(DSAI),应用数学系 (AMA) 博士一年级学生。非常荣幸的由韩睿渐博士, 黄坚教授以及袁雁城博士共同指导。
- 在此之前,我在生成式人工智能数学基础研究中心 (CMFAI) 担任研究助理并由黄坚教授指导。我于2024年获得数据科学与分析专业的硕士学位,并获得了Distinction荣誉,导师为蒋滨雁博士。我于2022年获得计算机科学与技术专业的学士学位,并获得国家奖学金。
- 我热衷于人工智能,软件开发以及大数据等多个领域,拥有超过2年的行业技术经验。
研究兴趣💡
- 大语言模型: 监督式微调,上下文学习(ICL)。
- AI Agent: 大语言模型智能体, 检索增强生成(RAG)。
- AI4Science: 健康信息学, 医学影像, 医学大语言模型。
新闻📢
- 我们最新撰写的大语言模型数据智能体的综述论文已公开在arXiv上, 欢迎提出修改意见📢. Dec 18, 2024
- 受邀参加为期7天的”人工智能数理基础研讨会(云南昆明)”。有幸在大上报告我们的工作关《LAMBDA: A Large Model Based Data Agent》。 2024年9月27
- 正式注册成为香港理工大学应用数学系博士生(现已转到数据科学与人工智能系)。 2024年8月30
- 从香港理工大学数据科学与分析理学硕士项目毕业,获得Distinction荣誉🥇。 2024年7月15日
- 很开心的宣布,我将在2024年9月份在香港理工大学攻读博士学位。我的研究方向主要包括大语言模型,多智能体合作,扩散模型等等。欢迎志同道合的朋友讨论😃。 2024年5月16
- 我在CSDN上的粉丝数量超过了1000🔥。 2023年12月
论文/稿件📰
A Survey on Large Language Model-based Agents for Statistics and Data ScienceUnder Review. arXiv preprint arXiv:2412.14222, 2024
Paper Repository
Paper Repository
LAMBDA: A Large Model Based Data Agent Under Revision. arXiv preprint arXiv:2407.17535, 2024
Paper Page Code PapersWithCode
Paper Page Code PapersWithCode
LlamaCare: A Large Medical Language Model for Enhancing Healthcare Knowledge Sharing Technical Report. arXiv preprint arXiv:2406.02350, 2024.
Paper Code HuggingFace PapersWithCode
Paper Code HuggingFace PapersWithCode
工作/研究经验🚀
-
大语言模型在医疗诊断系统中的应用 :负责研发与部署最新的开源大语言模型,包括微调,评估以及提示工程。
-
智能风电无人机巡检解决方案 :负责目标检测与图像分割。包括算法设计,实现,微调,模型部署 (产品详情)。
-
低代码平台智能web机器人小D :负责后端开发以及语音识别算法调优。实习生管理系统招聘模块 :负责后端开发与算法研发,包括简历内容提取与分类,关键信息提取,表单自动填充。
-
潮酷Box小程序 (微服务电商系统) :负责后端开发。参与性能调优,服务切分以及高并发设计。优化多个高并发场景下的数据一致性问题。
奖项🏅
- 本科生国家奖学金 (0.2%) 12/2020
- 浙江省优秀毕业生 (4%) 06/2022
- 浙江省政府奖学金 (5%) 12/2021
- 香港理工大学研究生奖学金 09/2024
- 精英奖学金 × 2 (校级最高荣誉奖学金, 1%) 07/2021 & 07/2020
- 学业优秀一等奖学金 × 5 (3%) 2018 & 2019 & 2020 & 2021
- RoboMaster2022无人飞行智能感知技术竞赛优胜奖 (全国第28名) 12/2022
- “智未来杯”全国人工智能创新大赛二等奖 05/2021
- 三好学生 × 7 2018 & 2019 & 2020 & 2021
教学服务👨🏫
- 教学助理, Mathematics Learning Support Centre (数学教学支持中心)。 24/25学年第一学期
讲座/报告📚
- LAMBDA: A Large Model Based Data Agent @ 人工智能数理基础研讨会,云南昆明。 2024年9月27
- Understanding Large Language Models: Principles, Evolution, and Applications @ 香港理工大学暑校, 北京航空航天大学 × 西北工业大学. 2024年7月23
专业技能🪀
- 熟悉机器学习,深度学习理论; 熟悉数据挖掘, 图像分类, 目标检测, 图像分割, 文本分类, 大语言模型等领域任务; 熟练掌握Pytorch。
- 熟悉常用数据结构与算法(表,栈,队列,搜索,排序等); 计算机网络协议(TCP, UDP, HTTP, WebSocket等); 以及操作系统(调度, 管理等)。
- 熟悉编程语言:Python, Java, C, JavaScript, PHP, R; 熟悉标记语言:HTML,CSS; 熟练掌握Linux常用命令。
- 熟悉开发框架:SSM, SpringBoot, SpringCloud, Flask, VUE; 熟悉常用开发工具及组件: Git, Postman, Docker, Swagger, Aliyun OSS桶等。
- 熟悉关系型数据库:MySQL (索引, 事务, SQL调优), SQLServer以及非关系型数据库:Redis and MongoDB。
- 了解分布式系统,微服务架构思想以及消息中间件如RabbitMQ, Kafka;了解高并发设计思想,多线程,锁机制,JUC 并发包。
- 了解大数据框架以及组件:Hadoop, Hive, Spark, Flink; 了解ETL, 数据湖,以及常用数据分析工具如Tableau。
其他💌
- 🎓 学术合作可以联系Stephen Sun 或 Email: mj.sun@connect.polyu.hk