
孙斌 教授
Email:sunbin611@hnu.edu.cn
办公室:湖南大学机器人视觉感知与控制技术国家工程研究中心401-3
2027硕士、博士(直博/申请考核)招生中,欢迎有志于从事人工智能和无人系统研究的同学联系申请
基本信息
孙斌,河南南阳人,湖南大学人工智能与机器人学院教授,李树涛院士团队核心成员,现任人工智能系主任,博士生导师,岳麓学者,湖南省青年基金A类项目获得者,长期从事图像处理与模式识别领域的研究工作。近年来主要研究方向为多模态图像语义理解与交互及其在智能无人系统中的应用,先后主持国防重点项目课题、国家自然科学基金、教育部联合基金等项目15项,其中国家级5项,省部级3项,企业委托技术开发项目7项,作为研究骨干承担国家重点研发计划和国家自然科学基金创新研究群体等重大科研任务。成果在IEEE TPAMI、TIP、TNNLS、TAFFC、TGRS、Science China: Information Sciences、CVPR、ACM MM等国内外高水平学术期刊和会议上发表论文50余篇,其中中科院一区19篇,IEEE汇刊论文20篇,高被引论文3篇,授权发明专利28项,软件著作权5项,成果应用于华为、航天彩虹、南方电网、中航沈飞等行业龙头企业,获得吴文俊人工智能自然科学一等奖、湖南省自然科学一等奖、教育部自然科学二等奖、CCF A类顶会竞赛冠军17项等。
联系方式
1. 电子邮箱:sunbin611@hnu.edu.cn
2. 办公地址:湖南大学机器人视觉感知与控制技术国家工程研究中心401-3
3. 2027年直博/硕士/博士名额开放申请中,有意者请发送个人简历到我的电子邮箱,欢迎有志于从事计算机视觉、多模态人工智能和智能无人系统等领域研究的同学加入我的团队。
4. 实验室长期招收本科实习生,欢迎有一定软硬件基础、愿意持续投入时间进行科研实践训练的同学加入团队,从事基础软硬件开发、算法训练、报告撰写等科研工作,参与项目并取得科研成果的同学可以申请专利、发表论文、获得津贴等。同时,鼓励同学们基于实验室科研项目项目申报SIT项目或者参加人工智能领域竞赛,实验室将全力支持并予以奖励。
人才培养:
1. 出版教材:战略新兴领域“十四五”高等教育系列教材《智能图像处理及应用》《多模态信号处理基础》机械工业出版社
2. 主讲课程:信号与系统(本科,专业核心课)、计算机视觉导论(本科,专业选修课)、人工智能创新创业基础与前沿(本科,全校公选课)、机器人感知与机器学习(学硕专业课)、智能机器人感知与学习(专硕专业课)、机器人前沿(博士专业课)
3. 指导学科:控制科学与工程(学术硕士/博士),智能科学与技术(学术硕士/博士),电子信息人工智能方向(专业硕士/博士)
4. 团队氛围:师生平等,教学相长;团结友爱,互帮互助;协作拼搏,共同进步
5. 研究条件:本实验室提供智能机器人、无人机等实验平台以及配备A100、4090等GPU的智能计算服务器和工作站,为智能无人系统关键技术研究和应用系统开发提供良好的研究条件;
6. 津贴待遇:团队科研经费充足,参与项目每月发放固定津贴,依据研究成果水平和工作量进行额外奖励,并根据个人经济状况提供助教助研岗位津贴和生活补助
7. 国际交流:鼓励到国际高水平学术会议和高水平科研院所开展学术交流,对于发表CCF B类以上会议论文的学生予以全额参会资助,对于CVPR、ICCV、ACM MM等CCF A类会议论文进行额外奖励,团队与多所国际高水平大学保持良好合作关系,支持高年级博士研究生通过国家留学基金委进行中外联合培养
教学荣誉:
1. 湖南省高等教育教学成果二等奖 2022
2. 教育部华为“智能基座”栋梁之师2022
3. 华为智能基座云与计算先锋教师奖章 2021
4. 湖南大学本科毕业实习优秀指导教师 2023
科研项目
1. 国家自然科学基金联合基金重点项目课题, U24A20327, 面向开放场景的无人系统智能感知与协同计算研究, 2025-01-01 至 2028-12-31, 主持
2. 装备预研教育部联合基金青年人才项目,8091B03072404,无人机跨模态环境感知迁移学习技术,2025.1-2026.12,主持
3. 国家自然科学基金面上项目,62171183,服务机器人的多模态自然交互理解与反馈,2022.01-2025.12,主持
4. JKW重点项目课题, 20-163-01-LZ-005-001-01-02, 多源异构XXXXXXX, 2021.01-2023.12, 主持
5. 国家自然科学基金青年项目,61801178,高分辨率遥感图像自适应语义分割方法研究,2019.01-2021.12,主持
6. 湖南省自然科学基金青年A类项目, 2026JJ20061, 多模态语义理解, 2026.01-2028.12,主持
7. 湖南省自然科学基金优秀青年项目, 2022JJ20017, 智能机器人的多模态融合识别与自然交互, 2022.01-2024.12,主持
8. 湖南省自然科学基金青年项目,2018JJ3071,基于太赫兹成像的目标深度特征提取与分类研究,2018.01-2020.12,主持
9. 南方电网委托技术开发项目,H202691000150,无人机及机器人智能感知关键技术研究及示范应用,2026.2-2027.9,主持
10. 南方电网委托技术开发项目,H202691000126,基于大语言模型与知识图谱融合的项目管理智能助手(项目质量与工作内容评估技术研发),2026.2-2028.1,主持
11. 南方电网委托技术开发项目,H202591000661,计量自动化系统智能数据分析关键技术研究及AI助手工具研制(算法开发),2025.9-2027.11,主持
12. 南方电网委托技术开发项目,H202491408510,基于场景内容理解的配电机巡图像缺陷智能识别研究(红外光部分),2024.10-2026.7,主持
13. 南方电网委托技术开发项目,H202491400277,基于可见光的一次设备绝缘缺陷低成本快速智能诊断技术研究与应用,2024.4-2026.9,主持
14. 长沙天仪研究院有限公司委托项目,H202194400108,光学卫星遥感图像智能解译,2020.12-2021.6,主持
15. 中国人工智能学会华为MindSpore学术奖励基金项目,CAAIXSJLJJ-2022-036A,机器人多模态融合意图理解与交互,2022.11-2023.11,主持
荣誉奖励
1. 吴文俊人工智能自然科学一等奖 2025
2. 教育部科学研究优秀成果自然科学二等奖 2025
3. 湖南省自然科学一等奖 2021
4. 教育部自然科学二等奖 2025
5. GlobalRG挑战赛第一名, CVPR 2025
6. 文本到图像生成模型质量评估任务结构失真检测赛道冠军, CVPR 2025
7. 基于视觉的现实世界助手研讨会交互式问答挑战第一名, CVPR 2025
8. 面向视障人士提出的视觉问题的单一答案定位挑战赛第一名, CVPR 2025
9. SyntaGen挑战赛第一名, CVPR 2024
10. 多模态遥感应用智能解译技术挑战赛第一名, ISPRS 2024
11. 多模态群体行为分析挑战赛眼神交流检测第一名, ACM MultiMedia 2024
12. 多模态群体行为分析挑战赛说话人预测第一名, ACM MultiMedia 2023
13. 多模态群体行为分析挑战赛说话人预测第一名, ACM MultiMedia 2022
14. 多模态群体行为分析挑战赛眼神接触检测第一名, ACM MultiMedia 2022
15. 医疗视频理解竞赛第一名, ACL 2022
16. 社交媒体主题情感分析挑战赛情感分类赛道第一名, ACL 2022
17. 社交媒体主题情感分析挑战赛性格与人际反应指数预测赛道第一名, ACL 2022
18. 科学文档理解挑战赛 4种单语种缩略词消歧赛道第一名,AAAI 2022
19. 科学文档理解挑战赛 4种单语种缩略词提取赛道第一名,AAAI 2022
20. 多模态情感分析挑战赛压力情感分析第一名, ACM MultiMedia 2021
21. 机器学习防止与对抗疫情挑战赛实体感知医疗对话生成赛道第一名,ICLR2021
22. 蕴含实体的中文医疗对话生成挑战赛第一名,CCKS 2021
23. 多模态对话理解与生成挑战赛 对话场景识别赛道第一名,NLPCC 2022
24. 多模态对话理解与生成挑战赛 对话会话识别赛道第一名,NLPCC 2022
25. 多模态对话理解与生成挑战赛 对话回复生成赛道第一名,NLPCC 2022
学术成果
科研论文 (最新论文请访问https://dblp.org/pid/01/5401-1.html )
1. Bin Sun, Zuxiang Long, Ziyu Ma, Shutao Li, Cascade Fusion and Correlation Enhancement for Knowledge Distillation, IEEE Transactions on Neural Networks and Learning Systems, 2025, 1-14, DOI: 10.1109/TNNLS.2025.3539991. SCI一区TOP
2. Qiya Song, Bin Sun* and Shutao Li, Multimodal Sparse Transformer Network for Audio-Visual Speech Recognition[J], IEEE Transactions on Neural Networks and Learning Systems, 2023, doi:10.1109/TNNLS.2022.3163771. SCI一区TOP
3. Ziyu Ma, Bin Sun* and Shutao Li, A Two-Stage Selective Fusion Framework for Joint Intent Detection and Slot Filling[J], IEEE Transactions on Neural Networks and Learning Systems, 2024, doi:10.1109/TNNLS.2022.3202562. SCI一区TOP
4. Ting Xie ,Shutao Li, and Bin Sun*, Hyperspectral Images Denoising via Nonconvex Regularized Low-Rank and Sparse Matrix Decomposition[J], IEEE Transactions on Image Processing, 2020, 29:44-56. SCI一区TOP
5. Zuxiang Long, Fuyan Ma, Bin Sun*, Mingkui Tan, Shutao Li, Diversified Branch Fusion for Self-Knowledge Distillation[J], Information Fusion, 2023, 90: 12-22.SCI一区TOP
6. Maoqing Hu, Bin Sun*, Xudong Kang, Shutao Li. Multiscale structural feature transform for multi-modal image matching[J]. Information Fusion, 2023, 95:341-354.SCI一区TOP
7. Fuyan Ma, Bin Sun*and Shutao Li, Transformer-Augmented Network With Online Label Correction for Facial Expression Recognition, IEEE Transactions on Affective Computing, vol. 15, no. 2, pp. 593-605, April-June 2024, doi: 10.1109/TAFFC.2023.3285231. SCI一区TOP
8. Fuyan Ma, Bin Sun* and Shutao Li, Facial Expression Recognition with Visual Transformers and Attentional Selective Fusion[J], IEEE Transactions on Affective Computing, 2023, 14(2):1236-1248.SCI一区TOP
9. Jiahao Li, Bin Sun*, Shutao Li, Xudong Kang, Semisupervised Semantic Segmentation of Remote Sensing Images With Consistency Self-Training, IEEE Transactions on Geoscience and Remote Sensing[J], 2022, 60(5615811): 1-13. SCI一区TOP
10. Bin Sun, Shaojun Hua, Shutao Li, Jun Sun. Graph-matching-based Character Recognition for Chinese Seal Images[J], Science China-Information Sciences, 2019, 62(9):1-14. SCI一区TOP
11. Yu Pei, Bin Sun* and Shutao Li, Multifeature Selective Fusion Network for Real-Time Driving Scene Parsing[J], IEEE Transactions on Instrumentation and Measurement, 2021, 70: 1-12. SCI二区
12. Qiaobo Hao, Yu Pei, Rong Zhou, Bin Sun*, Jun Sun, Shutao Li, Xudong Kang, Fusing Multiple Deep Models for In Vivo Human Brain Hyperspectral Image Classification to Identify Glioblastoma Tumor[J], IEEE Transactions on Instrumentation and Measurement, 2021, 70: 1-14. SCI二区
13. Xiliang Li, Bin Sun*, Zhenhua Wu, Shutao Li, Hu Guo.CD4C: Change Detection for Remote Sensing Image Change Captioning[J], IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2025, 18: 9181-9194, doi:10.1109/JSTARS.2025.3554385. SCI二区
14. 孙斌,常开智,李树涛*,面向医疗咨询的复杂问句意图智能理解[J],中文信息学报,2023, 37(1):112-120. CCF中文期刊T1
15. Fuyan Ma, Bin Sun*and Shutao Li, Logo-Former: Local-Global Spatio-Temporal Transformer for Dynamic Facial Expression Recognition[C], ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2023:1-5.
16. Qiya Song, Renwei Dian, Bin Sun*, Jie Xie, Shutao Li, Multi-scale Conformer Fusion Network for Multi-participant Behavior Analysis[C]. ACM Multimedia, 2023: 9472-9476.
17. Fuyan Ma, Ziyu Ma, Bin Sun*, Shutao Li, TA-CNN: A Unified Network for Human Behavior Analysis in Multi-Person Conversations[C]. ACM Multimedia, 2022: 7099-7103.
18. Bin Sun, Shutao Li*, Jie Xie, Sea-Land Segmentation for Harbor Images with Superpixel CRF[C], IEEE International Geoscience and Remote Sensing Symposium, 2019:3899-3902.
19. Xiliang Li,Bin Sun* and Shutao Li, Detection Assisted Change Captioning for Remote Sensing Image, IEEE International Geoscience and Remote Sensing Symposium, 2024:10454-10458.
科研专利成果
1. 基于自适应对比学习的半监督图像识别方法,2025.4.11,中国,ZL 202510066177.X(发明专利)
2. 一种图像语义特征约束的遥感目标检测方法,2023.7.28,中国,ZL 202011018965.5(发明专利)
3. 一种基于单目视觉惯导融合的无人机自主定位方法与系统,2022.08.19,中国,ZL202210596099.0(发明专利)
4. 一种高分辨率高光谱计算成像方法、系统及介质,2021.06.22,中国,ZL202110395614.4(发明专利)
5. 激光与视觉信息融合的鲁棒定位和建图方法及系统,2021.07.30,中国,ZL202110415828.3(发明专利)
6. 一种单/多帧快照式光谱成像方法、系统及介质,2021.03.02,中国,ZL202010327175.9(发明专利)
7. 基于深度学习的多摄像头高光谱成像方法、系统及介质,2021.04.09,中国,ZL202010311781.1(发明专利)
8. 基于分解最小条件数变换的多光谱图像去噪方法、系统及介质,2020.08.18,中国,ZL202010455817.3(发明专利)
9. 多模图像最大矩与空间一致性的非刚性配准方法及系统,2022.08.30,中国,ZL202210603984.7(发明专利)
10. 基于在线协作与融合的自我知识蒸馏方法与系统,2022.06.14,中国,ZL202210019067.4(发明专利)
11. 一种智能机器人的多模态融合自然交互方法、系统及介质, 2022.10.21, 中国, ZL202210838251.1 (发明专利)
12. 一种基于跨模态注意力增强的唇语识别方法及系统, 2021.11.05, 中国,ZL202110986219.3 (发明专利)
13. 基于全局注意力意图识别的人机交互导诊方法与系统, 2021.04.20, 中国,ZL202110150350.6 (发明专利)
14. 基于子空间稀疏特征融合的多模态情感识别方法及系统, 2020.12.25, 中国, ZL202011019175.9 (发明专利)
15. 一种跨模态的双边个性化人机社交对话生成方法及系统, 2020.12.18, 中国,ZL202011046353.7 (发明专利)
16. 基于复杂意图智能识别的人机交互问答方法与系统, 2020.11.13, 中国,ZL202010854637.2 (发明专利)
17. 一种基于混合注意力的人机对话生成方法、系统及介质,2022.11.04,中国,ZL202210916763.5(发明专利)
18. 一种人机自然交互的用户注意力检测方法及系统,2020.12.25,中国,ZL202011019174.4(发明专利)