2010-2019年 西北工业大学 本科-博士
2023年至今,304永利集团,准聘副教授
2020年至2023,304永利集团,准聘助理教授
2019-2020年,百度研究院,人工智能研究员
机器多模态感知与学习:以大脑的多通道知觉为背景,挖掘并探究多模态信息(如图像、声音、触觉、力觉等)在机器(人)感知、交互与学习等方向的潜在问题与方法,让机器具备『多模态智能』。部分研究介绍请观看B站视频(https://www.bilibili.com/video/BV1DK4y1P7Ep?p=2)。
GeWu-Lab实验室网站: https://gewu-lab.github.io/
对客观存在保持好奇心,自驱,刻苦,以做有趣、有温度、有价值的研究为目标!
更多关于实验室介绍,请参见知乎文章:https://zhuanlan.zhihu.com/p/1908530147998565113
2023级多名硕士生(冯若轩,杜恒辉等),已在机器人触觉感知交互,多模态统一学习上形成若干代表性工作,如AnyTouch系列,Crab系列等,曾于北京智源人工智能研究院和腾讯公司等多家研究机构与公司实习。
2022级多名直博生(夏文科,杨泽群等),已在机器人交互学习、多模态交互理论上形成若干代表性工作,曾于上海AI Lab、字节Seed、北京人形机器人创新中心等多家研究机构与公司实习。
2021级直博生卫雅珂(曾赴CMU联培),指导发表多篇CCF-A类论文(如T-PAMI, CVPR Oral文章),荣获国家奖学金,2024年度百度奖学金(全球仅10人,奖金20万)。
2020级博士生与硕士生,发表多篇CCF-A类会议Oral文章。
多名访问同学(RA)于实验室在本科大二、大三阶段,发表CVPR、ICML等一作论文,如访问员工2017级上交本科生钱锐,指导发表多篇CCF-A类论文,后于CUHK MMLab攻读博士学位;访问员工邓安东(上交),指导发表/在投多篇CCF-A类论文,后赴UCF攻读博士学位。
已毕业同学(去向):
李光耀(2020级博士):清华大学
许一鑫(2020级硕士):航天一院
彭小康(2020级硕士):中央办公厅

本科生课程:《人工智能与Python程序设计》,2020-2026
本科生课程:《人工智能与机器人》,2024-2026
研究生课程:《模式识别与计算机视觉》,2020-2026
北京市自然科学基金面上项目(2026-2028):多模态物体交互方法研究,主持
智源学者项目(2025-2026):面向物体操纵的视听触高效协同感知研究,主持
CCF-智谱大模型创新基金(2024-2025):基于统一学习范式的跨模态信息融合、推理与生成研究,主持
CCF-腾讯犀牛鸟基金(2024-2025):基于扩散模型的音频视频协同编辑与生成方法研究,主持
中国科协青年人才托举工程项目(2022-2024),主持
国家自然科学基金青年科学基金项目(2022-2024):自然场景下机器的视听感知与学习,主持
百度研究院(2021-2022):跨模态迁移学习场景下的可解释性研究,主持
腾讯AI Lab犀牛鸟专项研究计划(2021-2022):动态视音场景下多说话人跟踪与日志方法研究,主持
304永利集团官网新教师启动金项目(2021-2022):面向视听信息的多模态认知计算,主持
2025 智源学者
2025 世界人形机器人运动会场景赛亚军
2025 微软铸星学者
2023 2022年度吴文俊人工智能优秀青年奖
2021 中国科协青年人才托举工程项目
2021 荣获陕西省优秀博士论文奖
2020 荣获中国人工智能学会优秀博士论文奖
2019 入选百度『AIDU』全球顶尖人工智能人才计划
2019 荣获ACM XI’AN优秀博士论文奖(共2人)
2019 入选CVPR Doctoral Consortium博士生论坛(大陆共4人)
2018 荣获国家留学基金委赴卡内基梅隆大学联合培养学金
期刊审稿人: TPAMI, TNNLS, TIP, TKDE, TCSVT, TMM, etc.
会议高级程序委员: AAAI 2023-2026, IJCAI 2023-2026,ICML 2026,ICLR 2026
会议程序委员: NeurIPS 2020-2023, CVPR 2018 2020-2024, ICCV 2019-2023, ECCV2020, ICML 2021-2023, AAAI 2018 2020-2022, ICLR 2021-2024
联合组织者:
CVPR 2021 Tutorial on Audio-visual Scene Understanding
WACV 2021 Tutorial on Audio-visual Scene Understanding
ICDM 2019 Tutorial on Automated Deep Learning: Theory, Algorithms, Platforms, and Applications
邮箱:dihu[at]ruc.edu.cn
个人网页:https://gewu-lab.github.io/