视觉理解团队致力于通过计算机视觉和自然语言处理技术来理解、生成和转换多媒体内容。 我们致力于手语翻译、图像/视频描述、视觉对话、视频定位和视觉问答等课题的研究,已发表超过20篇国际学术期刊和会议论文,包括IEEE TPAMI、IEEE TIP、IEEE TMM、ACM TOMCCAP、CVPR、AAAI、IJCAI、ACM MM等。
| 
                    手语翻译与生成 本部分涵盖与手语识别相关的研究,主要是连续手语翻译(CSLT)。为了提高离散手语词的识别准确性,一些早期的工作设计了一种自适应隐马尔可夫模型(HMM)框架。 这些方法可以充分探索隐藏手语状态之间的内在属性和互补关系。 CSLT面临着混合语义学习带来的挑战,其中包括视觉表示、手语语言学和文本语法的顺序变化······ [详细]  | 
            |
| 
                    视觉问答与对话 本部分涵盖与跨媒体视觉推理相关的研究,主要包括基于图像/视频的问答和对话生成。 [Details]  | 
            |
| 
                    视觉描述生成 本部分涵盖与视觉描述生成相关的研究,主要是指根据图像/视频的内容自动生成文本的描述,最新的工作包括跨语言的视觉字幕生成和情感视频描述等。 [Details]  | 
            |
| 
                    视觉理解与分析 本部分涵盖与视觉内容理解相关的研究,包括基于图像的人群基数、基于图像的视觉对象定位、文本引导下的视频动作定位等。 [Details]  | 
            
| 状态 | 姓名 | 联系方式 | 研究方向 | 
|---|---|---|---|
| 教授 | 郭丹 | guodan@hfut.edu.cn | 机器视觉、机器学习、深度学习、模式识别 | 
| 讲师 | 唐申庚 | tangsg@hfut.edu.cn | 手语翻译与生成、AIGC | 
| 讲师 | 徐静远 | xujingyuan@hfut.edu.cn | 医学图像处理、体态分析 | 
| 状态 | 姓名 | 联系方式 | 研究方向 | 
|---|---|---|---|
| 博士研究生 | 张静 | -- | 图像描述 | 
| 博士研究生 | 周晟 | -- | 文本视觉问答 | 
| 博士研究生 | 钱威 | -- | 远程生理信号估计 | 
| 博士研究生 | 胡晶晶 | -- | 音视频事件定位 | 
| 硕士研究生 | 李张斌 | -- | 音视频问答 | 
| 硕士研究生 | 王飞 | -- | 运动放大 | 
| 硕士研究生 | 刘飞扬 | -- | 视线估计 | 
| 硕士研究生 | 陈国良 | -- | 微动作分析 | 
| 硕士研究生 | 孙甲慧 | -- | 视频描述生成 | 
| 届别 | 姓名 | 就职单位 | 
|---|---|---|
| 2020届硕士毕业生 | 熊成鑫 | 中国移动 | 
| 2020届硕士毕业生 | 裴现坤 | 上海浦发银行 | 
| 2021届硕士毕业生 | 严士涵 | 徽商银行 | 
| 2021届硕士毕业生 | 桂毓灵 | -- | 
| 2021届硕士毕业生 | 朋帆 | 中国邮政储蓄银行 | 
| 2022届硕士毕业生 | 姚沈涛 | 科大讯飞 | 
| 2023届硕士毕业生 | 郭义臣 | 中国移动 | 
| 2023届博士毕业生 | 宋培培 | 中国科学技术大学 | 
| 2022届博士毕业生 | 李坤 | - | 
| 2023届博士毕业生 | 周金星 | - | 
| 2023届博士毕业生 | 王辉 | - | 
| 2023届硕士毕业生 | 卢天一 | - | 
会议论文:
期刊论文:
授权专利:
| 立项时间 | 项目名称 | 项目层次 | 项目组成员 | 
|---|---|---|---|
| 2022年 | 基于视觉环境感知的视障人士出行导航系统 | 国家级 | 谷纪豪、肖同欢、宋万强、黄滨 | 
| 2022年 | 基于视觉-语言理解的智能室内机器人导航系统 | 省级 | 李家秀、卫天翼、蔡景宜、赵凌霄、费文轩 | 
| 2021年 | 基于多分类目标检测的全自动家居清洗设备 | 校级 | 何梓贻、罗匡、徐梓鑫、倪友炜、马嘉淇 | 
| 2021年 | 基于PyramidBox-Lite模型的口罩识别检测系统 | 校级 | 梁云、付守宇、付泓菁、李跃强、秦崇昀 | 
| 2020年 | 基于人群计数技术的大型超市优化管理系统 | 省级 | 曾纪勇、李泓博、张振兴、银鑫、刘经诚 | 
| 2020年 | 基于场景文字识别的图书检索AI系统 | 校级 | 陈鸿、陈国良、郭志俊、李利艳 | 
| 2019年 | 基于表情识别的课堂质量评判系统 | 校级 | 恽郅、弋绮、万德阳、杨光正奥、马欣 | 
| 2018年 | “今日食堂”--打造高校智能食堂2.0 | 省级 | 朱航延、王家辉、张方勇、刘志远、李文琪 |