视觉理解团队致力于通过计算机视觉和自然语言处理技术来理解、生成和转换多媒体内容。 我们致力于手语翻译、图像/视频描述、视觉对话、视频定位和视觉问答等课题的研究,已发表超过20篇国际学术期刊和会议论文,包括IEEE TPAMI、IEEE TIP、IEEE TMM、ACM TOMCCAP、CVPR、AAAI、IJCAI、ACM MM等。
手语翻译与生成 本部分涵盖与手语识别相关的研究,主要是连续手语翻译(CSLT)。为了提高离散手语词的识别准确性,一些早期的工作设计了一种自适应隐马尔可夫模型(HMM)框架。 这些方法可以充分探索隐藏手语状态之间的内在属性和互补关系。 CSLT面临着混合语义学习带来的挑战,其中包括视觉表示、手语语言学和文本语法的顺序变化······ [详细] |
|
视觉问答与对话 本部分涵盖与跨媒体视觉推理相关的研究,主要包括基于图像/视频的问答和对话生成。 [Details] |
|
视觉描述生成 本部分涵盖与视觉描述生成相关的研究,主要是指根据图像/视频的内容自动生成文本的描述,最新的工作包括跨语言的视觉字幕生成和情感视频描述等。 [Details] |
|
视觉理解与分析 本部分涵盖与视觉内容理解相关的研究,包括基于图像的人群基数、基于图像的视觉对象定位、文本引导下的视频动作定位等。 [Details] |
状态 | 姓名 | 联系方式 | 研究方向 |
---|---|---|---|
教授 | 郭丹 | guodan@hfut.edu.cn | 机器视觉、机器学习、深度学习、模式识别 |
讲师 | 唐申庚 | tangsg@hfut.edu.cn | 手语翻译与生成、AIGC |
讲师 | 徐静远 | xujingyuan@hfut.edu.cn | 医学图像处理、体态分析 |
状态 | 姓名 | 联系方式 | 研究方向 |
---|---|---|---|
博士研究生 | 张静 | -- | 图像描述 |
博士研究生 | 周晟 | -- | 文本视觉问答 |
博士研究生 | 钱威 | -- | 远程生理信号估计 |
博士研究生 | 胡晶晶 | -- | 音视频事件定位 |
硕士研究生 | 李张斌 | -- | 音视频问答 |
硕士研究生 | 王飞 | -- | 运动放大 |
硕士研究生 | 刘飞扬 | -- | 视线估计 |
硕士研究生 | 陈国良 | -- | 微动作分析 |
硕士研究生 | 孙甲慧 | -- | 视频描述生成 |
届别 | 姓名 | 就职单位 |
---|---|---|
2020届硕士毕业生 | 熊成鑫 | 中国移动 |
2020届硕士毕业生 | 裴现坤 | 上海浦发银行 |
2021届硕士毕业生 | 严士涵 | 徽商银行 |
2021届硕士毕业生 | 桂毓灵 | -- |
2021届硕士毕业生 | 朋帆 | 中国邮政储蓄银行 |
2022届硕士毕业生 | 姚沈涛 | 科大讯飞 |
2023届硕士毕业生 | 郭义臣 | 中国移动 |
2023届博士毕业生 | 宋培培 | 中国科学技术大学 |
2022届博士毕业生 | 李坤 | - |
2023届博士毕业生 | 周金星 | - |
2023届博士毕业生 | 王辉 | - |
2023届硕士毕业生 | 卢天一 | - |
会议论文:
期刊论文:
授权专利:
立项时间 | 项目名称 | 项目层次 | 项目组成员 |
---|---|---|---|
2022年 | 基于视觉环境感知的视障人士出行导航系统 | 国家级 | 谷纪豪、肖同欢、宋万强、黄滨 |
2022年 | 基于视觉-语言理解的智能室内机器人导航系统 | 省级 | 李家秀、卫天翼、蔡景宜、赵凌霄、费文轩 |
2021年 | 基于多分类目标检测的全自动家居清洗设备 | 校级 | 何梓贻、罗匡、徐梓鑫、倪友炜、马嘉淇 |
2021年 | 基于PyramidBox-Lite模型的口罩识别检测系统 | 校级 | 梁云、付守宇、付泓菁、李跃强、秦崇昀 |
2020年 | 基于人群计数技术的大型超市优化管理系统 | 省级 | 曾纪勇、李泓博、张振兴、银鑫、刘经诚 |
2020年 | 基于场景文字识别的图书检索AI系统 | 校级 | 陈鸿、陈国良、郭志俊、李利艳 |
2019年 | 基于表情识别的课堂质量评判系统 | 校级 | 恽郅、弋绮、万德阳、杨光正奥、马欣 |
2018年 | “今日食堂”--打造高校智能食堂2.0 | 省级 | 朱航延、王家辉、张方勇、刘志远、李文琪 |