5月27日下午,应湖南师范大学信息科学与工程学院、智能计算与语言信息处理湖南省重点实验室邀请,复旦大学计算机科学技术学院陈智能教授进行了主题为“视觉与语言协同的场景文本识别”的学术报告。本次报告由信息科学与工程学院肖林副院长主持,科研办组织召开,2022级和2023级研究生及相关老师参加。
本次报告的内容围绕着“场景文本识别”展开,这一领域在深度学习时代取得了长足发展。场景文本识别旨在识别自然场景中拍摄的文本图像,将其中的文字区域转化为计算机可读取和编辑的符号。这一技术在图像搜索、拍照识别、自动驾驶等诸多任务中得到了广泛应用,具有重要意义。陈老师在报告中详细介绍了场景文本识别方法从单纯利用字符级视觉特征,到利用文本行视觉特征,再到视觉和语言联合建模的发展演进过程,并分享了自己在该领域的研究进展。他的报告不仅对听众构建了场景文本识别领域的技术概貌,更引发了与会者对该领域未来发展的热烈讨论。
报告结束后,陈教授与同学们就场景文本识别技术的前沿问题展开了深入的讨论,为相关领域的研究和实践提供了宝贵的思路和启发。陈老师的报告为信息学院的学生们打开了一扇全新的窗户,使他们更加深入地了解了文本识别技术的最新进展,相信这些知识和启发将为他们未来的学习和研究之路指明方向。
主讲人简介:
陈智能博士,复旦大学计算机科学技术学院青年研究员、博士生导师,上海人工智能实验室双聘青年研究员,上海市智能视觉计算协同创新中心副主任,兼任上海市计算机学会多媒体专委会主任,中国图象图形学学会多媒体专委会委员、副秘书长,主要科研方向为多媒体分析与检索、计算机视觉、生物医疗图像分析。作为负责人已承担2项国家重点研发计划课题和4项国家自然科学基金项目,以及多项百度、腾讯、交通部公路院、软控等知名企事业单位的科研项目,所研发技术系统部署应用于国家相关部门和多个行业领先企业。在CVPR、ICCV IJCV AAAI、JCAI、ACM MM、计算机学报等国内外知名学术期刊和会议上发表论文80多篇。担任ACMMMAAAI等多个权威国际会议的领域主席、,高级程序委员等,以及TPAMI等多个知名国际期刊的审稿人。