清华电子院视觉智能与认知应用研究所成立
无论物理世界还是网络空间,视频都是信息传递和重构的最重要数据载体。基于视频要素理解和认知的AI技术蕴含巨大的社会及经济价值。当下以人脸识别为代表的CV技术虽有一定突破和应用落地,但离真正的认知智能尚有巨大差距,技术的瓶颈使得海量视频数据的价值无法释放。
为此,清华大学天津电子信息研究院(简称:清华电子院)基于清华大学电子工程系智能计算与自主系统研究中心的科研成果成立清视觉智能与认知应用研究所(以下简称:研究所)。2024年12月13日,在“清华大学 天津市科技成果对接会”上,清华大学电子工程系系主任、清华电子院院长汪玉正式为清华电子院视觉智能与认知应用研究所授牌。
谷光烨副所长(左五)代表研究所参加授牌仪式
研究所概况研究所致力于突破已有CV技术,以释放视频数据的社会价值及经济价值为己任,面向产业应用,聚焦场景难题,突破技术瓶颈,构建视觉智能技术的产、学、研、用体系,打造面向智慧城市和网络空间治理的新质生产力,目前设所长1人,副所长1人,研发及产业化团队共20人,另设有特聘专家组。
研究所研发方向研究所技术研发方向包括且不限于:
- 1)复杂环境下实现人、车、物识别和实时轨迹刻画的re-ID 2.0技术研发;
- 2)泛化目标识别及特定行为事件预警的多模态大模型技术;
- 3)基于网络多媒体数据理解和势态认知的多模态大模型技术;
- 4)基于视频认知和应用的Agent智能体研发;
- 5)具身智能视觉和感知能力的研发和智慧城市实践。
研究所视觉大模型框架
研究所主要成员谷光烨,研究所副所长,曾连续在中兴通讯、依图科技、瑞莱智慧等知名领军人工智能企业担任高管,并在以上公司成功主导人工智能技术产业落地,形成市场规模化效应,具备丰富的技术产业化、市场化经验。谷光烨是多个政府机构和公安系统的人工智能特聘专家,也是中国安防协会人工智能专家组专家,其参与的关键课题曾获得2022年度公安部科学技术奖一等奖。2023年依托清华大学成果创立北京清思智能科技有限公司,担任公司CEO,负责公司全面运营管理工作。
作为清华大学电子信息学科的成果转化基地,清华电子院高水平搭建了高端光电子芯片创新中心、超智融合创新中心、光电芯片检测中心、先进科技创新中心、医工转化创新中心、新一代融合通信及智慧城市创新中心等6个技术及应用平台,依托上述平台,以自建或与行业领军企业共建的方式建立一批专业化的研究机构,致力于开展有组织、以产业化为目标的应用研发,助力清华大学学科建设和地方产业聚集,目前累计成立研究机构36家。