视觉感知计算是国家公共安全、互联网内容监管、智能设备等领域的核心共性技术。在监控视频、互联网视频等开放环境中,应用场景的复杂性和多样性导致智能感知计算系统性能急剧下。在开放环境中准确及时地发现异常和敏感元素,是反恐防暴、应急响应和净化网络环境的核心需求,迫切需要精准高效的视觉感知计算技术,我国在“中长期发展规划”、“十三五规划”、“公共安全科技规划”等一系列战略中进行了全面布局。现有技术在开放环境下面临复杂对象“认不准”、多域环境“学不全”、海量数据“算不快”的挑战,亟需在核心算法、关键技术和应用系统实现源头创新,打造公共安全的利器,并推动了视频和智能设备行业的进步。
在国家重点研发计划、国家自然科学基金等项目支持下,开展了开放环境自适应视觉感知计算关键技术与应用研究,发明了多尺度融合对象检测技术、多领域弱监督自适应识别技术、深度模型压缩加速技术,研制了面向公共安全、互联网监管和智能设备的视觉感知计算平台。
1、针对开放环境对象复杂、尺度变化大带来的精准检测追踪难题,提出
了一种多尺度深度特征学习新模式,建立了复杂空间多尺度融合模型,提出了跨尺度多线索信息融合的检测追踪方法,实现了监控视频等开放环境下对象的精准检测追踪,相关模型与算法应用于智能摄像头等系列安防产品中。
2、针对开放环境视频中对象类别多样、标注杂乱、场景多变带来的跨领
域语义识别难题,建立了数据域的类别间样本迁移学习模型,提出了标注域的鲁棒深度学习方法,实现了互联网视频、监控场景开放环境跨领域语义理解模型的自适应高效构建和鲁棒识别,标注效率和抗噪能力显著提升,模型与算法应用于视频大数据研判服务器及短视频辅助审核系统,在 MS-COCO2016 等国际权威竞赛中排名第一。
1 丁贵广 男 *** 副教授 博士 清华大学
负责整个项目研发;主导开放环境多尺度检测追踪技术、跨领域自适应语义识别技术、深度模型压缩加速技术创新和系统研发
2 颜成钢 男 *** 研究员 博士
杭州电子科技大学
主导了跨尺度特征融合的检测追踪模型、全局式增强学习识别技术的创新
3 郭雨晨 男 ***
助理研究员博士 清华大学
主导了以样本迁移为核心的多领域知识迁移方法、深度置信网络
鲁棒学习模型、非对称深度学习原理,逼近无损模型压缩压缩加速技术的创新
4 张志伟 男 ***
中级工程师硕士
北京达佳互联信息技术有限公司
组织了集成项目技术的互联网内容智能审核系统研发和深度模型压缩加速引擎的研发,及其在互联网内容监管领域的应用和推广
5 敖乃翔 男 ***
高级工程师博士
新疆联海创智信息科技有限公司
组织了集成项目技术的高清视频监控系统与智能分析平台研发,及其在公共安全领域、新疆反恐防暴建设中的应用和推广
评价单位:- (-)
评价时间:2023-05-06
综合评价
本技术能实现很好的社会效益, 建议推广。
查看更多>