搜索结果: 1-15 共查到“CVPR”相关记录27条 . 查询时间(0.043 秒)

2025年来,潜在扩散模型(LDMs)的发展推动了音乐生成领域的创新,使视频配乐在灵活性和多模态融合方面取得了显著突破。然而,现有方法大多采用两阶段流程,难以全面捕捉视频的声音特征,尤其在复杂视频场景下,难以同时呈现准确的音效细节和丰富的音乐情感氛围。为解决上述挑战,我们提出了一种创新性的视频配乐生成框架(C3GVS),能够同步生成与参考视频相匹配的音乐和音效。为此,我们设计了一种基于扩散模型的频...


2024年4月16日,世界模型的概念引发了广泛关注。我们首次提出了一种名为Drive-WM的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。Drive-WM模型通过多视图世界模型,能够想象不同规划路线的未来情景,并根据视觉预测获取相应的奖惩反馈,从而优化当前的路线选择,为自动驾驶系统的安全提供了保障。Drive-WM是与现有端到端规划模型兼容的第一个驾驶世界模型。通过视图因子分解促进的联合...

2024年4月16日,世界模型的概念引发了广泛关注。我们首次提出了一种名为Drive-WM的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。Drive-WM模型通过多视图世界模型,能够想象不同规划路线的未来情景,并根据视觉预测获取相应的奖惩反馈,从而优化当前的路线选择,为自动驾驶系统的安全提供了保障。Drive-WM是与现有端到端规划模型兼容的第一个驾驶世界模型。通过视图因子分解促进的联合...

中国科学院合肥物质科学研究院计算机视觉顶会CVPR收录科学岛团队最新合作成果(图)
计算机 仿生 智能
2024/5/17
2024年3月20日,中国科学院合肥物质院智能所仿生智能技术研究中心黄炫和韦虎课题组与中国科学技术大学、中国矿业大学与清华大学部分课题组合作完成的文章“Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring”被计算机视觉和模式识别领域的顶级会议Confer...





东北大学信息科学与工程学院魏颖教授团队的论文被计算机视觉顶级会议(CVPR)录用
魏颖 计算机视觉 图像处理
2023/4/10
近日,由东北大学信息科学与工程学院魏颖教授作为通讯作者、共同第一作者为东北大学信息科学与工程学院2022级直博生马帅磊和2021级硕士生王越峰的研究成果《CAT:Localization and Identification Cascade Detection Transformer for Open-World Object Detection》被CVPR 2023(The IEEE/CVF C...

