校园经纬

当前位置: 新闻网首页 >> 校园经纬 >> 正文

浙理工×浙大4D体积视频技术亮相国际顶会

发布时间:2025-05-16 作者与来源:计算机科学与技术学院(人工智能学院)  浏览次数:

近日,浙江理工大学与浙江大学联合研究团队在4D动态场景重建与体积视频呈现领域取得了关键突破,提出了一种基于场景运动层次化表达的四维高斯溅射方法(4D Gaussian Videos with Motion Layering),有效提升了4D场景内容的建模精度,并实现了制作的体积视频高效流式传输与在线播放。该项研究成果已成功入选国际计算机图形学顶级会议SIGGRAPH 2025及被期刊ACM Transaction of Graphics(TOG)收录。研究工作由浙江大学许威威教授领衔开展,浙江理工大学计算机科学与技术学院(人工智能学院)特聘研究员董政参与合作指导。

运动场景层次化体积视频方法,重建的1s视频仅占1.7 MB空间

体积视频(Volumetric Video)被誉为下一代沉浸式媒体的关键支撑技术,但因其“高存储、高带宽”的天然“体量”,一直难以应用于寻常场景。此次浙大×浙理工团队提出的新方案,将四维高斯点云作为动态场景的表达核心,并引入了“视频分组,动静分层”的建模思路—将整个视频拆分成一组组由静态与动态点云构成的高斯点组(Group of Gaussians),让时空表达更有条理也更高效,便于在时间轴上实现分段式建模。

其中,静态点云像是背景中的“稳定角色”,可以在多个片段中复用,不仅节省资源,也让场景结构更统一;而动态点云则随着时间灵活“变身”,通过其属性随时间偏移的方式灵活表达变化动作,既提升了运动细节的表现力,又增强了整体的时序一致性。这个“动静分明”的分组策略,为体积视频的轻量化表达打开了新思路。

体积视频移动端实时在线播放

在“看得清、传得动”这件事上,研究团队也做了功课—他们提出了一套对高斯属性的量化方案,并巧妙融合了H.265视频压缩标准,对动态点云的偏移进行高效编码。说人话就是:既减小了文件“体重”,又保证了运动部分的画质。

实测数据显示,在常见的40Mbps带宽网络条件下,该技术不仅能实现高质量的体积视频流式传输,还能支持多终端、跨设备的实时在线播放。这项技术也为大众视野广域网环境下的沉浸式通信、数字文旅直播等内容提供了可行的技术路径。

国际时装技术学院“万物呢喃”毕业设计联展亮相

模拟人眼双目视点渲染,微晶贴膜的3D屏呈现效果

除了“卷技术”,这项成果在应用上也已精彩亮相!5月8日晚,在浙江理工大学马兰戈尼时尚设计学院(国际时装技术学院)举办的2025届毕业设计联展“万物呢喃”中,团队的体积视频技术首次亮相“秀场”,引得关注。

此次展示由计算机科学与技术学院(人工智能学院)与国际时装技术学院联合策划,项目将前沿的体积视频技术深度融合于数字化走秀之中,借助高精度四维重建与模拟人眼双目视点的渲染技术,配合微晶贴膜3D屏幕与3D眼镜呈现真实空间感,为现场观众打造了一场沉浸式、多视角的科技时尚体验。一场“技术+设计”的跨界合作,让秀场不止于视觉,更是一次走进未来的体验之旅。