Depth Anything 3(DA3) ylc3000 2025-11-16 0 浏览 0 点赞 resource Depth Anything 3(DA3)最新发布,实现了人类般的空间感知能力,支持单目、任意视角多图及视频的深度估计。 DA3的核心突破在于极简设计: - 采用普通Transformer架构(如vanilla DINO),无需复杂网络结构 - 用单条深度射线表征深度,避免繁琐的3D任务 开发团队推出了三条模型系列:主力DA3系列、单目绝对深度估计系列、单目相对深度估计系列。 在视觉几何基准测试中,DA3横扫相机位姿估计、任意视角几何重建(TSDF)和视觉渲染等10项任务,平均提升相机位姿精度35.7%、几何精度23.6%,全面超越前沿方法VGGT和Depth Anything V2。 DA3具备多项应用潜力: - 大规模场景SLAM:显著减少漂移,速度和精度均优于COLMAP,极大提升SLAM效率 - 前馈高斯点云渲染:冻结主干、训练DPT头部预测3DGS参数,实现强泛化的新视角合成 - 多摄像头空间感知:结合车辆多视角图像,生成稳定融合的深度图,助力自动驾驶和机器人感知升级 这代表了深度估计从单目到任意视角的质变,推动视觉空间理解向更自然、更广泛的应用迈进。DA3简洁却强大,彰显了“少即是多”的设计哲学。 网闻录 Depth Anything 3(DA3) 网闻录 Depth Anything 3(DA3) 网闻录 Depth Anything 3(DA3)