英伟达 PiD:潜在表征直达4K,生成式Decoder重写文生图最后一步

Type: article
Author: 英伟达 Spatial Intelligence Lab
Primary Topic: 行业动态
Ingested: 2026-06-12

Summary

英伟达提出 PiD(Pixel Diffusion Decoder),将 VAE 解码步骤改造为条件像素扩散过程,使文生图流水线能够直接从低分辨率 latent 生成 2K/4K 高质量图像。相比传统「解码+超分」级联管线,PiD 在 GB200 上实现 211ms 的 2K 解码速度,比同类扩散超分方案快 3~6 倍,4K 解码峰值显存仅约 22.5GB。该技术已验证适配 FLUX、SDXL、SD3 等多种主流模型,有望重写高分辨率图像生成的技术范式。

Key Concepts

Entities

Source

Relations


Auto-generated on 2026-06-12