Lumina-DiMOO: An open-source discrete multimodal diffusion model

2025-09-1211:45422synbol.github.io

Yi Xin1,2,5,♣ Qi Qin1,4,♣ Siqi Luo1,3 Kaiwen Zhu1,3 Juncheng Yan1,7 Yan Tai3 Jiayi Lei1,3 Yuewen Cao1 Yuandong Pu1,3 Dengyang Jiang1 Le Zhuo1,6 Shenglong Ye1 Ming Hu1

Show article

Yi Xin^1,2,5,♣ Qi Qin^1,4,♣ Siqi Luo^1,3 Kaiwen Zhu^1,3 Juncheng Yan^1,7 Yan Tai³ Jiayi Lei^1,3 Yuewen Cao¹ Yuandong Pu^1,3 Dengyang Jiang¹ Le Zhuo^1,6 Shenglong Ye¹ Ming Hu¹ Junjun He¹ Bo Zhang¹ Gen Luo¹ Chang Xu⁴ Wenhai Wang¹ Hongsheng Li^1,6 Guangtao Zhai^1,3 Tianfan Xue^6,1
Bin Fu^1,† Xiaohong Liu^3,2,† Yu Qiao^1,† Yihao Liu^1,†

(♣ Equal Contributions, † Corresponding Authors)

¹ Shanghai AI Laboratory ² Shanghai Innovation Institute ³ Shanghai Jiao Tong University ⁴ The University of Sydney
⁵ Nanjing University ⁶ The Chinese University of Hong Kong ⁷ Tsinghua University ‌

Technical Report (Coming Soon) Code Model