3 35

Tianwei Xiong

YuuTennYi

https://github.com/SilentView

AI & ML interests

None yet

Recent Activity

upvoted a paper 15 days ago

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

upvoted a paper about 1 month ago

MultiWorld: Scalable Multi-Agent Multi-View Video World Models

upvoted a paper about 2 months ago

MACRO: Advancing Multi-Reference Image Generation with Structured Long-Context Data

View all activity

Organizations

upvoted a paper 15 days ago

PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World

Paper • 2605.05163 • Published 16 days ago • 37

upvoted a paper about 1 month ago

MultiWorld: Scalable Multi-Agent Multi-View Video World Models

Paper • 2604.18564 • Published Apr 20 • 46

upvoted a paper about 2 months ago

MACRO: Advancing Multi-Reference Image Generation with Structured Long-Context Data

Paper • 2603.25319 • Published Mar 26 • 32

upvoted a paper 2 months ago

Cubic Discrete Diffusion: Discrete Visual Generation on High-Dimensional Representation Tokens

Paper • 2603.19232 • Published Mar 19 • 33

authored a paper 2 months ago

EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation

Paper • 2603.12267 • Published Mar 12 • 13

updated a model 2 months ago

YuuTennYi/EVATok

Updated Mar 13

upvoted a paper 2 months ago

EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation

Paper • 2603.12267 • Published Mar 12 • 13

submitted a paper to Daily Papers 2 months ago

EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation

Paper • 2603.12267 • Published Mar 12 • 13

commented a paper 2 months ago

EVATok: Adaptive Length Video Tokenization for Efficient Visual Autoregressive Generation

Paper • 2603.12267 • Published Mar 12 • 13 •

upvoted a paper 3 months ago

Helios: Real Real-Time Long Video Generation Model

Paper • 2603.04379 • Published Mar 4 • 187

published a model 3 months ago

YuuTennYi/EVATok

Updated Mar 13

upvoted a paper 5 months ago

Ground Slow, Move Fast: A Dual-System Foundation Model for Generalizable Vision-and-Language Navigation

Paper • 2512.08186 • Published Dec 9, 2025 • 23

updated a model 5 months ago

YuuTennYi/GigaTok

Updated Dec 9, 2025

published a model 6 months ago

YuuTennYi/GigaTok

Updated Dec 9, 2025

upvoted 4 papers 7 months ago

Emu3.5: Native Multimodal Models are World Learners

Paper • 2510.26583 • Published Oct 30, 2025 • 115

OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes

Paper • 2510.26800 • Published Oct 30, 2025 • 22

Diffusion Transformers with Representation Autoencoders

Paper • 2510.11690 • Published Oct 13, 2025 • 170

CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images

Paper • 2510.11718 • Published Oct 13, 2025 • 14

upvoted a paper 9 months ago

T2I-ReasonBench: Benchmarking Reasoning-Informed Text-to-Image Generation

Paper • 2508.17472 • Published Aug 24, 2025 • 26

upvoted a paper 11 months ago

StreamVLN: Streaming Vision-and-Language Navigation via SlowFast Context Modeling

Paper • 2507.05240 • Published Jul 7, 2025 • 48

Tianwei Xiong

AI & ML interests

Recent Activity

Organizations

YuuTennYi's activity