Unchun Yang

ucyang

·

https://ucyang.com/

AI & ML interests

None yet

Recent Activity

liked a model 1 day ago

baidu/Unlimited-OCR

liked a dataset 1 day ago

Glint-Research/Fable-5-traces

liked a model 1 day ago

nvidia/GLM-5.2-NVFP4

View all activity

Organizations

upvoted a collection 10 days ago

Laguna M.1

Our most capable model to date, designed for long-horizon work. Apache 2.0. • 4 items • Updated about 7 hours ago • 17

upvoted a collection 12 days ago

GLM-5.2

2 items • Updated 13 days ago • 50

upvoted an article 12 days ago

Article

GLM-5.2: Built for Long-Horizon Tasks

zai-org

•

12 days ago

• 110

upvoted a paper 14 days ago

MSA: Memory Sparse Attention for Efficient End-to-End Memory Model Scaling to 100M Tokens

Paper • 2603.23516 • Published Mar 6 • 53

upvoted a collection 14 days ago

MiniMax-M3

3 items • Updated 13 days ago • 8

upvoted 2 articles 15 days ago

Article

Profiling in PyTorch (Part 2): From nn.Linear to a Fused MLP

+3

ariG23498, ror, sergiopaniego, pcuenq, sayakpaul

•

19 days ago

• 50

Article

How to Fine-Tune Nemotron 3.5 ASR for Your Language, Domain, or Accent

nvidia

•

25 days ago

• 66

upvoted a collection 16 days ago

Supra-1.5-50M

All Supra-1.5-50M models • 4 items • Updated 5 days ago • 8

upvoted a paper 17 days ago

MiniMax Sparse Attention

Paper • 2606.13392 • Published 19 days ago • 149

upvoted a collection 18 days ago

PP-OCRv6

From 1.5M to 34.5M Parameters, Surpassing Billion-Scale VLMs on OCR Tasks • 19 items • Updated 14 days ago • 98

upvoted an article 18 days ago

Article

Introducing North Mini Code: Cohere’s First Model For Developers

CohereLabs

•

20 days ago

• 78

upvoted a paper 18 days ago

FlashMemory-DeepSeek-V4: Lightning Index Ultra-Long Context via Lookahead Sparse Attention

Paper • 2606.09079 • Published 22 days ago • 64

upvoted a collection 18 days ago

Zamba2-VL

A suite of vision-language models based on Zamba2. • 3 items • Updated 21 days ago • 5

upvoted 3 collections 19 days ago

DiffusionGemma

1 item • Updated 19 days ago • 54

Gemma 4 QAT Q4_0

19 items • Updated 24 days ago • 139

Gemma 4 QAT Mobile

4 items • Updated 24 days ago • 45

upvoted a paper 19 days ago

Multi-Faceted Interactivity Alignment in Full-Duplex Speech Models

Paper • 2606.11167 • Published 20 days ago • 5

upvoted a collection 19 days ago

Interactivity Alignment

Full-duplex speech models post-trained with reinforcement learning for improved conversational interactivity. • 4 items • Updated 19 days ago • 6

upvoted a paper 19 days ago

Self-Evolving Vision-Language Models for Image Quality Assessment via Voting and Ranking

Paper • 2509.25787 • Published Jan 27 • 3

upvoted a paper 24 days ago

Audio Interaction Model

Paper • 2606.05121 • Published 27 days ago • 121