11 19

Joseph Sanchez

wu-wenhao19

AI & ML interests

None yet

Recent Activity

upvoted a paper 8 days ago

Linearizing Vision Transformer with Test-Time Training

upvoted a paper 8 days ago

Value-Aware Stochastic KV Cache Eviction for Reasoning Models

liked a dataset 12 days ago

allenai/ai2_arc

View all activity

Organizations

None yet

upvoted 2 papers 8 days ago

Linearizing Vision Transformer with Test-Time Training

Paper • 2605.02772 • Published 15 days ago • 20

Value-Aware Stochastic KV Cache Eviction for Reasoning Models

Paper • 2606.03928 • Published 9 days ago • 8

liked a dataset 12 days ago

allenai/ai2_arc

Viewer • Updated Dec 21, 2023 • 7.79k • 484k • 355

liked a Space 13 days ago

ProtectBirds

🏃

346

Protect Birds

liked a model 17 days ago

openbmb/BitCPM-CANN-8B

Text Generation • Updated 19 days ago • 7.17k • 100

upvoted a paper 19 days ago

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Paper • 2605.21467 • Published 23 days ago • 204

liked a model 21 days ago

tencent/Hy-MT2-1.8B

Translation • 2B • Updated 17 days ago • 24.8k • • 1.11k

liked a dataset 21 days ago

fka/prompts.chat

Viewer • Updated about 21 hours ago • 1.87k • 27.6k • 9.74k

liked a model 22 days ago

mistralai/Mistral-7B-Instruct-v0.3

7B • Updated Dec 3, 2025 • 3.28M • 2.63k

liked a model 25 days ago

PeterPanonly/Qwen2.5-VL-3B-Instruct-Thinking-SubQ

Updated 24 days ago • 1

upvoted a paper 25 days ago

Learning to Foresee: Unveiling the Unlocking Efficiency of On-Policy Distillation

Paper • 2605.11739 • Published about 1 month ago • 59

upvoted a paper 27 days ago

CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence

Paper • 2605.12882 • Published about 1 month ago • 271

liked a model 29 days ago

FacebookAI/xlm-roberta-base

Fill-Mask • 0.3B • Updated Feb 19, 2024 • 19.2M • • 844

upvoted 2 papers about 1 month ago

SymptomAI: Towards a Conversational AI Agent for Everyday Symptom Assessment

Paper • 2605.04012 • Published May 5 • 11

Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers

Paper • 2605.06169 • Published May 7 • 233

liked a dataset about 1 month ago

jat-project/jat-dataset-tokenized

Viewer • Updated Dec 22, 2023 • 32M • 570k • 13

upvoted a paper about 1 month ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published Apr 30 • 218

liked 2 models about 2 months ago

rroshann/sec-sentiment-sftgrpo-deepseek-14b

Text Generation • 15B • Updated Apr 24 • 105 • • 1

kmseong/llama2_7b_base-gsm8k_lora_ft_lr3e-5

7B • Updated Apr 23 • 4 • 1

upvoted a paper about 2 months ago

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

Paper • 2604.20796 • Published Apr 22 • 243

Joseph Sanchez

AI & ML interests

Recent Activity

Organizations

wu-wenhao19's activity

ProtectBirds