Quentin Gallouédec's picture

Hiring 💼

Quentin Gallouédec PRO

qgallouedec

huggingface

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 4 hours ago

Learn Your Reference Model for Real Good Alignment

upvoted a paper 2 days ago

Nash Learning from Human Feedback

upvoted a paper 3 days ago

Language Models are Few-Shot Learners

View all activity

Organizations

upvoted a paper about 4 hours ago

Learn Your Reference Model for Real Good Alignment

Paper • 2404.09656 • Published Apr 15, 2024 • 90

upvoted a paper 2 days ago

Nash Learning from Human Feedback

Paper • 2312.00886 • Published Dec 1, 2023 • 18

upvoted a paper 3 days ago

Language Models are Few-Shot Learners

Paper • 2005.14165 • Published May 28, 2020 • 19

updated a Space 3 days ago

Qwen2.5 0.5B Instruct GRPO Catch

Track and visualize data sequences with interactive displays

published a Space 3 days ago

Qwen2.5 0.5B Instruct GRPO Catch

Track and visualize data sequences with interactive displays

updated a Space 3 days ago

Qwen2.5 0.5B Instruct GRPO Rollout

published a Space 3 days ago

Qwen2.5 0.5B Instruct GRPO Rollout

upvoted an article 4 days ago

Article

Nemotron 3 Nano \- A new Standard for Efficient, Open, and Intelligent Agentic Models

Dec 15, 2025

•

106

upvoted a paper 5 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

Paper • 2601.05242 • Published 11 days ago • 199

updated 3 datasets 7 days ago

hf-doc-build/doc-build

Updated about 4 hours ago • 1.2M • 16

hf-doc-build/doc-build-dev

Updated about 1 hour ago • 113k • 8

qgallouedec/deepmath-completions-logs

Viewer • Updated 7 days ago • 232 • 84 • 1

published a model 7 days ago

qgallouedec/qwen2-0.5b-deepmath-grpo

Updated 7 days ago

published a dataset 7 days ago

qgallouedec/deepmath-completions-logs

Viewer • Updated 7 days ago • 232 • 84 • 1

updated 2 datasets 7 days ago

hf-doc-build/doc-build-dev

Updated about 1 hour ago • 113k • 8

hf-doc-build/doc-build

Updated about 4 hours ago • 1.2M • 16

updated a Space 7 days ago

Trackio

Track and visualize data sequences with interactive displays

liked a Space 9 days ago

CircleCI Test Collection Helper Space

Query test results for a PR

updated 2 datasets 11 days ago

hf-doc-build/doc-build-dev

Updated about 1 hour ago • 113k • 8

hf-doc-build/doc-build

Updated about 4 hours ago • 1.2M • 16