shirwu
/

reward_model_train_debug

4-bit precision

Model card Files Files and versions

reward_model_train_debug

2.27 GB

1 contributor

History: 22 commits

shirwu's picture

Training in progress, step 1

bc0885e verified 11 months ago