Bio
Papers
News
Experience

Recent & Upcoming Talks
- Example Talk
Publications
Projects
Blog
Projects
Teaching
- Learn JavaScript
- Learn Python
Work Experience

Drlc: Reinforcement learning with dense rewards from llm critic

Jan 1, 2024·

Meng Cao

,

Lei Shu

,

Lei Yu

,

Yun Zhu

,

Nevan Wichers

,

Yinxiao Liu

,

Lei Meng

· 0 min read

Type

Journal article

Publication

arXiv e-prints

Last updated on Jan 1, 2024

← Beyond Sparse Rewards: Enhancing Reinforcement Learning with Language Model Critique in Text Generation Jan 1, 2024

Emergence of a high-dimensional abstraction phase in language transformers Jan 1, 2024 →

© 2026 Me. This work is licensed under CC BY NC ND 4.0

Published with Hugo Blox Builder — the free, open source website builder that empowers creators.