Enhancing reinforcement learning with dense rewards from language model critic

Jan 1, 2024·

Meng Cao

,

Lei Shu

,

Lei Yu

,

Yun Zhu

,

Nevan Wichers

,

Yinxiao Liu

,

Lei Meng

· 0 min read

Type

Conference paper

Publication

Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing

Last updated on Jan 1, 2024

← Emergence of a high-dimensional abstraction phase in language transformers Jan 1, 2024

Functional faithfulness in the wild: Circuit discovery with differentiable computation graph pruning Jan 1, 2024 →