Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
docs		docs
.gitignore		.gitignore
README.md		README.md

Repository files navigation

Trust Region Optimization for Large Language models (TROLL)

Project page and codebase for the paper TROLL: Trust Regions improve Reinforcement Learning for Large Language Models.

Code coming soon!

About

Trust Region Optimization for Large Language Models

Report repository

Releases

No releases published

Packages

No packages published