trl

Reinforcement Learning·infrastructure·open·#139 of 884·+3·Rising

82.0

Strong

High confidence

Website GitHub

Train transformer language models with reinforcement learning (PPO, DPO, GRPO).

Pillar Breakdown

Adoption

35%

86.9

Maintenance

30%

84.0

Friction

20%

98.2

Ecosystem

15%

62.3

Momentum

0.48Rising

7d change -0.28

High confidence

In Reinforcement Learning

Ranked #1 of 32

1trl

82.0

2Stable Baselines3

78.8

3gym

78.8

4dopamine

77.6

5Gymnasium

75.3

6ROLL

75.2

7rl

74.8

8acme

73.8

See all 32 in Reinforcement Learning →

Similar Tools

Stable Baselines3

Reinforcement Learning

78.8

gym

Reinforcement Learning

78.8

dopamine

Reinforcement Learning

77.6

Gymnasium

Reinforcement Learning

75.3