📌 Marque-pages Pinboard

Tous (10897)‧Privés (0)‧Publics (10897)‧Non lus (243)‧Sans tag (318)

2 résultats (1-2 marque-pages affichés)

CS234: Reinforcement Learning Winter 2025

web.stanford.edu

OpenPipe/ART: Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen2.5, Qwen3, Llama, and more!

github.com

Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen2.5, Qwen3, Llama, and more! - OpenPipe/ART

📌 Marque-pages Pinboard

Tags (371)