关于

Agent Reinforcement Trainer: train multi-step agents for real-world tasks using GRPO. Give your agents on-the-job training. Reinforcement learning for Qwen2.5, Qwen3, Llama, Kimi, and more!

art.openpipe.ai

大语言模型 lora reinforcement-learning agent agentic-ai grpo rl kimi-ai qwen qwen3

创建时间

2025-03-10

是否国产

否

语言

Python91.9%
Jupyter Notebook7.8%
Shell0.3%

该仓库已收录但尚未编辑。项目介绍及使用教程请前往 GitHub 阅读 README

0 条讨论

登录后发表评论

OpenPipe 的其他开源项目

OpenPipe

@OpenPipe

#大语言模型#Turn expensive prompts into cheap fine-tuned models

人工智能大语言模型 llmops prompt-engineering

TypeScript2.67 k

1 年前

OpenPipe / ART

关于

创建时间

是否国产

修改时间

语言

0 条讨论

OpenPipe 的其他开源项目

OpenPipe / ART

关于

创建时间

是否国产

修改时间

语言

自述文件

0 条讨论

OpenPipe 的其他开源项目