offline-reinforcement-learning

High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC

d4rl gym offline-reinforcement-learning reinforcement-learning

Python 1.26 k

2 年前

ikostrikov / jaxrl

#计算机科学#JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

深度学习 deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym offline-reinforcement-learning

Jupyter Notebook 713

3 年前

yihaosun1124 / OfflineRL-Kit

#计算机科学#An elegant PyTorch offline reinforcement learning library for researchers.

深度学习 deep-reinforcement-learning PyTorch reinforcement-learning offline-reinforcement-learning

Python 358

2 个月前

Allenpandas / Reinforcement-Learning-Papers

📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.

deep-reinforcement-learning reinforcement-learning dqn imitation-learning multi-agent-reinforcement-learning policy-gradient q-learning 人工智能 aaai icml neurips offline-reinforcement-learning

336

1 年前

Cryolite / kanachan

#计算机科学#A Japanese (Riichi) Mahjong AI Framework

mahjong riichi-mahjong majsoul 机器学习 game-ai reinforcement-learning 深度学习 deep-reinforcement-learning transformers transformer imitation-learning offline-reinforcement-learning dqn

Python 320

7 个月前

nikhilbarhate99 / min-decision-transformer

#计算机科学#Minimal implementation of Decision Transformer: Reinforcement Learning via Sequence Modeling in PyTorch for mujoco control tasks in OpenAI gym

reinforcement-learning deep-reinforcement-learning 深度学习 offline-reinforcement-learning PyTorch pytorch-transformers transformer 机器学习 openai-gym mujoco Robotics

Python 279

3 年前

polixir / OfflineRL

A collection of offline reinforcement learning algorithms.

offline-reinforcement-learning reinforcement-learning

Python 196

10 个月前

instadeepai / og-marl

Datasets with baselines for Offline MARL.

multi-agent-reinforcement-learning reinforcement-learning offline-reinforcement-learning

Python 178

21 天前

nissymori / JAX-CORL

Clean single-file implementation of offline RL algorithms in JAX

jax single-file flax cql reinforcement-learning d4rl offline-reinforcement-learning

Python 152

9 个月前

silverwingsbot / EasyCarla-RL

A simple and easy-to-use autonomous driving environment for reinforcement learning, based on the CARLA simulator.

autonomous-driving autonomous-vehicles carla carla-simulator gym offline-reinforcement-learning reinforcement-learning rl self-driving decision-making

Python 151

4 个月前

BY571 / CQL

#计算机科学#PyTorch implementation of the Offline Reinforcement Learning algorithm CQL. Includes the versions DQN-CQL and SAC-CQL for discrete and continuous action spaces.

reinforcement-learning-algorithms offline-reinforcement-learning dqn sac pytorch-implementation PyTorch 机器学习

Python 140

1 年前

polixir / NeoRL

Python interface for accessing the near real-world offline reinforcement learning (NeoRL) benchmark datasets

offline-reinforcement-learning

Python 124

10 个月前

ZhengyaoJiang / latentplan

Code release for Efficient Planning in a Compact Latent Action Space (ICLR2023) https://arxiv.org/abs/2208.10291.

model-based-reinforcement-learning offline-reinforcement-learning reinforcement-learning generative-model transformer

Python 109

2 年前

ZhengYinan-AIR / FISOR

[ICLR 2024] The official implementation of "Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model"

diffusion-models jax offline-reinforcement-learning imitation-learning reinforcement-learning

Python 108

7 个月前

EmptyJackson / unifloral

Unified Implementations of Offline Reinforcement Learning Algorithms

d4rl jax offline-reinforcement-learning flax wandb

Python 94

5 个月前

snu-mllab / EDAC

Official PyTorch implementation of "Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble" (NeurIPS'21)

offline-reinforcement-learning

Python 76

3 年前

DHDev0 / Stochastic-muzero

#计算机科学#Pytorch Implementation of Stochastic MuZero for gym environment. This algorithm is capable of supporting a wide range of action and observation spaces, including both discrete and continuous variation...

机器学习 offline-reinforcement-learning deep-reinforcement-learning gym-environments lstm monte-carlo-tree-search muzero PyTorch rl transformer multilayer-perceptron

Python 70

2 年前

ltlhuuu / PSEC

[ICLR 2025] The offical implementation of "PSEC: Skill Expansion and Composition in Parameter Space", a new framework designed to facilitate efficient and flexible skill expansion and composition, ite...

continual-learning decision-making fine-tuning large-language-models lora pretrained-models reinforcement-learning Robotics transfer-learning parameter-efficient-fine-tuning imitation-learning multi-objective-optimization offline-reinforcement-learning

Python 61

7 个月前