soft-actor-critic

#计算机科学#Softlearning is a reinforcement learning framework for training maximum entropy policies in continuous domains. Includes the official implementation of the Soft Actor-Critic algorithm.

reinforcement-learning soft-actor-critic 深度学习 deep-reinforcement-learning 深度神经网络机器学习

Python 1.34 k

2 年前

quantumiracle / Popular-RL-Algorithms

PyTorch implementation of Soft Actor-Critic (SAC), Twin Delayed DDPG (TD3), Actor-Critic (AC/A2C), Proximal Policy Optimization (PPO), QT-Opt, PointNet..

reinforcement-learning soft-actor-critic state-of-the-art

Jupyter Notebook 1.28 k

6 个月前

Rafael1s / Deep-Reinforcement-Learning-Algorithms

32 projects in the framework of Deep Reinforcement Learning algorithms: Q-learning, DQN, PPO, DDPG, TD3, SAC, A2C and others. Each project is provided with a detailed training log.

dqn td3 deep-reinforcement-learning sac ddpg ppo a2c soft-actor-critic

Jupyter Notebook 940

4 年前

pranz24 / pytorch-soft-actor-critic

PyTorch implementation of soft actor critic

pytorch-implmention PyTorch reinforcement-learning deep-reinforcement-learning soft-actor-critic

Python 905

2 个月前

ikostrikov / jaxrl

#计算机科学#JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

深度学习 deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym offline-reinforcement-learning

Jupyter Notebook 713

3 年前

TianhongDai / reinforcement-learning-algorithms

#算法刷题#This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are st...

deep-reinforcement-learning ddpg ppo proximal-policy-optimization 深度学习 actor-critic 算法 dqn flappy-bird a2c atari2600 dueling-dqn PyTorch soft-actor-critic sac

Python 683

5 年前

cpnota / autonomous-learning-library

A PyTorch library for building deep reinforcement learning agents.

reinforcement-learning reinforcement-learning-algorithms deep-reinforcement-learning soft-actor-critic proximal-policy-optimization deep-q-learning advantage-actor-critic deep-deterministic-policy-gradient sac a2c ddpg ppo dqn dqn-pytorch

Python 651

1 年前

trackmania-rl / tmrl

Reinforcement Learning for real-time applications - host of the TrackMania Roborace League

reinforcement-learning PyTorch self-driving-car soft-actor-critic

Python 626

23 天前

denisyarats / pytorch_sac

#计算机科学#PyTorch implementation of Soft Actor-Critic (SAC)

reinforcement-learning dm-control soft-actor-critic PyTorch deep-reinforcement-learning actor-critic mujoco gym 深度学习 sac continuous-control

Jupyter Notebook 558

4 年前

zhaohaojie1998 / DRL-for-Path-Planning

深度强化学习路径规划, SAC-Auto路径规划, Soft Actor-Critic算法, SAC-pytorch，激光雷达Lidar避障，激光雷达仿真模拟，Adaptive-SAC

gym-environment path-planning sac soft-actor-critic lidar

Python 430

1 年前

MishaLaskin / rad

#计算机科学#RAD: Reinforcement Learning with Augmented Data

reinforcement-learning rl 深度学习 dm-control rad codebase deep-reinforcement-learning 深度神经网络 deep-q-learning deep-q-network deeplearning-ai soft-actor-critic sac ppo

Jupyter Notebook 411

4 年前

zuoxingdong / lagom

#计算机科学#lagom: A PyTorch infrastructure for rapid prototyping of reinforcement learning algorithms.

reinforcement-learning PyTorch 机器学习 Python research 深度学习人工智能 policy-gradient evolution-strategies deep-reinforcement-learning deep-deterministic-policy-gradient ddpg td3 soft-actor-critic mujoco proximal-policy-optimization ppo sac

Jupyter Notebook 377

3 年前

RITCHIEHuang / DeepRL_Algorithms

DeepRL algorithms implementation easy for understanding and reading with Pytorch and Tensorflow 2(DQN, REINFORCE, VPG, A2C, TRPO, PPO, DDPG, TD3, SAC)

reinforcement-learning-algorithms pytorch-implementation deep-reinforcement-learning dqn ppo mujoco policy-gradient tensorflow2 td3 pytorch-rl soft-actor-critic

Python 341

2 年前

BY571 / Soft-Actor-Critic-and-Extensions

PyTorch implementation of Soft-Actor-Critic and Prioritized Experience Replay (PER) + Emphasizing Recent Experience (ERE) + Munchausen RL + D2RL and parallel Environments.

reinforcement-learning reinforcement-learning-algorithms soft-actor-critic sac PyTorch actor-critic-algorithm parallel-computing

Python 291

5 年前