pik-gane Goto Github PK

repos: 26.0 gists: 0.0

Name: PIK GaNe

Type: Organization

Bio: FutureLab on Game Theory and Networks of Interacting Agents at the Potsdam Institute for Climate Impact Research

Location: Germany

Blog: https://www.pik-potsdam.de/en/institute/futurelabs/gane/futurelab-gane

PIK GaNe's Projects

agentmodels-satisfia

Modeling agents with probabilistic programs

ai-safety-gridworlds-satisfia

This is a suite of reinforcement learning environments illustrating various safety properties of intelligent agents.

alpaca_eval-collective

A validated automatic evaluator for instruction-following language models. High-quality, cheap, and fast.

alpaca_farm-collective

A simulation framework for RLHF and alternatives. Develop your RLHF method without collecting human data.

attainable-utility-preservation-satisfia

avoiding-side-effects-satisfia

Code for reproducing the results from the paper Avoiding Side Effects in Complex Environments

cleanrl-satisfia

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

decision-transformer-satisfia

Official codebase for Decision Transformer: Reinforcement Learning via Sequence Modeling.

minigrid-satisfia

Simple and easily configurable grid world environments for reinforcement learning

motabarnn

python package for torch-based neural network version of MoTaBaR

pref_voting

procgenaisc-satisfia

pymdptoolbox-satisfia

Markov Decision Process (MDP) Toolbox for Python

pyoptes

Python framework for optimization of epidemic testing strategies

pyresponsibility

quantify agents' degrees of moral responsibility in complex multi-agent decision situations

rl-inference-satisfia

Reinforcement Learning through Active Inference with additional safety measures

rl.pyro-satisfia

rl4lms_rlchf

A modular RL library to fine-tune language models to human preferences

satisfia

Satisficing-based Intelligent Agents

satisfia-marl

A repo to explore multi-agent reinforcement learning in the context of aspiration based, non-maximising agents. This project is part of the Supervised Program for Alignment Research.

stable-baselines3-contrib-satisfia

Contrib package for Stable-Baselines3 - Experimental reinforcement learning (RL) code

stable-baselines3-satisfia

PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.

train-procgen-pytorch-satisfia

Pytorch implementation on OpenAI's Procgen ppo-baseline, built from scratch.

tricl

TriCl model in C++

vodle

We develop an interactive, consensus-oriented group decision app

webppl-agents-satisfia

Webppl library for generating Gridworld MDPs. JS library for displaying Gridworld. Additional agents that satisfice.

pik-gane Goto Github PK

PIK GaNe's Projects

Recommend Projects

Recommend Topics

Recommend Org