Reinforcement Learning

Improve Generated Adversarial Imitation Learning with Reward Variance Regularization
Yi-Feng Zhang (State Key Laboratory of Novel Software Technology, Nanjing University)*; Fan-Ming Luo (Nanjing University); Yang Yu (Nanjing University)
Cautious Actor-Critic
lingwei zhu (NAIST)*; Toshinori Kitamura (NAIST); Takamitsu Matsubara (NAIST)
Geometric Value Iteration: Dynamic Error-Aware KL Regularization for Reinforcement Learning
Toshinori Kitamura (NAIST)*; lingwei zhu (NAIST); Takamitsu Matsubara (NAIST)
Robust Model-based Reinforcement Learning for Autonomous Greenhouse Control
Wanpeng Zhang (Tsinghua University)*; Xiaoyan Cao (Xiamen University); Yao Yao (Tsinghua-Berkeley Shenzhen Institute, Tsinghua Shenzhen International Graduate School, Tsinghua University); Zhicheng An (Tsinghua-Berkeley Shenzhen Institute, Tsinghua Shenzhen International Graduate School, Tsinghua University); Dijun Luo (Tencent); Xi Xiao (Tsinghua University)
Modeling Risky Choices in Unknown Environments
Ville Tanskanen (University of Helsinki)*; Chang Rajani (University of Helsinki); Homayun Afrabandpey (Nokia); Aini Putkonen (Aalto University); Aurélien Nioche (Aalto University); Arto Klami (University of Helsinki)
Multi-task Actor-Critic with Knowledge Transfer via a Shared Critic
Gengzhi Zhang (ChongQing University); Yaqing Hou (Dalian University of Technology); Liang Feng (Chongqing University, China)*
Learning to Switch Optimizers for Quadratic Programming
Grant E Getzelman (Argonne National Lab)*; Prasanna Balaprakash (Argonne National Laboratory)