EachPod

Alignment Newsletter #106: Evaluating generalization ability of learned reward models

Author: Robert Miles
Published: Wed 01 Jul 2020
Episode Link: https://alignment-newsletter.libsyn.com/alignment-newsletter-106

Recorded by Robert Miles

More information about the newsletter here

Share to: