
tech
OpenAI dévoile Evolved Policy Gradients, une méthode innovante de méta-apprentissage pour agents intelligents
OpenAI présente Evolved Policy Gradients, une technique expérimentale qui fait évoluer la fonction de perte des agents d'apprentissage pour accélérer leur adaptation à de nouvelles tâches. Cette avancée permet notamment de réussir des tâches hors du cadre d'entraînement initial.
5 min
18 mai · 01h21