Root NationNouvellesActualités informatiquesOpenAI a appris à un bot à jouer à Minecraft en utilisant des vidéos en ligne

OpenAI a appris à un bot à jouer à Minecraft en utilisant des vidéos en ligne

-

ра Minecraft (son l'histoire décrit en détail Denis Koshelev) ne semble pas être un outil très important pour soutenir la recherche avancée dans le domaine de l'IA. Après tout, est-il important d'apprendre à une machine à jouer à un jeu bac à sable sorti il ​​y a plus de 10 ans ? Vous serez surpris, mais oui, et en témoignent les dernières recherches du laboratoire OpenAI, qui étudie le développement de l'intelligence artificielle.

OpenAI toujours concentré sur les réalisations IA et l'apprentissage automatique qui peut profiter à l'humanité. La société a récemment formé avec succès un robot pour jouer à Minecraft en utilisant plus de 70 2,9 heures de séquences de jeu (soit plus de 8 XNUMX jours, soit près de XNUMX ans, voire rien). Cette réalisation marque un pas de géant dans l'apprentissage automatique avancé utilisant l'observation et la simulation.

Puces AI

Le bot OpenAI est un excellent exemple du fonctionnement de l'apprentissage par simulation (également appelé « apprentissage supervisé »). Contrairement à l'apprentissage par renforcement, où un agent d'apprentissage est récompensé après avoir atteint un objectif par essais et erreurs, la simulation entraîne des réseaux de neurones à effectuer des tâches spécifiques en observant comment une personne les exécute. Dans ce cas, OpenAI a utilisé des vidéos et des didacticiels de gameplay existants pour permettre au bot d'exécuter des scénarios de jeu complexes qui auraient nécessité environ 24 XNUMX actions distinctes pour un joueur normal.

Intéressant aussi :

La formation par simulation nécessite que les données vidéo soient spécialement étiquetées pour fournir le contexte de l'action et du résultat, c'est-à-dire que IA pouvait comprendre quels boutons étaient enfoncés et quels mouvements étaient effectués. Mais une telle approche peut prendre du temps, ce qui se traduit par des ensembles de données disponibles limités.

Au lieu de faire travailler leurs muscles en effectuant un exercice d'étiquetage manuel des données à grande échelle, l'équipe de recherche d'OpenAI a utilisé une approche spéciale connue sous le nom de Video Pre-Training (VPT) pour augmenter le nombre de vidéos disponibles. Au départ, les chercheurs ont enregistré 2 XNUMX heures de jeu annotées Minecraft et l'a utilisé pour former l'agent à associer certaines actions à des résultats spécifiques à l'écran. Le modèle résultant a été utilisé pour générer automatiquement des étiquettes pour 70 XNUMX heures de contenu Minecraft précédemment non étiqueté disponible en ligne. Cela a donné au bot un ensemble de données beaucoup plus important à examiner et à simuler.

Intéressant aussi :

Cette étude démontre la valeur potentielle des référentiels vidéo accessibles tels que YouTube, en tant que ressource éducative pour l'IA. Les scientifiques de l'apprentissage automatique peuvent utiliser des vidéos accessibles et correctement étiquetées pour entraîner l'IA sur des tâches spécifiques, de la simple navigation sur le Web à l'aide aux utilisateurs ayant des besoins physiques dans la vie réelle.

Vous pouvez aider l'Ukraine à lutter contre les envahisseurs russes. La meilleure façon de le faire est de faire don de fonds aux forces armées ukrainiennes par le biais de Sauver la vie ou via la page officielle NBU.

Intéressant aussi :

sourcetechspot
S'inscrire
Avertir de
invité

0 Commentaires
Avis intégrés
Voir tous les commentaires