28년 2024월 XNUMX일 목요일

데스크탑 v4.2.1

Root NationНовиниIT 뉴스OpenAI는 온라인 비디오를 사용하여 봇에게 Minecraft를 플레이하도록 가르쳤습니다.

OpenAI는 온라인 비디오를 사용하여 봇에게 Minecraft를 플레이하도록 가르쳤습니다.

-

부인 마인 크래프트 (그녀의 역사 자세히 설명 Denis Koshelev)는 AI 분야의 고급 연구를 지원하는 데 그다지 중요한 도구는 아닌 것 같습니다. 결국, 10년 전에 출시된 샌드박스 게임을 기계에게 가르치는 것이 중요합니까? 당신은 놀랄 것이지만 그렇습니다. 이것은 인공 지능 개발을 연구하는 OpenAI 연구소의 최신 연구에 의해 입증됩니다.

OpenAI 항상 성과에 집중 일체 포함 인류에게 도움이 될 수 있는 기계 학습. 이 회사는 최근 70시간이 넘는 게임 플레이 영상(2,9일 이상 또는 거의 8년)을 사용하여 Minecraft를 플레이하도록 봇을 훈련시키는 데 성공했습니다. 이 성과는 관찰과 시뮬레이션을 사용하는 고급 머신 러닝의 큰 발전을 의미합니다.

인공 지능 칩

OpenAI 봇은 시뮬레이션 학습("지도 학습"이라고도 함)이 작동하는 방식을 보여주는 좋은 예입니다. 시행 착오를 통해 목표를 달성한 후 학습 에이전트가 보상을 받는 강화 학습과 달리 시뮬레이션은 사람이 수행하는 방식을 관찰하여 특정 작업을 수행하도록 신경망을 훈련합니다. 이 경우 OpenAI는 기존 게임 플레이 비디오 및 자습서를 사용하여 봇이 일반 플레이어의 경우 약 24개의 별도 작업이 필요한 복잡한 게임 시나리오를 실행할 수 있도록 했습니다.

또한 흥미로운 점:

모방 학습을 위해서는 행동과 결과의 맥락을 제공하기 위해 비디오 데이터에 특별히 레이블을 지정해야 합니다. 일체 포함 어떤 버튼을 눌렀는지, 어떤 동작을 했는지 이해할 수 있습니다. 그러나 이러한 접근 방식은 시간이 오래 걸리므로 사용 가능한 데이터 세트가 제한될 수 있습니다.

OpenAI 연구팀은 대규모 수동 데이터 라벨링 작업을 수행하여 근육을 구부리는 대신 VPT(Video Pre-Training)라는 특별한 접근 방식을 사용하여 사용 가능한 비디오 수를 확장했습니다. 처음에 연구원들은 2시간의 주석이 달린 게임 플레이를 기록했습니다. 마인 크래프트 이를 사용하여 에이전트가 특정 작업을 화면의 특정 결과와 연결하도록 훈련했습니다. 결과 모델은 이전에 레이블이 지정되지 않은 온라인에서 사용할 수 있는 70시간 분량의 레이블을 자동으로 생성하는 데 사용되었습니다. 이것은 봇이 보고 시뮬레이션할 훨씬 더 큰 데이터 세트를 제공했습니다.

또한 흥미로운 점:

이 연구는 다음과 같은 액세스 가능한 비디오 저장소의 잠재적 가치를 보여줍니다. YouTube, AI 교육 자원으로. 기계 학습 과학자는 액세스 가능하고 적절하게 레이블이 지정된 비디오를 사용하여 간단한 웹 탐색에서 실생활에서 신체적 필요가 있는 사용자를 돕는 데 이르기까지 특정 작업에 대해 AI를 교육할 수 있습니다.

당신은 우크라이나가 러시아 침략자에 맞서 싸울 수 있도록 도울 수 있습니다. 이를 수행하는 가장 좋은 방법은 다음을 통해 우크라이나 군대에 기금을 기부하는 것입니다. 세이브라이프 또는 공식 페이지를 통해 NBU.

또한 흥미로운:

가입하기
에 대해 알림
손님

0 코멘트
임베디드 리뷰
모든 댓글 보기
기타 기사
업데이트 구독

최근 댓글

지금 인기
0
우리는 여러분의 생각을 좋아합니다. 댓글을 달아주세요.x