Root NationTin tứcTin tức CNTTOpenAI dạy bot chơi Minecraft bằng video trực tuyến

OpenAI dạy bot chơi Minecraft bằng video trực tuyến

-

Trò chơi Minecraft (cô ấy lịch sử mô tả chi tiết Denis Koshelev) dường như không phải là một công cụ rất quan trọng để hỗ trợ nghiên cứu nâng cao trong lĩnh vực AI. Rốt cuộc, việc dạy một cỗ máy chơi trò chơi hộp cát đã được phát hành hơn 10 năm trước có quan trọng không? Bạn sẽ ngạc nhiên, nhưng vâng, và điều này được chứng minh bằng nghiên cứu mới nhất của phòng thí nghiệm OpenAI, nơi nghiên cứu sự phát triển của trí tuệ nhân tạo.

OpenAI luôn tập trung vào thành tích AI và học máy có thể mang lại lợi ích cho nhân loại. Gần đây, công ty đã đào tạo thành công một bot để chơi Minecraft bằng cách sử dụng hơn 70 giờ cảnh quay trò chơi (tức là hơn 2,9 ngày hoặc gần 8 năm, nếu có). Thành tích này đánh dấu một bước tiến lớn trong lĩnh vực máy học nâng cao sử dụng quan sát và mô phỏng.

Chip AI

Bot OpenAI là một ví dụ tuyệt vời về cách học mô phỏng (còn được gọi là “học có giám sát”) hoạt động. Không giống như học tăng cường, trong đó một tác nhân học được khen thưởng sau khi đạt được mục tiêu thông qua thử và sai, mô phỏng huấn luyện các mạng thần kinh để thực hiện các nhiệm vụ cụ thể bằng cách quan sát cách một người thực hiện chúng. Trong trường hợp này, OpenAI đã sử dụng các video hướng dẫn và video chơi trò chơi hiện có để cho phép bot thực hiện các kịch bản trò chơi phức tạp đòi hỏi khoảng 24 hành động riêng biệt đối với một người chơi bình thường.

Cũng thú vị:

Học bắt chước yêu cầu dữ liệu video phải được dán nhãn đặc biệt để cung cấp ngữ cảnh của hành động và kết quả, tức là AI có thể hiểu nút nào được nhấn và chuyển động nào được thực hiện. Nhưng cách tiếp cận như vậy có thể tốn nhiều thời gian, dẫn đến số lượng bộ dữ liệu có sẵn bị hạn chế.

Thay vì vận động cơ bắp của họ bằng cách thực hiện bài tập ghi nhãn dữ liệu thủ công quy mô lớn, nhóm nghiên cứu OpenAI đã sử dụng một phương pháp đặc biệt được gọi là Video Pre-Training (VPT) để mở rộng số lượng video có sẵn. Ban đầu, các nhà nghiên cứu đã ghi lại 2 giờ trò chơi có chú thích Minecraft và sử dụng nó để huấn luyện tác nhân liên kết một số hành động nhất định với kết quả cụ thể trên màn hình. Mô hình kết quả được sử dụng để tự động tạo nhãn cho 70 giờ nội dung Minecraft chưa được gắn nhãn trước đó có sẵn trực tuyến. Điều này mang lại cho bot một tập dữ liệu lớn hơn nhiều để xem xét và mô phỏng.

Cũng thú vị:

Nghiên cứu này chứng minh giá trị tiềm năng của các kho lưu trữ video có thể truy cập như YouTube, như một tài nguyên giáo dục cho AI. Các nhà khoa học máy học có thể sử dụng các video có thể truy cập và được gắn nhãn phù hợp để đào tạo AI về các tác vụ cụ thể, từ điều hướng trang web đơn giản đến trợ giúp người dùng có nhu cầu thể chất trong cuộc sống thực.

Bạn có thể giúp Ukraine chiến đấu chống lại những kẻ xâm lược Nga. Cách tốt nhất để làm điều này là quyên góp quỹ cho Các lực lượng vũ trang của Ukraine thông qua Cuộc sống tiết kiệm hoặc thông qua trang chính thức NBU.

Cũng thú vị:

Đăng ký
Thông báo về
khách sạn

0 Nhận xét
Bài đánh giá được nhúng
Xem tất cả các bình luận
Các bài báo khác
Đăng ký để cập nhật
Phổ biến bây giờ