“Відео не містить телемонтажу, – каже норвезький виробник гуманоїдних роботів 1X. “Ніякої комп’ютерної графіки, ніяких нарізок, ніякого прискорення відео, ніякого відтворення траєкторії за сценарієм. Все контролюється нейронними мережами, все автономно, все зі швидкістю 1X”.
Це виробник гуманоїдів, якому OpenAI поставила свої чипи торік в рамках раунду фінансування серії А на суму $25 млн. Подальша серія B на суму $100 млн показала, як багато важить увага OpenAI, а також загальний ажіотаж навколо універсальних роботів-гуманоїдів – концепції, яка завжди здавалася далеким майбутнім, але за останні два роки вона стала абсолютно термоядерним вибухом.
Роботи-гуманоїди 1X виглядають дивно недооціненими поруч з тим, над чим працюють, скажімо, Tesla, Figure, Sanctuary або Agility. У гуманоїда Eve поки що навіть немає ніг або спритних рук. Він пересувається на парі коліщат з електроприводом, балансуючи на третьому маленькому коліщатку ззаду, а його руки – це рудиментарні кігті. Виглядає так, ніби він одягнений для санного спорту, і має тьмяне, блимаюче світлодіодне обличчя-смайлик.
1X має двоногу версію під назвою Neo, яка також має гарно зчленовані руки – але, можливо, ці деталі не надто важливі в ці перші дні розвитку роботів загального призначення. Переважна більшість ранніх випадків використання виглядатимуть так: “візьми цю штуку і поклади її туди” – для цього навряд чи знадобляться пальці, здатні грати на піаніно. І основне місце, де вони будуть використовуватися, – це склади з бетонною підлогою і заводи, де їм, ймовірно, не потрібно буде підніматися сходами або переступати через щось.
Мало того, багато груп розв’язали проблему двоногого ходіння і красивого ручного обладнання. Але це не головна перешкода. Головна перешкода полягає в тому, щоб змусити ці машини швидко навчатися завданням, а потім йти і виконувати їх автономно, як це робить Toyota з настільними роботами-маніпуляторами. Коли Figure 01 “з’ясував”, як самостійно працювати з кавоваркою, це було великою подією. Коли Optimus від Tesla склав сорочку на відео, і виявилося, що він знаходиться під контролем людини-оператора, це було набагато менш вражаюче.
Наведені вище завдання не є надскладними, тут не йдеться про складання сорочок чи керування кавоваркою. Але є ціла низка повноцінних роботів, які виконують цілу низку завдань, піднімаючи та кладучи речі на місце. Вони хапають їх на висоті від щиколотки до талії. Вони розкладають їх по коробках, смітниках і лотках. Вони піднімають іграшки з підлоги і прибирають їх.
Вони також відчиняють двері, підбігають до зарядних станцій і підключаються до них, використовуючи те, що виглядає як непотрібно складний маневр присідання, щоб під’єднати штепсельну вилку до своїх щиколоток.
Коротко кажучи, вони роблять майже те саме, що їм потрібно робити в ранніх випадках використання гуманоїдів загального призначення, навчені, за словами 1X, “суто на основі даних”. По суті, компанія навчила 30 ботів Eve виконувати низку індивідуальних завдань кожен, очевидно, використовуючи імітаційне навчання за допомогою відео та телеоперацій. Потім вони використовували цю вивчену поведінку для навчання “базової моделі”, здатної до широкого набору дій і поведінки. Потім ця базова модель була доопрацьована з урахуванням специфічних можливостей середовища – складських завдань, загальних маніпуляцій з дверима тощо – і, нарешті, боти були навчені конкретним завданням, які вони повинні були виконувати.
Цей останній крок, ймовірно, відбуватиметься на місці, на об’єктах клієнтів, коли боти отримають свої щоденні завдання, і 1X каже, що це займе “лише кілька хвилин збору даних і навчання на графічному процесорі настільного комп’ютера”. Імовірно, в ідеальному світі це означатиме, що хтось стоїть у шоломі віртуальної реальності і виконує певну роботу, а потім програмне забезпечення для глибокого навчання поєднує це завдання з ключовими здібностями бота, запускає його кілька тисяч разів у симуляції для перевірки різних випадкових факторів і результатів, після чого боти будуть готові до роботи.
“За останній рік, – пише Ерік Джанг, віце-президент 1X зі штучного інтелекту, у своєму блозі, – ми розробили движок даних для вирішення загальних завдань мобільних маніпуляцій у повністю наскрізний спосіб. Ми переконалися, що він працює, тому зараз ми наймаємо дослідників ШІ в районі затоки Сан-Франциско, щоб масштабувати його до 10-кратного збільшення кількості роботів і телеоператорів”.
Цікаво, коли ці штуки будуть готові до прайм-тайму.
Читайте також: