Bigme KIVI KidsTV
Categories: Новини IT

Китайські дослідники на порозі створення “справжніх вчених з ШІ”

Китайські дослідники стоять на порозі новаторського підходу до розробки “вчених зі штучним інтелектом (ШІ)”, здатних проводити експерименти і розв’язувати наукові проблеми. Нещодавні досягнення в моделях глибокого навчання революціонізували наукові дослідження, але сучасні моделі все ще намагаються точно імітувати реальні фізичні взаємодії.

Однак команда дослідників з Пекінського університету і Східного технологічного інституту (EIT) в Китаї розробила нову структуру для навчання моделей машинного навчання на основі попередніх знань, таких як закони фізики або математичної логіки, поряд з даними.

South China Morning Post повідомляє, що такий підхід може призвести до створення “справжніх вчених зі штучним інтелектом”, які зможуть вдосконалювати експерименти і розв’язувати наукові проблеми. Моделі глибокого навчання суттєво вплинули на наукові дослідження, розкриваючи взаємозв’язки у великих масивах даних. Попри ці досягнення, сучасні моделі, такі як Sora від OpenAI, стикаються з обмеженнями в точному моделюванні певних фізичних взаємодій у реальному світі.

Наприклад, Sora, модель перетворення тексту у відео, отримала широку популярність завдяки своєму вдосконаленому, реалістичному зображенню об’єктів. Однак вона не може точно моделювати базові взаємодії, наприклад, напрямок, в якому рухається полум’я свічок на святковому торті.

Дослідники пропонують включати “попередні знання”, такі як закони фізики або математичної логіки, разом з даними для навчання точніших моделей машинного навчання.

Вбудовування людських знань у моделі ШІ може підвищити їхню ефективність і здатність до прогнозування. Щоб розв’язати цю проблему, команда розробила фреймворк для оцінки цінності попередніх знань і визначення їхнього впливу на точність моделі. Їхній фреймворк має на меті оцінити цінність знань за допомогою похідних правил, враховуючи такі фактори, як обсяг даних та діапазон оцінювання. Проводячи кількісні експерименти, дослідники прагнуть з’ясувати складний взаємозв’язок між даними і попередніми знаннями, включаючи ефекти залежності, синергії та заміщення.

Ця модельно-діагностична система може бути застосована до різних мережевих архітектур, забезпечуючи всебічне розуміння ролі попередніх знань у моделях глибокого навчання.

Дослідники протестували свій фреймворк на моделях для розв’язання багатовимірних рівнянь і прогнозування результатів хімічних експериментів. Вони виявили, що включення попередніх знань значно підвищило продуктивність цих моделей, особливо в наукових галузях, де узгодженість з фізичними законами має вирішальне значення для уникнення потенційно катастрофічних наслідків. У довгостроковій перспективі команда має на меті розробити ШІ-моделі, які зможуть самостійно визначати та застосовувати відповідні знання без втручання людини.

Однак вони визнають, що зі збільшенням обсягу даних у моделі можуть виникнути такі проблеми, як домінування загальних правил над конкретними локальними правилами, особливо в таких галузях, як біологія та хімія, де загальних правил може не вистачати.

Читайте також:

Share
Julia Alexandrova

Кофеман. Фотограф. Пишу про науку та космос. Вважаю, нам ще рано зустрічатися з прибульцями. Стежу за розвитком робототехніки, на всяк випадок ...

Leave a Reply

Your email address will not be published. Required fields are marked*