Microsoft Космос-1 го отвора патот кон вештачката интелигенција на човечко ниво

На почетокот на оваа недела, истражувачите од Microsoft го претстави Космос-1, мултимодален модел на вештачка интелигенција кој може да анализира слики за содржина, да решава визуелни загатки, да врши визуелно препознавање на текст, да полага визуелни тестови за интелигенција и да разбира инструкции за природен јазик. Според истражувачите, ваквите модели на вештачка интелигенција се првиот чекор кон создавање на вештачка општа интелигенција (ВИ) која може да извршува заеднички задачи на човечко ниво. Односно, оваа технологија ќе може да замени личност во која било интелектуална задача. И ова е наведената цел на OpenAI, клучен деловен партнер Microsoft во областа на вештачката интелигенција.

Во овој случај, Космос-1 е чисто личен развој на компанијата Microsoft. Истражувачите го нарекуваат нивното создавање „мултимодален широк јазичен модел“ (MLLM), бидејќи неговите корени лежат во обработката на природен јазик само на текст, како што е LLM, како што е ChatGPT. За да може моделот да прифати влезни слики, истражувачите мора прво да ги претворат сликите во посебна серија токени (главно текст) што LLM може да ги разбере.

Космос-1 беше обучен за база на податоци од Интернет, вклучувајќи извадоци од The Pile (англиски текстуален ресурс од 800 GB) и Common Crawl. Моделот потоа беше тестиран со неколку тестови за разбирање говор, генерирање говор, класификација на текст без оптичко препознавање знаци, титлови на слики, визуелно одговарање на прашања, одговарање на прашања на веб-страници и класификација на слики со локализација. Според Microsoft, Космос-1 ги надмина сегашните модели во многу од овие тестови.

Посебно интересен беше Raven's Progressive Reasoning тестот, кој го мери визуелниот коефициент на интелигенција преку прикажување на низа од форми и барајќи од субјектот да ја заврши низата. Космос-1 успеа да даде точен одговор во 22% од случаите.

Овие рани чекори, кои со идна оптимизација, би можеле да дадат уште позначајни резултати, дозволувајќи им на моделите со вештачка интелигенција да перцепираат и да влијаат на која било форма на медиуми, со што значително ќе ги прошират можностите на вештачките асистенти.

Прочитајте исто така:

Jereloартехника

Пријавете се

0 коментари

Вградени критики

Прикажи ги сите коментари

Други статии

Microsoft претстави мултимодален пристап кој го отвора патот кон вештачката интелигенција на човечко ниво

Неодамнешни коментари