Root NationВестиИТ вестиMicrosoft претстави мултимодален пристап кој го отвора патот кон вештачката интелигенција на човечко ниво

Microsoft претстави мултимодален пристап кој го отвора патот кон вештачката интелигенција на човечко ниво

-

На почетокот на оваа недела, истражувачите од Microsoft го претстави Космос-1, мултимодален модел на вештачка интелигенција кој може да анализира слики за содржина, да решава визуелни загатки, да врши визуелно препознавање на текст, да полага визуелни тестови за интелигенција и да разбира инструкции за природен јазик. Според истражувачите, ваквите модели на вештачка интелигенција се првиот чекор кон создавање на вештачка општа интелигенција (ВИ) која може да извршува заеднички задачи на човечко ниво. Односно, оваа технологија ќе може да замени личност во која било интелектуална задача. И ова е наведената цел на OpenAI, клучен деловен партнер Microsoft во областа на вештачката интелигенција.

Космос-1

Во овој случај, Космос-1 е чисто личен развој на компанијата Microsoft. Истражувачите го нарекуваат нивното создавање „мултимодален широк јазичен модел“ (MLLM), бидејќи неговите корени лежат во обработката на природен јазик само на текст, како што е LLM, како што е ChatGPT. За да може моделот да прифати влезни слики, истражувачите мора прво да ги претворат сликите во посебна серија токени (главно текст) што LLM може да ги разбере.

Космос-1

Космос-1 беше обучен за база на податоци од Интернет, вклучувајќи извадоци од The ​​Pile (англиски текстуален ресурс од 800 GB) и Common Crawl. Моделот потоа беше тестиран со неколку тестови за разбирање говор, генерирање говор, класификација на текст без оптичко препознавање знаци, титлови на слики, визуелно одговарање на прашања, одговарање на прашања на веб-страници и класификација на слики со локализација. Според Microsoft, Космос-1 ги надмина сегашните модели во многу од овие тестови.

Космос-1

Посебно интересен беше Raven's Progressive Reasoning тестот, кој го мери визуелниот коефициент на интелигенција преку прикажување на низа од форми и барајќи од субјектот да ја заврши низата. Космос-1 успеа да даде точен одговор во 22% од случаите.

Космос-1

Овие рани чекори, кои со идна оптимизација, би можеле да дадат уште позначајни резултати, дозволувајќи им на моделите со вештачка интелигенција да перцепираат и да влијаат на која било форма на медиуми, со што значително ќе ги прошират можностите на вештачките асистенти.

Прочитајте исто така:

Пријавете се
Известете за
гостин

0 коментари
Вградени критики
Прикажи ги сите коментари
Претплатете се за ажурирања