Root NationXəbərlərİT xəbərləriMicrosoft insan səviyyəsində AI-yə yol açan multimodal yanaşma təqdim etdi

Microsoft insan səviyyəsində AI-yə yol açan multimodal yanaşma təqdim etdi

-

Bu həftənin başında araşdırmaçılar Microsoft Kosmos-1 multimodal süni intellekt modelini təqdim etdi, o, şəkilləri məzmun üçün təhlil edə, vizual tapmacaları həll edə, vizual mətni tanıma, vizual İQ testlərini yerinə yetirə və təbii dil təlimatlarını başa düşə bilər. Tədqiqatçıların fikrincə, bu cür süni intellekt modelləri insan səviyyəsində birgə tapşırıqları yerinə yetirə bilən süni ümumi intellektin (AI) yaradılması istiqamətində ilk addımdır. Yəni bu texnologiya istənilən intellektual işdə insanı əvəz edə biləcək. Bu, əsas biznes tərəfdaşı olan OpenAI-nin bəyan edilmiş məqsədidir Microsoft süni intellekt sahəsində.

Kosmos-1

Bu halda Kosmos-1 şirkətin sırf şəxsi inkişafıdır Microsoft. Tədqiqatçılar onların yaradılmasını "multimodal geniş dil modeli" (MLLM) adlandırırlar, çünki onun kökləri ChatGPT kimi LLM kimi yalnız mətndən ibarət təbii dil emalında yatır. Modelin daxil edilən şəkilləri qəbul etməsi üçün tədqiqatçılar əvvəlcə şəkilləri LLM-nin başa düşə biləcəyi xüsusi nişanlar seriyasına (əsasən mətn) çevirməlidirlər.

Kosmos-1

Kosmos-1, The Pile (800 GB ingilis mətn resursu) və Common Crawl-dan çıxarışlar daxil olmaqla, İnternetdən verilənlər bazasında təlim keçmişdir. Daha sonra model nitqin başa düşülməsi, nitqin yaradılması, optik simvol tanınması olmadan mətnin təsnifatı, təsvirin başlığı, vizual sualların cavablandırılması, veb-səhifə suallarına cavab verilməsi və lokalizasiya ilə təsvirin təsnifatı üçün bir neçə testlə sınaqdan keçirilib. görə Microsoft, Kosmos-1 bu sınaqların bir çoxunda indiki modelləri üstələyib.

Kosmos-1

Xüsusilə maraqlı olan Raven's Progressive Reaction testi idi, hansı ki, fiqurlar ardıcıllığını təqdim etməklə və mövzudan ardıcıllığı tamamlamağı xahiş etməklə vizual İQ-nu ölçür. Kosmos-1 22% hallarda düzgün cavabı verə bilib.

Kosmos-1

Gələcək optimallaşdırma ilə daha əhəmiyyətli nəticələr verə biləcək bu ilk addımlar süni intellekt modellərinə istənilən media formasını qavramağa və təsir etməyə imkan verir, süni köməkçilərin imkanlarını xeyli genişləndirir.

Həmçinin oxuyun:

Jereloarxeika
Qeydiyyatdan keçmək
Haqqında məlumat verin
qonaq

0 Şərhlər
Daxil edilmiş rəylər
Bütün şərhlərə baxın