26 оны дөрөвдүгээр сарын 2024, Баасан гараг

ширээний v4.2.1

Root NationНийтлэлТехнологиGemini гэж юу вэ: Google-ийн шинэ хиймэл оюун ухааны загварын тухай бүх зүйл

Gemini гэж юу вэ: Google-ийн шинэ хиймэл оюун ухааны загварын тухай бүх зүйл

-

Google саяхан хамгийн хүчирхэг хиймэл оюун ухаантай загвараа худалдаанд гаргалаа Gemini. Тэр юу вэ, тэр юу хийж чадах вэ? Манай нийтлэл дэх бүх зүйлийн талаар.

Google олон жилийн турш өөрийн хиймэл оюун ухааны хэрэгслийг хөгжүүлсээр ирсэн. OpenAI-аас ChatGPT-3-ыг олон нийтэд гаргаснаар дэлхийн хамгийн алдартай хайлтын системийг ажиллуулдаг компани мөн ижил төстэй Bard хэрэгслийг бүтээжээ. Гэхдээ энэ хэрэгсэл нь өрсөлдөгчиддөө ялагдсан хэвээр байгаа бөгөөд үүнийг Google зөвшөөрөөгүй. Тиймээс саяхан Google-ийн шинэ хэлний загвар болох Gemini-г дэлхий нийт үзсэн нь гайхах зүйл биш бөгөөд бид танилцуулгын үеэр олж мэдсэн.

Энэ нь аварга том компанийн өмнөх LLM (Том хэлний загвар)-ыг сайжруулахаас гадна текст боловсруулах, график, дуу авианы салбарт цоо шинэ боломжуудыг санал болгох зорилготой юм.

Тиймээс шинэ Google Gemini хэлний загварыг нарийвчлан авч үзье.

Мөн сонирхолтой: OpenAI Төсөл Q*: энэ нь юу вэ, яагаад төсөл санаа зовоож байна вэ?

Google Gemini гэж юу вэ?

Энэ бол Google-ийн хиймэл оюун ухааны шинэ бөгөөд хүчирхэг загвар бөгөөд зөвхөн текстээс гадна зураг, видео, аудиог ойлгох чадвартай. Энэхүү мультимодаль загвар нь математик, физик болон бусад салбарт нарийн төвөгтэй ажлуудыг гүйцэтгэх, түүнчлэн олон төрлийн програмчлалын хэлээр өндөр чанартай кодыг ойлгож, үүсгэх чадвартай гэж тодорхойлсон.

Google Gemini

Gemini-г одоогоор Google Bard болон Google Pixel 8-тай нэгтгэх боломжтой бөгөөд аажмаар Google-ийн бусад үйлчилгээнд оруулах болно.

"Ихрийн орд нь Google Research дахь манай хамт олон зэрэг Google-ийн багуудын хамтын хүчин чармайлтын үр дүн юм" гэж Google DeepMind-ийн гүйцэтгэх захирал, үүсгэн байгуулагч Деннис Хассабис хэлэв. "Энэ нь анхнаасаа мультимодаль байхаар бүтээгдсэн бөгөөд энэ нь текст, код, аудио, зураг, видео зэрэг янз бүрийн мэдээллийг нэгтгэж, ойлгох, ажиллах, нэгтгэх боломжтой гэсэн үг юм."

- Зар сурталчилгаа -

Мөн сонирхолтой: Бидний хиймэл оюун гэж нэрлэдэг бүх зүйл үнэндээ хиймэл оюун ухаан биш юм. Эндээс та юу мэдэх хэрэгтэй вэ

Загварыг хэн бүтээсэн бэ?

Google Gemini

Та аль хэдийн таамаглаж байсанчлан Gemini-г Google-ийн толгой компани болох Google болон Alphabet нар бүтээсэн бөгөөд компанийн одоогийн байдлаар хамгийн дэвшилтэт AI загвар юм. Google-ийн DeepMind хэлтэс ч түүний хөгжилд ихээхэн хувь нэмэр оруулсан. Бүтээн байгуулалтад хэдэн ажилтан оролцсон, үүнд ямар хөрөнгө хуваарилагдсан нь одоогоор тодорхойгүй байгаа ч Google-ийн чадавхийг мэдэж байгаа тул маш их хэмжээний хөрөнгө байгаа гэдэгт итгэлтэй байж болно.

Мөн сонирхолтой: Windows 12: Шинэ үйлдлийн систем юу байх вэ

Боломжууд

Дээр дурдсанчлан энэ нь олон төрлийн загвар бөгөөд текст, код, аудио, зураг, видео зэрэг янз бүрийн төрлийн өгөгдлийг ойлгох, ажиллах, нэгтгэх боломжтой гэсэн үг юм. Энэ нь өмнөх AI системүүдтэй харьцуулахад илүү сайн ойлгох, сэтгэх, кодлох чадварыг өгдөг.

Google Gemini

Загварын үндсэн боломжууд нь:

  • Орчуулга, нэгтгэн дүгнэх, харилцан яриа гэх мэт ажлуудад зориулсан байгалийн хэлний боловсруулалт
  • Математик сэтгэлгээ, асуудал шийдвэрлэх
  • Код болон баримт бичиг үүсгэх чадвартай
  • Зураг, аудио, видеог ойлгох
  • Янз бүрийн домэйнд олон ажил хийх

Таны харж байгаагаар боломжууд нь бусад загваруудаас давуу юм.

Хэлний ойлголт, математик сэтгэлгээ, кодчиллын тестийн хувьд Gemini Ultra нь GPT-4 зэрэг загваруудаас илүү гарсан. Тодруулбал, энэ нь 90 гаруй хувийн нарийвчлалтай массивын олон талт хэлний ойлголт (MMLU) тестийн хүний ​​түвшний гүйцэтгэлийг давсан анхны загвар юм.

Томоохон хэлний загварын судалгааны 32 эрдмийн шалгалтанд Gemini GPT-4-ийг давсан. 30 тохиолдолд Google-ийн шинэ хэлний загвар нь өрсөлдөгчөөсөө илүү байсан. Энэ нь загвар хэлийг бүрэн ойлгох чадварыг харуулж байна.

Мөн уншина уу: Хүний тархины төсөл: Хүний тархийг дуурайх оролдлого

Өөр өөр хувилбарууд байдаг уу?

Google энэ хиймэл оюун ухааныг Google-ийн дата төвөөс гар утасны төхөөрөмж хүртэл ямар ч төхөөрөмж дээр ажиллах боломжтой уян хатан загвар гэж тодорхойлсон. Энэхүү өргөтгөх боломжийг хангахын тулд Gemini нь Nano, Pro, Ultra гэсэн гурван хувилбартай.

Google Gemini

Gemini-ийн янз бүрийн хувилбаруудын талаар илүү дэлгэрэнгүй ярилцъя.

  • Ихэр Нано: ухаалаг гар утас, тухайлбал Google Pixel 8 дээр ажиллахад зориулагдсан. Энэ нь чатын хөтөлбөрт хариулт санал болгох, текстийг нэгтгэн бичих гэх мэт гадны серверт холбогдохгүйгээр хиймэл оюун ухаанаар үр ашигтай боловсруулах шаардлагатай ажлуудыг гүйцэтгэхэд зориулагдсан. Энэхүү авсаархан төхөөрөмжийн загвар нь 6 тэрбум орчим параметртэй.
  • GeminiPro: Google дата төвүүдэд ажилладаг. Pro нь Bard AI chatbot-ийн хамгийн сүүлийн хувилбартай ажиллахад зориулагдсан. Энэ нь хурдан хариу өгөх, нарийн төвөгтэй асуултуудыг ойлгох чадвартай. Дунд зэргийн хэмжээтэй загвар нь ойролцоогоор 100 тэрбум параметртэй бөгөөд Бардын ярианы хиймэл оюун ухааны гол цөм юм. Pro-г Google Cloud-ээр дамжуулан ашиглах боломжтой.
  • Gemini Ultra: Хэдий Хэлний хувилбар хараахан олны хүртээл болоогүй байгаа ч Google үүнийг "том хэлний загвар (LLM)) судалгаанд өргөн хэрэглэгддэг 30 эрдэм шинжилгээний тестийн 32-аас давсан хамгийн сайн үзүүлэлттэй загвар гэж тодорхойлсон. " Хамгийн том, хамгийн хүчирхэг хувилбар болох Ultra нь 1 их наяд гаруй параметрийг хүлээн авах болно. Энэ нь дата төвүүдэд байрлана. Ultra нь байгууллагын хэрэглээнд тохирсон. Энэ хувилбар нь маш нарийн төвөгтэй ажлуудыг гүйцэтгэхэд зориулагдсан. Google үүнийг одоогийн туршилтын үе шат дууссаны дараа гаргахаар төлөвлөж байна. Өөрөөр хэлбэл, хамгийн хүчирхэг хувилбарыг хэрэглэгчдэд хараахан ашиглах боломжгүй байна.

Мөн сонирхолтой: Google Bard AI: Таны мэдэх ёстой бүх зүйл

- Зар сурталчилгаа -

Gemini-д хэрхэн хандах вэ?

Nano болон Pro хувилбарт AI нь одоо Google Pixel 8 ухаалаг гар утас болон Bard чатбот зэрэг Google-ийн бүтээгдэхүүнүүдэд боломжтой болсон. Google үүнийг эцэст нь хайлтын систем, зар сурталчилгаа, Gmail имэйл үйлчилгээ, Chrome хөтөч болон бусад үйлчилгээндээ нэгтгэхээр төлөвлөж байна.

Хөгжүүлэгчид болон байгууллагын үйлчлүүлэгчид 13 оны 2023-р сарын -аас эхлэн Google AI Studio болон Google Cloud Vertex AI дээрх Gemini API-ээр дамжуулан Pro-д хандах боломжтой болно. Хөгжүүлэгчид Android нь AICore-ээр дамжуулан Nano хувилбарын загварт хандах боломжтой бөгөөд энэ нь эрт үзэх боломжтой болно.

Мөн уншина уу: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Хоёр ёкозүний тулаан

Google Bard дахь Gemini: Юу өөрчлөгдөх вэ?

Танилцуулгын үеэр өгсөн мэдээллээс харахад загвар нь Google Bard-д илүү төвөгтэй асуудлуудыг илүү сайн шийдвэрлэх боломжийг олгоно.

“Бид Gemini-г уг загвар нь төрөлхийн олон загвартай байхаар зохион бүтээсэн бөгөөд эхнээсээ олон загварт бэлтгэгдсэн. Дараа нь бид гүйцэтгэлийг сайжруулахын тулд илүү олон мультимодал өгөгдөл нэмж сайжруулсан. Үүний үр дүнд Gemini нь өмнөх олон загварт загваруудаас хамаагүй илүү сайн ойлгож, дүгнэлт гаргадаг бөгөөд бараг бүх салбарт орчин үеийн чадавхитай.

Gemini-ийн ер бусын олон талт чадвар нь танд нарийн төвөгтэй текст болон харааны мэдээллийг ойлгоход тусална. Эдгээр нь асар том өгөгдлийн багцаас тодорхой мэдээллийг задлахад онцгой ач холбогдолтой юм. Энэхүү загвар нь олон зуун мянган баримт бичгүүдээс уншиж, шүүж, дүн шинжилгээ хийх замаар мэдээллийн мөн чанарыг гаргаж авах ер бусын чадвар нь шинжлэх ухаанаас эхлээд санхүү хүртэл янз бүрийн салбарт шинэ, аянга хурдтай нээлт хийхэд хувь нэмэр оруулах нь дамжиггүй."

Танилцуулгын үеэр 200 мянга гаруй бичлэгийг агуулсан цогц судалгааны жишээг харуулсан бөгөөд тэдгээрийн заримыг шинэ мэдээллийн дагуу шинэчлэх шаардлагатай байв. Таны таамаглаж байсанчлан үүнийг гараар хийх нь маш их цаг хугацаа шаарддаг тул судалгааны зохиогчид Gemini-г ашиглан оролтыг авч, шаардлагатай шинэчлэлтүүдийг хийсэн кодыг бэлтгэсэн. Өөр нэг бодит жишээ бол математик эсвэл физикийн асуудлыг тайлбарлахад Google-ийн хэлний загварыг ашиглах явдал юм.

Google Gemini

Энд оруулсан өгөгдөл нь сургуулийн хичээлийн даалгаврын зураг/сканнер байсан. Систем нь тэнд хадгалагдсан график болон текстийг боловсруулж, дараа нь гэрийн даалгаврын аль хэсгийг зөв хийсэн, аль нь илүү анхаарал хандуулах шаардлагатайг зааж өгөх боломжтой болсон. Танилцуулга нь хэрэглэгч Gemini-ээс даалгавраа тайлбарлахыг дахин дахин асууж болох бөгөөд дараагийн оролдлого бүрийг илүү энгийн хэлээр тайлбарлах ёстойг харуулсан. Ихрийн орд хэр үнэн зөв, зөв ​​болохыг сонирхсон хүмүүс мэдээж шалгах боловч зурагнаас шууд текст уншиж, боловсруулах чадвар нь гайхалтай. Танилцуулгын үеэр нэмсэн:

"Ихрийн ордныхон текст, зураг, дуу авиа болон бусад зүйлийг нэгэн зэрэг таньж, ойлгохыг заадаг. Үүний ачаар тэрээр мэдээллийн нарийн ширийн зүйлийг илүү сайн ойлгож, нарийн төвөгтэй асуултуудад хариулж чаддаг. Энэ нь ялангуяа математик, физиктэй холбоотой сэдвүүдийг тайлбарлахад үр дүнтэй байдаг тул гэрийн даалгаврын хувьд хувийн туслах болно.".

Google Pixel ухаалаг гар утасны Gemini

Google мөн Gemini шинэ TPUv5 чипсет дээр "суралцаж" байна гэж сайрхаж, Gemini Ultra-г 2024 оны эхээр нэвтрүүлэхээр төлөвлөж байгаа бөгөөд энэ нь аварга том хүний ​​ярианы загварын хэрэглэгчийн хувилбар болох Bard Advanced-ийг ашиглах болно. Gemini Ultra нь одоогоор туршилтанд хамрагдаж байгаа бөгөөд аюулгүй байдлын мэргэжилтнүүдийг сонгох боломжтой.

Google Gemini

Хамгийн сүүлийн чухал мэдээлэл бол Google Pixel 8 ухаалаг гар утсанд Gemini-г танилцуулсан явдал юм. Энэ нь бусад зүйлсээс гадна мессенжер дэх Gboard програмаар дамжуулан хурдан хариу бичих боломжийг олгоно. Эхнийх нь WhatsApp, гэхдээ ирэх жил ийм шийдлүүд харилцаа холбоотой холбоотой бусад програмуудад гарч ирэх болно. Гэсэн хэдий ч Google Pixel 8 ухаалаг гар утсанд зориулсан хиймэл оюун ухааны олон шинэ хэрэгслүүдийг зарласан тул энэ нь зөвхөн эхлэл бөгөөд ирээдүйд бусад төхөөрөмжүүдэд ашиглах боломжтой болно. Android. Гэхдээ эдгээр нь цаашдын төлөвлөгөө бөгөөд одоогоор дэлгэрэнгүй мэдээлэл өгөөгүй байна.

Gemini нь GPT-4 гэх мэт хиймэл оюун ухааны бусад загваруудаас юугаараа ялгаатай вэ?

Google-ийн шинэ Gemini загвар нь өнөөг хүртэл хамгийн том, хамгийн дэвшилтэт хиймэл оюун ухааны загваруудын нэг юм шиг харагдаж байгаа хэдий ч Ultra загварыг гаргах нь үүнийг тодорхойлох болно. Одоогийн байдлаар хиймэл оюун ухаантай чатбот ашиглаж байгаа бусад алдартай загваруудтай харьцуулахад Gemini нь өөрийн гэсэн олон талт шинж чанараараа ялгардаг бол GPT-4 зэрэг бусад загварууд нь залгаасууд болон интеграцчлалд тулгуурладаг.

Нарийвчлал, шударга байдлын талаар санаа зовж байна

Хэдийгээр Gemini нь хиймэл оюун ухааны чадавхийг хөгжүүлэх томоохон үсрэлт боловч бусад томоохон хэлний загваруудын адил дутагдалтай талуудтай. Юуны өмнө энэ нь худал мэдээлэл үүсгэх боломж юм. Хэлний шинэ загварт байгаа сургалтын өгөгдөл дээр тулгуурлан хэвийсэн. Мөн бодит ертөнцийн талаарх хязгаарлагдмал ойлголтыг дурдах нь зүйтэй. Google Gemini-ийн шинэ загвар нь алдаа гаргаж, нотлох баримтад тулгуурлаагүй, эрүүл саруул ухаантай зөрчилдөж болзошгүйг хүлээн зөвшөөрөв.

Google Gemini

Ялангуяа бүрэн гүйцэд судлагдаагүй байгаа шинэ боломжуудтай Gemini Ultra-ийн хувьд илүү олон туршилт хийх шаардлагатай байна. Google нь болзошгүй хор хөнөөлийг багасгахын тулд Gemini-г сайтар үнэлэх үүрэгтэй.

Мөн сонирхолтой: Бүх талаар Microsoft Туслах нисгэгч: ирээдүй эсвэл буруу зам уу?

Ирээдүй нь Gemini-тэй холбоотой

Google-ийн Gemini-г гаргасан нь хиймэл оюун ухааны хөгжлийн шинэ эрин үеийг эхлүүлсэн. Өмнөх загварууд болон хүний ​​суурь үзүүлэлтүүдтэй харьцуулахад хамгийн сайн гүйцэтгэлтэй Gemini хиймэл оюун ухааны ирээдүйн боломжуудыг харуулж байгаа боловч зарим дутагдлыг арилгахын тулд илүү их судалгаа хийх шаардлагатай хэвээр байна.

Ирээдүйд та Gemini-г Google-ийн бүтээгдэхүүнүүдэд илүү хэрэгтэй, ухаалаг функцээр хангана гэж найдаж болно. Цаашид тус компани Gemini-г англи хэлнээс цааш өргөжүүлж, үндсэн загвар аргачлал дээрээ тулгуурлахаар төлөвлөж байна.

Бид зөвхөн харж, Google юу хийж байгаагаа мэдэж байгаа гэдэгт найдаж болно.

Мөн уншина уу: 

Yuri Svitlyk
Yuri Svitlyk
Карпатын нурууны хүү, математикийн танигдаагүй суут ухаантан, "хуульч"Microsoft, практик альтруист, зүүн-баруун
- Зар сурталчилгаа -
Бүртгүүлэх
тухай мэдэгдэх
зочин

0 Сэтгэгдэл
Суулгасан тойм
Бүх сэтгэгдлийг харах