Root NationArtikelTeknologiApa itu Gemini: Semua tentang model AI baru Google

Apa itu Gemini: Semua tentang model AI baru Google

-

Google baru saja merilis model AI terkuat yang pernah ada Gemini. Siapa dia dan apa yang bisa dia lakukan? Tentang semuanya di artikel kami.

Google telah mengembangkan alat AI-nya sendiri selama bertahun-tahun. Dengan dirilisnya ChatGPT-3 ke publik dari OpenAI, perusahaan yang menjalankan mesin pencari paling populer di dunia juga telah menciptakan alat serupa, Bard. Namun alat ini masih kalah dari pesaingnya, yang tidak bisa diizinkan oleh Google. Oleh karena itu, tidak mengherankan jika dunia baru-baru ini melihat Gemini, model bahasa baru dari Google, yang kami pelajari selama presentasi.

Ini dirancang tidak hanya untuk meningkatkan LLM (Model Bahasa Besar) sebelumnya, tetapi juga untuk menawarkan kemungkinan yang benar-benar baru di bidang pemrosesan teks, grafik, dan suara.

Jadi mari kita lihat lebih dekat model bahasa Google Gemini yang baru.

Juga menarik: Proyek OpenAI T*: apa itu dan mengapa proyek ini menjadi perhatian

Apa itu Google Gemini?

Ini adalah model kecerdasan buatan Google yang baru dan canggih, yang tidak hanya dapat memahami teks, tetapi juga gambar, video, dan audio. Model multimodal ini digambarkan mampu melakukan tugas-tugas kompleks dalam matematika, fisika, dan domain lainnya, serta memahami dan menghasilkan kode berkualitas tinggi dalam berbagai bahasa pemrograman.

Google Gemini

Gemini saat ini tersedia melalui integrasi dengan Google Bard dan Google Pixel 8 dan secara bertahap akan disertakan dalam layanan Google lainnya.

"Gemini adalah hasil upaya kolaboratif besar-besaran di seluruh tim Google, termasuk kolega kami di Google Research," — kata Dennis Hassabis, CEO dan salah satu pendiri Google DeepMind. “Ini dibangun dari awal menjadi multimodal, yang berarti dapat menggeneralisasi dan memahami, mengoperasikan, dan menggabungkan berbagai jenis informasi dengan lancar, termasuk teks, kode, audio, gambar, dan video.”

- Iklan -

Juga menarik: Tidak semua yang kita sebut AI sebenarnya adalah kecerdasan buatan. Inilah yang perlu Anda ketahui

Siapa yang menciptakan model tersebut?

Google Gemini

Seperti yang mungkin sudah Anda duga, Gemini diciptakan oleh Google dan Alphabet, perusahaan induk Google, dan merupakan model AI tercanggih dari perusahaan tersebut hingga saat ini. Divisi DeepMind Google juga memberikan kontribusi signifikan terhadap perkembangannya. Belum diketahui berapa jumlah karyawan yang ikut serta dalam pengembangan tersebut dan berapa dana yang dialokasikan untuk itu, namun melihat kemampuan Google, bisa dipastikan jumlahnya sangat besar.

Juga menarik: Windows 12: Apa OS barunya

Peluang

Seperti yang saya sebutkan di atas, ini adalah model multimodal, artinya model ini dapat memahami, mengoperasikan, dan menggabungkan berbagai jenis data, termasuk teks, kode, audio, gambar, dan video. Ini memberikan pemahaman, pemikiran, dan keterampilan pengkodean yang lebih baik dibandingkan dengan sistem AI sebelumnya.

Google Gemini

Kemampuan utama model ini adalah:

  • Pemrosesan bahasa alami untuk tugas-tugas seperti terjemahan, ringkasan, dan dialog
  • Pemikiran matematis dan pemecahan masalah
  • Kemampuan untuk menghasilkan kode dan dokumentasi
  • Memahami gambar, audio dan video
  • Multitasking di domain berbeda

Seperti yang Anda lihat, kemampuannya lebih unggul dibandingkan model lainnya.

Dalam tes pemahaman bahasa, pemikiran matematika, dan pengkodean, Gemini Ultra mengungguli model seperti GPT-4. Secara khusus, ini adalah model pertama yang mengungguli kinerja tingkat manusia pada tes Massive Multitask Language Understanding (MMLU), dan mencapai akurasi lebih dari 90%.

Dalam 32 tes akademik studi model bahasa besar, Gemini mengungguli GPT-4. Dalam 30 kasus, model bahasa baru dari Google lebih baik dibandingkan pesaing. Hal ini menunjukkan kemampuan model untuk memahami bahasa sepenuhnya.

Baca juga: Proyek Otak Manusia: Upaya meniru otak manusia

Apakah ada versi yang berbeda?

Google menggambarkan AI ini sebagai model fleksibel yang dapat bekerja di perangkat apa pun: mulai dari pusat data Google hingga perangkat seluler. Untuk mencapai skalabilitas ini, Gemini hadir dalam tiga versi: Nano, Pro dan Ultra.

Google Gemini

Mari kita bicara tentang berbagai versi Gemini secara lebih rinci.

  • Kurcaci Gemini: dirancang untuk berfungsi pada ponsel cerdas, khususnya Google Pixel 8. Ini dirancang untuk melakukan tugas-tugas yang memerlukan pemrosesan efisien oleh kecerdasan buatan tanpa terhubung ke server eksternal, seperti menyarankan jawaban dalam program obrolan atau meringkas teks. Model perangkat ringkas ini memiliki sekitar 6 miliar parameter.
  • GeminiPro: berjalan di pusat data Google. Pro dirancang untuk bekerja dengan chatbot Bard AI versi terbaru. Ia mampu memberikan waktu respons yang cepat dan memahami pertanyaan yang kompleks. Model berukuran sedang memiliki sekitar 100 miliar parameter dan merupakan inti dari AI percakapan Bard. Pro akan tersedia melalui Google Cloud.
  • Gemini Ultra: meskipun versi Ultra belum tersedia secara luas, Google menggambarkannya sebagai model dengan kinerja terbaik, melampaui "model tercanggih saat ini untuk 30 dari 32 tes akademik yang banyak digunakan dalam penelitian model bahasa besar (LLM). " Sebagai versi terbesar dan terkuat, Ultra akan menerima lebih dari 1 triliun parameter. Itu akan berlokasi di pusat data. Ultra diadaptasi untuk penggunaan korporat. Versi ini dirancang untuk melakukan tugas yang sangat kompleks. Google berencana untuk merilisnya setelah akhir tahap pengujian saat ini. Artinya, versi paling kuat belum tersedia untuk pengguna.

Juga menarik: Google Bard AI: Semua yang perlu Anda ketahui

- Iklan -

Bagaimana cara mengakses Gemini?

AI dalam versi Nano dan Pro kini tersedia di produk Google seperti smartphone Google Pixel 8 dan chatbot Bard. Google berencana untuk mengintegrasikannya ke dalam mesin pencari, periklanan, layanan email Gmail, browser Chrome, dan layanan lainnya.

Pengembang dan pelanggan perusahaan akan dapat mengakses Pro melalui Gemini API di Google AI Studio dan Google Cloud Vertex AI mulai 13 Desember 2023. Pengembang Android akan memiliki akses ke model versi Nano melalui AICore, yang akan tersedia dalam pratinjau awal.

Baca juga: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Pertempuran Dua Yokozun

Gemini di Google Bard: Apa yang akan berubah?

Menurut informasi yang diberikan selama presentasi, model ini akan memungkinkan Google Bard menangani masalah yang lebih kompleks dengan lebih baik, sebagaimana dinyatakan:

“Kami merancang Gemini sehingga modelnya secara alami multi-modal dan telah dilatih sebelumnya tentang berbagai modalitas sejak awal. Kami kemudian menyempurnakannya dengan menambahkan lebih banyak data multimodal untuk meningkatkan kinerja. Hasilnya, Gemini dengan mudah memahami dan menyimpulkan jauh lebih baik daripada model multimoda sebelumnya, dan memiliki kemampuan tercanggih di hampir semua bidang.

Kemampuan multimodal Gemini yang luar biasa membantu Anda memahami informasi tekstual dan visual yang kompleks. Mereka sangat berguna ketika mengekstrak informasi spesifik dari kumpulan data yang sangat besar. Kemampuan luar biasa model ini dalam mengekstrak inti informasi dari ratusan ribu dokumen dengan membaca, menyaring, dan menganalisisnya tidak diragukan lagi akan berkontribusi pada penemuan-penemuan baru dan secepat kilat di berbagai bidang mulai dari sains hingga keuangan."

Dalam pemaparannya, diperlihatkan contoh penelitian kompleks yang berisi lebih dari 200 ribu catatan, beberapa di antaranya harus dimutakhirkan sesuai data baru. Seperti yang mungkin sudah Anda duga, melakukan hal ini secara manual akan sangat memakan waktu, sehingga penulis penelitian menggunakan Gemini untuk menyiapkan kode yang menerima masukan dan melakukan pembaruan yang diperlukan. Contoh lain yang lebih nyata adalah penggunaan model bahasa Google untuk menjelaskan soal matematika atau fisika.

Google Gemini

Data masukan disini berupa foto/scan tugas dari pelajaran sekolah. Sistem mampu memproses grafik dan teks yang disimpan di sana dan kemudian menunjukkan bagian mana dari pekerjaan rumah yang diselesaikan dengan benar dan mana yang memerlukan perhatian lebih. Presentasi menunjukkan bahwa pengguna dapat berulang kali meminta Gemini untuk menjelaskan suatu tugas, dan setiap upaya selanjutnya harus dijelaskan dalam bahasa yang lebih sederhana. Seberapa akurat dan benarnya Gemini, tentu saja, akan diperiksa oleh mereka yang tertarik, tetapi kemampuan membaca dan memproses teks langsung dari foto sangat mengesankan. Seperti yang ditambahkan selama presentasi:

"Gemini telah diajari untuk mengenali dan memahami teks, gambar, suara, dan lainnya secara bersamaan. Berkat ini, dia lebih memahami nuansa informasi dan dapat menjawab pertanyaan kompleks. Buku ini sangat efektif dalam menjelaskan topik yang berkaitan dengan matematika dan fisika, sehingga dapat berfungsi sebagai pembantu pekerjaan rumah pribadi".

Gemini di ponsel pintar Google Pixel

Google juga sesumbar bahwa Gemini sedang "belajar" pada chipset TPUv5 baru, dan berencana untuk memperkenalkan Gemini Ultra pada awal tahun 2024, yang akan menggunakan Bard Advanced, versi baru dari model ucapan raksasa versi konsumen. Gemini Ultra saat ini sedang dalam pengujian dan sudah tersedia untuk pakar keamanan terpilih.

Google Gemini

Informasi penting terakhir adalah pengenalan Gemini di smartphone Google Pixel 8. Hal ini antara lain memungkinkan untuk membuat balasan cepat melalui aplikasi Gboard di messenger. Yang pertama adalah WhatsApp, namun tahun depan solusi serupa akan muncul di aplikasi lain yang terkait dengan komunikasi. Namun, ini baru permulaan karena Google telah mengumumkan banyak alat AI baru untuk ponsel pintar Pixel 8 dan akan tersedia di beberapa perangkat lain di masa mendatang. Android. Namun, ini adalah rencana lebih lanjut dan belum ada rincian yang diberikan saat ini.

Apa perbedaan Gemini dengan model AI lainnya, seperti GPT-4?

Model Gemini baru Google tampaknya menjadi salah satu model AI terbesar dan tercanggih hingga saat ini, meskipun peluncuran model Ultra pasti akan menentukan hal tersebut. Dibandingkan dengan model populer lainnya yang saat ini menggunakan chatbot AI, Gemini menonjol dengan fitur multimodalnya sendiri, sementara model lain seperti GPT-4 mengandalkan plugin dan integrasi agar benar-benar multimodal.

Kekhawatiran tentang keakuratan dan ketidakberpihakan

Meskipun Gemini merupakan lompatan besar dalam pengembangan kemampuan kecerdasan buatan, Gemini memiliki kekurangan yang sama dengan model bahasa utama lainnya. Pertama-tama, ini adalah kemungkinan menciptakan informasi palsu. Bias juga didasarkan pada data pelatihan yang tersedia untuk model bahasa baru. Perlu juga disebutkan terbatasnya pemahaman tentang dunia nyata. Google mengakui model Gemini baru bisa saja melakukan kesalahan, memberikan fakta yang tidak berdasarkan bukti dan bertentangan dengan akal sehat.

Google Gemini

Diperlukan lebih banyak pengujian, terutama untuk Gemini Ultra, yang memiliki kemampuan baru yang belum tereksplorasi sepenuhnya. Google berkomitmen untuk mengevaluasi Gemini secara cermat untuk meminimalkan potensi bahaya.

Juga menarik: Semuanya tentang Microsoft Kopilot: masa depan atau cara yang salah?

Masa depan ada di tangan Gemini

Peluncuran Gemini oleh Google membuka era baru pengembangan AI. Dengan performa terbaiknya dibandingkan model sebelumnya dan data dasar manusia, Gemini menunjukkan kemungkinan kecerdasan buatan di masa depan, namun masih memerlukan lebih banyak penelitian untuk mengatasi kekurangan tertentu.

Di masa depan, Gemini dapat menyediakan fitur yang lebih berguna dan cerdas dalam produk Google. Ke depannya, perusahaan berencana untuk terus memperluas Gemini di luar bahasa Inggris dan membangun metodologi model intinya.

Kami hanya bisa melihat dan berharap Google mengetahui apa yang dilakukannya.

Baca juga: 

Yuri Svitlyk
Yuri Svitlyk
Putra Pegunungan Carpathian, jenius matematika yang tidak dikenal, "pengacara"Microsoft, altruis praktis, kiri-kanan
- Iklan -
Daftar
Beritahu tentang
tamu

0 komentar
Ulasan Tertanam
Lihat semua komentar