Root Nationمقالاتالتقنياتما هو الجوزاء: كل ما يتعلق بنموذج الذكاء الاصطناعي الجديد من Google

ما هو الجوزاء: كل ما يتعلق بنموذج الذكاء الاصطناعي الجديد من Google

-

أصدرت Google للتو أقوى نموذج للذكاء الاصطناعي على الإطلاق الجوزاء. ما هي وماذا يمكنها أن تفعل؟ عن كل شيء في مقالتنا.

تعمل Google على تطوير أدوات الذكاء الاصطناعي الخاصة بها منذ سنوات. مع الإصدار العام لـ ChatGPT-3 من OpenAI، قامت الشركة التي تدير محرك البحث الأكثر شهرة في العالم أيضًا بإنشاء أداة مماثلة، Bard. لكن هذه الأداة ما زالت مفقودة أمام المنافسين، الأمر الذي لم تستطع جوجل السماح به. لذلك، ليس من المستغرب أن يرى العالم مؤخرًا نموذج Gemini اللغوي الجديد من جوجل، والذي تعرفنا عليه خلال العرض.

إنه مصمم ليس فقط لتحسين LLM (نموذج اللغة الكبير) السابق للعملاق، ولكن أيضًا لتقديم إمكانيات جديدة تمامًا في مجال معالجة النصوص والرسومات والصوت.

- الإعلانات -

لذلك دعونا نلقي نظرة فاحصة على نموذج لغة Google Gemini الجديد.

مثير للاهتمام أيضًا: مشروع OpenAI س*: ما هو ولماذا يعتبر المشروع مصدر قلق

ما هو جوجل الجوزاء؟

يعد هذا نموذجًا جديدًا وقويًا للذكاء الاصطناعي من Google، والذي لا يمكنه فهم النصوص فحسب، بل يمكنه أيضًا فهم الصور ومقاطع الفيديو والصوت. يوصف هذا النموذج متعدد الوسائط بأنه قادر على أداء مهام معقدة في الرياضيات والفيزياء ومجالات أخرى، بالإضافة إلى فهم وإنشاء تعليمات برمجية عالية الجودة في مجموعة متنوعة من لغات البرمجة.

يتوفر Gemini حاليًا من خلال التكامل مع Google Bard وGoogle Pixel 8 وسيتم تضمينه تدريجيًا في خدمات Google الأخرى.

"إن Gemini هو نتيجة لجهد تعاوني هائل عبر فرق Google، بما في ذلك زملائنا في Google Research،" - قال دينيس هاسابيس، الرئيس التنفيذي والمؤسس المشارك لشركة Google DeepMind. "لقد تم تصميمه من الألف إلى الياء ليكون متعدد الوسائط، مما يعني أنه يمكنه التعميم والفهم والتشغيل والجمع بين أنواع مختلفة من المعلومات، بما في ذلك النص والتعليمات البرمجية والصوت والصور والفيديو."

- الإعلانات -

مثير للاهتمام أيضًا: ليس كل ما نسميه الذكاء الاصطناعي هو في الواقع ذكاء اصطناعي. إليك ما تحتاج إلى معرفته

من خلق النموذج؟

كما خمنت على الأرجح، تم إنشاء Gemini بواسطة Google وAlphabet، الشركة الأم لشركة Google، وهو نموذج الذكاء الاصطناعي الأكثر تقدمًا للشركة حتى الآن. كما ساهم قسم DeepMind في Google أيضًا بشكل كبير في تطويره. ليس من المعروف بعد عدد الموظفين الذين شاركوا في التطوير وما هي الأموال التي تم تخصيصها لذلك، ولكن بمعرفة إمكانيات Google، يمكننا التأكد من أن هناك مبلغًا كبيرًا جدًا.

مثير للاهتمام أيضًا: Windows 12: ماذا سيكون نظام التشغيل الجديد؟

فرص

كما أشرت أعلاه، فهو نموذج متعدد الوسائط، مما يعني أنه يمكنه فهم أنواع مختلفة من البيانات والعمل عليها والجمع بينها، بما في ذلك النص والتعليمات البرمجية والصوت والصور والفيديو. فهو يوفر مهارات فهم وتفكير وترميز أفضل مقارنة بأنظمة الذكاء الاصطناعي السابقة.

القدرات الرئيسية للنموذج هي:

  • معالجة اللغة الطبيعية لمهام مثل الترجمة والتلخيص والحوار
  • التفكير الرياضي وحل المشكلات
  • القدرة على توليد التعليمات البرمجية والوثائق
  • فهم الصور والصوت والفيديو
  • تعدد المهام في مجالات مختلفة

كما ترون، القدرات متفوقة على النماذج الأخرى.

وفي اختبارات فهم اللغة والتفكير الرياضي والبرمجة، تفوق جهاز Gemini Ultra على نماذج مثل GPT-4. وعلى وجه الخصوص، فهو النموذج الأول الذي يتفوق على الأداء على المستوى البشري في اختبار فهم اللغة متعدد المهام الضخم (MMLU)، محققًا دقة تزيد عن 90%.

في 32 اختبارًا أكاديميًا لدراسة نموذجية كبيرة للغة، تفوقت جيميني على GPT-4. وفي 30 حالة، كان نموذج اللغة الجديد من جوجل أفضل من المنافس. وهذا يدل على قدرة النموذج على فهم اللغة بشكل كامل.

- الإعلانات -

اقرأ أيضا: مشروع الدماغ البشري: محاولة لتقليد الدماغ البشري

هل هناك إصدارات مختلفة؟

تصف Google هذا الذكاء الاصطناعي بأنه نموذج مرن يمكنه العمل على أي جهاز: من مراكز بيانات Google إلى الأجهزة المحمولة. ولتحقيق قابلية التوسع هذه، يأتي Gemini في ثلاثة إصدارات: Nano وPro وUltra.

دعونا نتحدث عن الإصدارات المختلفة من الجوزاء بمزيد من التفاصيل.

  • الجوزاء نانو: مصمم للعمل على الهواتف الذكية، وتحديداً Google Pixel 8. وهو مصمم لأداء المهام التي تتطلب معالجة فعالة بواسطة الذكاء الاصطناعي دون الاتصال بخوادم خارجية، مثل اقتراح الإجابات في برامج الدردشة أو تلخيص النص. يحتوي طراز الجهاز المدمج هذا على حوالي 6 مليارات معلمة.
  • الجوزاء برو: يعمل في مراكز بيانات جوجل. تم تصميم Pro للعمل مع أحدث إصدار من برنامج الدردشة Bard AI. إنه قادر على توفير أوقات استجابة سريعة وفهم الاستفسارات المعقدة. يحتوي النموذج متوسط ​​الحجم على ما يقرب من 100 مليار معلمة وهو جوهر الذكاء الاصطناعي للمحادثة من Bard. سيكون Pro متاحًا من خلال Google Cloud.
  • الجوزاء الترا: على الرغم من أن الإصدار Ultra ليس متاحًا على نطاق واسع حتى الآن، إلا أن Google تصفه بأنه النموذج الأفضل أداءً، حيث يتجاوز "المستوى الحالي المتطور لـ 30 من 32 اختبارًا أكاديميًا مستخدمًا على نطاق واسع في أبحاث نماذج اللغات الكبيرة (LLM). " باعتباره الإصدار الأكبر والأقوى، سيحصل Ultra على أكثر من تريليون معلمة. سيكون موجودا في مراكز البيانات. تم تكييف Ultra لاستخدام الشركات. تم تصميم الإصدار لأداء مهام معقدة للغاية. تخطط Google لإصداره بعد انتهاء مرحلة الاختبار الحالية. أي أن الإصدار الأقوى ليس متاحًا للمستخدمين بعد.

مثير للاهتمام أيضًا: Google Bard AI: كل ما تحتاج إلى معرفته

كيفية الوصول إلى الجوزاء؟

يتوفر الآن الذكاء الاصطناعي في إصدارات Nano وPro في منتجات Google مثل هواتف Google Pixel 8 الذكية وBard chatbot، على التوالي. تخطط Google لدمجها في النهاية في محرك البحث والإعلانات وخدمة البريد الإلكتروني Gmail ومتصفح Chrome والخدمات الأخرى.

سيتمكن المطورون وعملاء المؤسسات من الوصول إلى Pro من خلال Gemini API في Google AI Studio وGoogle Cloud Vertex AI بدءًا من 13 ديسمبر 2023. المطورين Android سيتمكن من الوصول إلى نموذج إصدار Nano عبر AICore، والذي سيكون متاحًا في معاينة مبكرة.

اقرأ أيضا: Samsung Galaxy فليب 5 مقابل Motorola Razr 40 Ultra: معركة اثنين من يوكوزون

الجوزاء في Google Bard: ما الذي سيتغير؟

وفقًا للمعلومات المقدمة أثناء العرض التقديمي، سيسمح النموذج لـ Google Bard بالتعامل بشكل أفضل مع المشكلات الأكثر تعقيدًا، كما هو مذكور:

"لقد قمنا بتصميم Gemini بحيث يكون النموذج متعدد الوسائط بشكل طبيعي ويتم تدريبه مسبقًا على طرائق متعددة منذ البداية. قمنا بعد ذلك بتحسينها عن طريق إضافة المزيد من البيانات متعددة الوسائط لتحسين الأداء. ونتيجة لذلك، فإن الجوزاء يفهم ويستنتج بسهولة أفضل بكثير من النماذج المتعددة الوسائط السابقة، ويفتخر بأحدث القدرات في جميع المجالات تقريبًا.

تساعدك قدرات Gemini الاستثنائية متعددة الوسائط على فهم المعلومات النصية والمرئية المعقدة. إنها مفيدة بشكل خاص عندما يتعلق الأمر باستخراج معلومات محددة من مجموعات بيانات ضخمة. إن القدرة الاستثنائية لهذا النموذج على استخلاص جوهر المعلومات من مئات الآلاف من الوثائق عن طريق قراءتها وتصفيتها وتحليلها ستساهم بلا شك في اكتشافات جديدة وبسرعة البرق في مختلف المجالات من العلوم إلى التمويل.

وتم خلال العرض عرض مثال لدراسة معقدة تحتوي على أكثر من 200 ألف سجل، بعضها كان لا بد من تحديثه وفق البيانات الجديدة. كما كنت قد خمنت، فإن القيام بذلك يدويًا سيستغرق وقتًا طويلاً للغاية، لذلك استخدم مؤلفو الدراسة برنامج Gemini لإعداد التعليمات البرمجية التي تأخذ المدخلات وتقوم بالتحديثات اللازمة. مثال آخر أكثر واقعية هو استخدام نموذج لغة Google لشرح مسائل الرياضيات أو الفيزياء.

كانت البيانات المدخلة هنا عبارة عن صورة/مسح ضوئي لمهمة من درس مدرسي. كان النظام قادرًا على معالجة الرسومات والنصوص المخزنة هناك ثم الإشارة إلى أجزاء الواجب المنزلي التي تم تنفيذها بشكل صحيح والأجزاء التي تحتاج إلى مزيد من الاهتمام. أظهر العرض التقديمي أنه يمكن للمستخدم أن يطلب من جيميني بشكل متكرر شرح مهمة ما، ويجب شرح كل محاولة لاحقة بلغة أبسط. بطبيعة الحال، سيتم التحقق من مدى دقة وصحة الجوزاء من قبل المهتمين، ولكن القدرة على قراءة النص ومعالجته مباشرة من الصور أمر مثير للإعجاب. كما تمت إضافته أثناء العرض:

"لقد تم تعليم الجوزاء كيفية التعرف على النصوص والصور والأصوات وفهمها والمزيد في نفس الوقت. بفضل هذا، يفهم الفروق الدقيقة في المعلومات بشكل أفضل ويمكنه الإجابة على الأسئلة المعقدة. وهو فعال بشكل خاص في شرح الموضوعات المتعلقة بالرياضيات والفيزياء، لذلك يمكن أن يكون بمثابة مساعد شخصي في الواجبات المنزلية".

الجوزاء في هواتف Google Pixel الذكية

وتفاخرت جوجل أيضًا بأن Gemini كانت "تتعلم" على شرائح TPUv5 الجديدة، وتخطط لتقديم Gemini Ultra في أوائل عام 2024، والتي ستستخدم Bard Advanced، وهو إصدار جديد من الإصدار الاستهلاكي لنموذج الكلام العملاق. Gemini Ultra قيد الاختبار حاليًا وهو متاح بالفعل لاختيار خبراء الأمان.

آخر معلومة مهمة هي إدخال Gemini في الهواتف الذكية Google Pixel 8. سيسمح هذا، من بين أمور أخرى، بإنشاء ردود سريعة من خلال تطبيق Gboard في برامج المراسلة. الأول هو واتساب، لكن مثل هذه الحلول ستظهر في العام المقبل في تطبيقات أخرى تتعلق بالاتصالات. ومع ذلك، هذه هي البداية فقط، حيث أعلنت شركة جوجل عن العديد من أدوات الذكاء الاصطناعي الجديدة لهواتف Pixel 8 الذكية، وستكون متاحة على بعض الأجهزة الأخرى في المستقبل. Android. ومع ذلك، فهذه خطط أخرى ولم يتم تقديم أي تفاصيل في الوقت الحالي.

كيف يختلف Gemini عن نماذج الذكاء الاصطناعي الأخرى، مثل GPT-4؟

يبدو أن نموذج Gemini الجديد من Google هو أحد أكبر نماذج الذكاء الاصطناعي وأكثرها تقدمًا حتى الآن، على الرغم من أن إصدار نموذج Ultra سيحدد ذلك بالتأكيد. بالمقارنة مع النماذج الشائعة الأخرى التي تستخدم حاليًا روبوتات الدردشة المدعمة بالذكاء الاصطناعي، تتميز Gemini بميزة الوسائط المتعددة الخاصة بها، بينما تعتمد النماذج الأخرى مثل GPT-4 على المكونات الإضافية والتكامل لتكون متعددة الوسائط حقًا.

مخاوف بشأن الدقة والحيادية

على الرغم من أن الجوزاء يمثل قفزة كبيرة إلى الأمام في تطوير قدرات الذكاء الاصطناعي، إلا أنه يعاني من نفس أوجه القصور التي تعاني منها النماذج اللغوية الرئيسية الأخرى. بادئ ذي بدء، هذا هو إمكانية إنشاء معلومات كاذبة. تعتمد التحيزات أيضًا على بيانات التدريب المتاحة لنموذج اللغة الجديد. ومن الجدير بالذكر أيضًا الفهم المحدود للعالم الحقيقي. تعترف جوجل بأن نموذج الجوزاء الجديد يمكن أن يرتكب أخطاء ويقدم حقائق لا تستند إلى أدلة وتتعارض مع المنطق السليم.

هناك حاجة لمزيد من الاختبارات، خاصة لـ Gemini Ultra، الذي يتمتع بقدرات جديدة لم يتم استكشافها بالكامل بعد. تلتزم Google بتقييم موقع Gemini بعناية لتقليل الضرر المحتمل.

مثير للاهتمام أيضًا: كل شيء عن Microsoft مساعد الطيار: المستقبل أم الطريق الخطأ؟

المستقبل مع الجوزاء

كان إطلاق Gemini من Google بمثابة إيذان ببدء حقبة جديدة من تطوير الذكاء الاصطناعي. مع أفضل أداء له مقارنة بالنماذج السابقة وخطوط الأساس البشرية، يشير برج الجوزاء إلى الإمكانيات المستقبلية للذكاء الاصطناعي، لكنه لا يزال بحاجة إلى مزيد من البحث لمعالجة بعض أوجه القصور.

في المستقبل، يمكنك أن تتوقع أن يقدم Gemini المزيد من الميزات المفيدة والذكية في منتجات Google. للمضي قدمًا، تخطط الشركة لمواصلة توسيع Gemini إلى ما هو أبعد من اللغة الإنجليزية والبناء على منهجية نموذجها الأساسي.

لا يسعنا إلا أن نشاهد ونأمل أن تعرف Google ما تفعله.

اقرأ أيضا: