Root Nationסטטטיטכנולוגיותמה זה תאומים: הכל על דגם הבינה המלאכותית החדש של גוגל

מה זה תאומים: הכל על דגם הבינה המלאכותית החדש של גוגל

-

גוגל פרסמה זה עתה את דגם הבינה המלאכותית החזק ביותר שלה שנקרא אי פעם מזל תאומים. מה היא ומה היא יכולה לעשות? על הכל במאמר שלנו.

גוגל מפתחת כלי AI משלה כבר שנים. עם השחרור הציבורי של ChatGPT-3 מבית OpenAI, החברה שמפעילה את מנוע החיפוש הפופולרי בעולם יצרה גם כלי דומה, Bard. אבל הכלי הזה עדיין הפסיד למתחרים, מה שגוגל לא יכלה לאפשר. לכן, אין זה מפתיע שהעולם ראה לאחרונה את Gemini, מודל שפה חדש מבית גוגל, עליו למדנו במהלך המצגת.

הוא נועד לא רק לשפר את ה-LLM הקודם (Large Language Model) של הענק, אלא גם להציע אפשרויות חדשות לחלוטין בתחום עיבוד הטקסט, הגרפיקה והסאונד.

- פרסום -

אז בואו נסתכל מקרוב על מודל השפה החדש של Google Gemini.

מעניין גם: OpenAI Project Q*: מה זה ומדוע הפרויקט מעורר דאגה

מה זה Google Gemini?

זהו מודל חדש ועוצמתי של בינה מלאכותית מבית גוגל, שיכול להבין לא רק טקסט, אלא גם תמונות, סרטונים ואודיו. מודל רב-מודאלי זה מתואר כיכול לבצע משימות מורכבות במתמטיקה, פיזיקה ותחומים אחרים, כמו גם להבין ולייצר קוד באיכות גבוהה במגוון שפות תכנות.

Gemini זמין כעת באמצעות אינטגרציה עם Google Bard ו-Google Pixel 8 ובהדרגה ייכלל בשירותים אחרים של גוגל.

"תאומים היא תוצאה של מאמץ מסיבי של שיתוף פעולה בין צוותי Google, כולל הקולגות שלנו ב-Google Research," - אמר דניס חסביס, מנכ"ל ומייסד שותף של Google DeepMind. "הוא נבנה מהיסוד להיות רב-מודאלי, כלומר הוא יכול להכליל ולהבין בצורה חלקה, לפעול ולשלב סוגים שונים של מידע, כולל טקסט, קוד, אודיו, תמונות ווידאו".

- פרסום -

מעניין גם: לא כל מה שאנו מכנים AI הוא למעשה בינה מלאכותית. הנה מה שאתה צריך לדעת

מי יצר את הדגם?

כפי שבטח כבר ניחשתם, Gemini נוצר על ידי גוגל ואלפבית, חברת האם של גוגל, והוא דגם הבינה המלאכותית המתקדם ביותר של החברה עד כה. גם חטיבת DeepMind של גוגל תרמה תרומה משמעותית לפיתוח שלה. עדיין לא ידוע כמה עובדים השתתפו בפיתוח ואיזה כספים הוקצו לכך, אך בהכרת היכולות של גוגל, אנחנו יכולים להיות בטוחים שיש כמות גדולה מאוד.

מעניין גם: Windows 12: מה תהיה מערכת ההפעלה החדשה

הזדמנויות

כפי שציינתי לעיל, זהו מודל רב-מודאלי, כלומר הוא יכול להבין, לפעול ולשלב סוגים שונים של נתונים, כולל טקסט, קוד, אודיו, תמונות ווידאו. זה מספק כישורי הבנה, חשיבה וקידוד טובים יותר בהשוואה למערכות AI קודמות.

היכולות העיקריות של הדגם הן:

  • עיבוד שפה טבעית למשימות כמו תרגום, סיכום ודיאלוג
  • חשיבה מתמטית ופתרון בעיות
  • יכולת הפקת קוד ותיעוד
  • הבנת תמונות, אודיו ווידאו
  • ריבוי משימות בתחומים שונים

כפי שאתה יכול לראות, היכולות עדיפות על דגמים אחרים.

במבחנים של הבנת שפה, חשיבה מתמטית וקידוד, ה-Gemini Ultra עלו על דגמים כמו ה-GPT-4. בפרט, זהו הדגם הראשון שעובר ביצועים ברמת האדם במבחן הבנת השפה הרב-משימות (MMLU) מסיבית, ומשיג דיוק של למעלה מ-90%.

ב-32 מבחנים אקדמיים של מחקר גדול על מודלים של שפה, ג'מיני גבר על GPT-4. ב-30 מקרים, מודל השפה החדש מבית גוגל היה טוב יותר מהמתחרה. זה מדגים את היכולת של המודל להבין את השפה במלואה.

- פרסום -

קרא גם: פרויקט המוח האנושי: ניסיון לחקות את המוח האנושי

האם יש גרסאות שונות?

גוגל מתארת ​​את ה-AI הזה כמודל גמיש שיכול לעבוד על כל מכשיר: ממרכזי נתונים של גוגל ועד מכשירים ניידים. כדי להשיג מדרגיות זו, Gemini מגיע בשלוש גרסאות: Nano, Pro ו-Ultra.

בואו נדבר על הגרסאות השונות של תאומים ביתר פירוט.

  • תאומים ננו: נועד לעבוד על סמארטפונים, בפרט Google Pixel 8. הוא נועד לבצע משימות הדורשות עיבוד יעיל על ידי בינה מלאכותית מבלי להתחבר לשרתים חיצוניים, כמו הצעת תשובות בתוכניות צ'אט או סיכום טקסט. לדגם מכשיר קומפקטי זה יש כ-6 מיליארד פרמטרים.
  • תאומים פרו: פועל במרכזי נתונים של גוגל. Pro נועד לעבוד עם הגרסה העדכנית ביותר של הצ'אטבוט של Bard AI. הוא מסוגל לספק זמני תגובה מהירים ולהבין שאילתות מורכבות. למודל בינוני יש כ-100 מיליארד פרמטרים והוא הליבה של הבינה המלאכותית של בארד. Pro יהיה זמין דרך Google Cloud.
  • ג'מיני אולטרה: למרות שגרסת ה-Ultra עדיין לא זמינה באופן נרחב, גוגל מתארת ​​אותה כדגם בעל הביצועים הטובים ביותר שלה, ועולה על "המתקדם הנוכחי של 30 מתוך 32 מבחנים אקדמיים בשימוש נרחב המשמשים במחקר מודלים של שפה גדולה (LLM). " בתור הגרסה הגדולה והחזקה ביותר, Ultra תקבל יותר מטריליון פרמטרים. הוא ימוקם במרכזי נתונים. Ultra מותאם לשימוש ארגוני. הגרסה נועדה לבצע משימות מורכבות מאוד. גוגל מתכננת לשחרר אותו לאחר תום שלב הבדיקות הנוכחי. כלומר, הגרסה החזקה ביותר עדיין לא זמינה למשתמשים.

מעניין גם: Google Bard AI: כל מה שאתה צריך לדעת

איך לגשת לתאומים?

AI בגרסאות Nano ו-Pro זמין כעת במוצרי גוגל כמו הסמארטפונים של Google Pixel 8 וה-Bard chatbot, בהתאמה. גוגל מתכננת בסופו של דבר לשלב אותו במנוע החיפוש שלה, בפרסום, בשירות האימייל של Gmail, בדפדפן כרום ובשירותים נוספים.

מפתחים ולקוחות ארגוניים יוכלו לגשת ל-Pro דרך ה-API של Gemini ב-Google AI Studio ו-Google Cloud Vertex AI החל מה-13 בדצמבר 2023. מפתחים Android תהיה גישה לדגם גרסת הננו דרך AICore, שיהיה זמין בתצוגה מקדימה מוקדמת.

קרא גם: Samsung Galaxy Flip5 לעומת Motorola Razr 40 Ultra: Battle of the Two Yokozun

תאומים בגוגל בארד: מה ישתנה?

על פי מידע שנמסר במהלך המצגת, המודל יאפשר לגוגל בארד להתמודד טוב יותר עם בעיות מורכבות יותר, כאמור:

"עיצבנו את תאומים כך שהמודל הוא באופן טבעי רב-מודאלי ומאומן מראש במספר אופנים מההתחלה. לאחר מכן שיכללנו אותו על ידי הוספת נתונים רב-מודאליים כדי לשפר את הביצועים. כתוצאה מכך, Gemini מבינה בקלות ומסיקה הרבה יותר טוב מדגמים מולטי-מודאליים קודמים, ומתהדרת ביכולות מתקדמות כמעט בכל התחומים.

היכולות הרב-מודאליות יוצאות הדופן של Gemini עוזרות לך להבין מידע טקסטואלי וויזואלי מורכב. הם שימושיים במיוחד כשמדובר בחילוץ מידע ספציפי ממערכי נתונים ענקיים. היכולת יוצאת הדופן של מודל זה לחלץ את מהות המידע ממאות אלפי מסמכים על ידי קריאה, סינון וניתוחם תתרום ללא ספק לתגליות חדשות ומהירות בזק בתחומים שונים ממדע ועד פיננסים".

במהלך המצגת הוצגה דוגמה למחקר מורכב, המכיל למעלה מ-200 אלף רשומות שחלקן נאלצו להתעדכן על פי נתונים חדשים. כפי שאולי ניחשתם, ביצוע זה ידני יקח זמן רב, ולכן מחברי המחקר השתמשו ב-Gemini כדי להכין קוד שלקח את הקלט וערך את העדכונים הדרושים. דוגמה נוספת, מציאותית יותר, היא שימוש במודל השפה של גוגל כדי להסביר בעיות במתמטיקה או בפיזיקה.

נתוני הקלט כאן היו צילום/סריקה של מטלה משיעור בבית הספר. המערכת הצליחה לעבד את הגרפיקה והטקסט המאוחסנים שם ולאחר מכן לציין אילו חלקים בשיעורי הבית בוצעו בצורה נכונה ואילו זקוקים ליותר תשומת לב. המצגת הראתה שמשתמש יכול לבקש שוב ושוב את מזל תאומים להסביר משימה, וכל ניסיון עוקב חייב להיות מוסבר בשפה פשוטה יותר. עד כמה תאומים יהיו מדויקים ונכונים, כמובן, יבדקו המעוניינים, אבל היכולת לקרוא ולעבד טקסט ישירות מתמונות מרשימה. כפי שנוסף במהלך המצגת:

"מזל תאומים לימדו לזהות ולהבין טקסט, תמונות, צלילים ועוד בו זמנית. הודות לכך, הוא מבין טוב יותר את הניואנסים של המידע ויכול לענות על שאלות מורכבות. הוא יעיל במיוחד בהסברת נושאים הקשורים למתמטיקה ופיזיקה, כך שהוא יכול לשמש כמסייע בשיעורי בית אישיים

מזל תאומים בסמארטפונים של גוגל פיקסל

גוגל גם התפארה בכך ש-Gemini "למדה" על ערכות השבבים החדשות של TPUv5, ומתכננת להציג את Gemini Ultra בתחילת 2024, שתשתמש ב-Bard Advanced, גרסה חדשה לגרסה הצרכנית של דגם הדיבור של הענק. Gemini Ultra נמצאת כעת בבדיקה וכבר זמינה למומחי אבטחה נבחרים.

פיסת המידע החשובה האחרונה היא הצגת Gemini בסמארטפונים של גוגל פיקסל 8. זה יאפשר, בין היתר, ליצור תשובות מהירות דרך אפליקציית Gboard במסנג'רים. הראשון הוא וואטסאפ, אבל בשנה הבאה יופיעו פתרונות כאלה באפליקציות אחרות הקשורות לתקשורת. עם זאת, זו רק ההתחלה, מכיוון שגוגל הכריזה על הרבה כלי AI חדשים עבור הסמארטפונים Pixel 8, והם יהיו זמינים בכמה מכשירים אחרים בעתיד. Android. עם זאת, מדובר בתוכניות נוספות ולא נמסרו פרטים בשלב זה.

במה שונה Gemini מדגמי AI אחרים, כגון GPT-4?

דגם ה-Gemini החדש של גוגל נראה כאחד מדגמי ה-AI הגדולים והמתקדמים ביותר עד כה, אם כי שחרורו של דגם ה-Ultra יקבע זאת בוודאות. בהשוואה לדגמים פופולריים אחרים המשתמשים כיום בצ'אטבוטים של AI, Gemini בולט עם תכונה מולטי-מודאלית משלה, בעוד שדגמים אחרים כמו GPT-4 מסתמכים על תוספים ואינטגרציה כדי להיות ממש מולטי-מודאליים.

דאגות לגבי דיוק וחוסר משוא פנים

למרות שתאומים מהווה קפיצת מדרגה גדולה בפיתוח יכולות בינה מלאכותית, יש לה את אותם חסרונות כמו מודלים עיקריים אחרים של שפות. קודם כל, זו האפשרות ליצור מידע כוזב. הטיות מבוססות גם על נתוני ההדרכה הזמינים למודל השפה החדש. ראוי להזכיר גם את ההבנה המוגבלת של העולם האמיתי. גוגל מודה שמודל הג'מיני החדש יכול לעשות טעויות, לספק עובדות שאינן מבוססות על ראיות וסותרות את השכל הישר.

יש צורך בבדיקות נוספות, במיוחד עבור Gemini Ultra, שיש לו יכולות חדשות שעדיין לא נחקרו במלואן. גוגל מחויבת להעריך בקפידה את תאומים כדי למזער את הנזק הפוטנציאלי.

מעניין גם: הכול על Microsoft טייס משנה: העתיד או הדרך הלא נכונה?

העתיד הוא עם תאומים

ההשקה של Gemini על ידי גוגל הובילה עידן חדש של פיתוח בינה מלאכותית. עם הביצועים הטובים ביותר שלה בהשוואה לדגמים קודמים וקווי בסיס אנושיים, Gemini מצביע על האפשרויות העתידיות של בינה מלאכותית, אך עדיין זקוק למחקר נוסף כדי לטפל בחסרונות מסוימים.

בעתיד, אתה יכול לצפות מ-Gemini לספק תכונות שימושיות וחכמות יותר במוצרי Google. בהמשך, החברה מתכננת להמשיך ולהרחיב את Gemini מעבר לאנגלית ולהתבסס על מתודולוגיית המודל המרכזית שלה.

אנחנו יכולים רק לצפות ולקוות שגוגל יודעת מה היא עושה.

קרא גם: