ב-19 במאי, על במת ועידת המפתחים השנתית שלה, Google I/O, גוגל הציגה את Gemini 3.5 Pro, המודל החזק ביותר במשפחת המודלים שלה. מנכ"ל החברה סונדאר פיצ'אי אמר לקהל משפט אחד שנתקע לכולם בראש, "תנו לנו עד החודש הבא ונביא לכם אותו". הקהל, לפי הדיווחים, נאנח באכזבה. כמעט חודש אחר כך, נכון לאמצע יוני, המודל עדיין לא יצא.
זה הופך את Gemini 3.5 Pro לאחת ההשקות הכי מצופות בתחום הבינה המלאכותית כרגע, ולסיפור מעניין בפני עצמו על הפער שבין הכרזה לבין מוצר שאפשר באמת להשתמש בו. בכתבה הזו נסביר מה גוגל מבטיחה, למה ההשקה מתעכבת, ובעיקר מה כל זה אומר לעסקים, קטנים כגדולים, שכבר היום בונים תהליכי אוטומציה רבים סביב כלי AI.
מה גוגל מבטיחה
לפני הכל חשוב להבהיר נקודה אחת. רוב מה שידוע על Gemini 3.5 Pro מבוסס על הצהרות של גוגל עצמה ועל הערכות, ולא על בדיקות עצמאיות, פשוט כי המודל עדיין לא בידי הציבור. עד שזה יקרה, מדובר בהבטחות ולא בעובדות מאומתות.
המאפיין שתופס את הכותרות הוא חלון הקשר של 2 מיליון טוקנים. בפשטות, חלון ההקשר הוא כמות הטקסט שהמודל יכול להחזיק ולעבד בבת אחת. חלון בגודל כזה מאפשר למודל להכיל מסמכים ארוכים מאוד, בסיסי קוד שלמים או שיחות מתמשכות, הכל בזיכרון העבודה שלו ובו זמנית. אם ההבטחה תתממש, זה יהיה חלון ההקשר הגדול ביותר בכל מודל שקיים היום.
תכונה שנייה היא מצב חשיבה שגוגל קוראת לו Deep Think. הרעיון הוא מודל שמשקיע יותר זמן ומאמץ בחשיבה דרך בעיות מורכבות, במקום לענות מהר. בנוסף, גוגל מבטיחה הבנה רב מודלית מתקדמת, כלומר עבודה משולבת עם טקסט, תמונות ווידאו. לפי בדיקות מוקדמות, איכות הניתוח של וידאו אצל גוגל אף עולה על זו של GPT-5.5, יתרון שמיוחס כנראה לכמות נתוני הווידאו שעליהם המודל אומן.
בתוך מערך המודלים של גוגל, ה-Pro החדש אמור לרשת את התפקיד של שכבת ה-Ultra הקודמת, ולקחת על עצמו את המשימות הכבדות ביותר, כלומר החשיבה המורכבת, הניתוח הרב מודלי העמוק וההקשר הארוך במיוחד.
למה ההשקה מתעכבת
כדי להבין את העיכוב, צריך להכיר את האח הקטן. באותו אירוע במאי, גוגל כן שחררה דגם אחד מהמשפחה החדשה, Gemini 3.5 Flash, והוא כבר זמין לכולם וגם משמש כברירת המחדל באפליקציית Gemini ובחיפוש. ה-Flash הזה היכה את הדגם המקצועי מהדור הקודם ברוב מבחני הקוד והמשימות האוטונומיות, אבל דווקא נסוג במבחנים של חשיבה קשה ושל שליפת מידע מתוך הקשר ארוך.
וכאן נכנס ה-Pro לתמונה. ההערכה הרווחת היא שגוגל מחזיקה אותו בדיוק כדי לסגור את הפער הזה, ולהבטיח שכשהוא יצא, הוא יבליט את עצמו דווקא במשימות שבהן ה-Flash היה חלש בהם. במילים אחרות, גוגל לא ממהרת לשחרר מודל שלא יצדיק את תג ה-Pro. זו החלטה הגיונית מבחינה מקצועית, גם אם היא מתסכלת את מי שמחכה.
השוק כבר מתמחר את העיכוב. בשווקי הניבוי כמו Polymarket, ההימור המרכזי הוא על סוף יוני, עם הסתברות של כ-51% לשחרור עד ה-30 בחודש, ועדיין כ-20% שזה לא יקרה גם עד אז. כלומר, אפילו מי שעוקב מקרוב לא בטוח מתי בדיוק זה יקרה.
מה זה אומר לעסק שלך
הנה החלק המעשי. חלון הקשר של 2 מיליון טוקנים הוא לא סתם מספר מרשים, הוא פותח סוגי עבודה שהיו קודם מסורבלים. עסק יכול להזין למודל חוזה ארוך מאוד, תיק בדיקת נאותות מלא, או בסיס קוד גדול, ולשאול עליו שאלות בלי לחתוך אותו לחתיכות קטנות מראש. בדיוק כאן נמצא היתרון, בעבודות כמו ניתוח משפטי, הבנת מערכות תוכנה גדולות וסינתזה של מחקר מתוך הרבה מסמכים בו זמנית.
לעסקים גדולים זה אומר פוטנציאל לקצר תהליכים יקרים. צוות משפטי או צוות בדיקת נאותות שהיה משקיע ימים בקריאת ערימת מסמכים יכול לקבל סיכום ראשוני וצביעה של נקודות בעייתיות בתוך דקות. השילוב של הקשר ארוך עם מצב החשיבה מכוון בדיוק לסוג העבודה היקרה הזו, וזה גם מה שמצדיק מחיר גבוה.
לעסקים קטנים התמונה מורכבת יותר, ושם המחיר הוא העניין. גוגל עדיין לא פרסמה תמחור רשמי ל-Pro, וההערכות נעות בטווח רחב, החל מסדר גודל דומה לדגם המקצועי הקודם ועד מחירים גבוהים בהרבה, באזור של כמה עשרות דולרים למיליון טוקני פלט. ההבדל הזה קריטי לעסק קטן, כי שימוש בחלון הקשר ענק צורך הרבה טוקנים, והעלות מצטברת מהר. הצד החיובי הוא שגוגל מציעה מנגנון של שמירת הקשר במטמון, שמוזיל משמעותית טוקנים שחוזרים על עצמם, וזה כלי חשוב לכל מי שמריץ תהליך אוטומטי חוזר. עצתי הפשוטה לעסק קטן היא לא להתלהב מהמספרים על הנייר עד שיוצא תמחור אמיתי, ואז לחשב כמה באמת יעלה התהליך הספציפי שלכם.
יש כאן גם לקח רחב יותר, והוא מתחבר ישירות לסיפור הקודם שכתבנו על ההשבתה של Fable 5. מודל שעדיין לא יצא הוא לא חלק מארגז הכלים שלכם, גם אם הוכרז ברעש גדול. אסור לבנות תוכנית עבודה או הבטחה ללקוח סביב יכולת שתלויה בהשקה עתידית שאין לה תאריך מחייב. בין אם מודל מתעכב כמו אצל גוגל, ובין אם מודל יורד מהאוויר כמו אצל אנת'רופיק, המסקנה זהה. זמינות של כלי AI היא לא דבר מובן מאליו, וכדאי לתכנן בהתאם.
ומה לגבי המשתמש הפרטי
למשתמש הפרטי הסיפור רגוע יותר. Gemini 3.5 Flash כבר זמין בחינם בתוך אפליקציית Gemini ובחיפוש של גוגל, כך שרוב האנשים כבר מחזיקים ביד מודל חזק. ה-Pro, כשיגיע, צפוי להגיע בעיקר דרך מנויי התשלום של גוגל. למי שעובד הרבה עם מסמכים ארוכים, כמו סטודנטים, חוקרים או כל מי שצריך לעכל הרבה חומר בבת אחת, חלון ההקשר הגדול יכול להיות שדרוג ממשי. לכל השאר אין סיבה אמיתית למהר, והדגם הקיים יספק את רוב הצרכים.
התחרות, ומה צפוי הלאה
מעבר לגוגל, ההשקה הזו היא חלק ממירוץ צמוד. התחרות בתחום עזה, והלחץ על המחירים גובר, בין השאר בגלל מעבדות סיניות שמשחררות מודלים אגרסיביים מבחינת עלות. האסטרטגיה של גוגל נשענת פחות על הימור על מודל בודד מנצח, ויותר על רוחב, כלומר מגוון דגמים במחירים שונים ששזורים בתוך המוצרים והענן שלה. לעסקים, התמונה הזו דווקא חיובית. כל עוד גוגל, OpenAI ואנת'רופיק רצות אחת אחרי השנייה, הלקוחות הם אלה שמרוויחים, גם ביכולות וגם במחיר. Gemini 3.5 Pro, אם וכשיצא, ישמור את הלחץ הזה על המתחרים ויאלץ את כולם להמשיך להשתפר. בינתיים נותרה שאלה אחת פתוחה, האם גוגל תעמוד בהבטחה של "החודש הבא", או שההמתנה תתארך עוד.
1. מה זה Gemini 3.5 Pro ומתי הוא יוצא?
Gemini 3.5 Pro הוא המודל החזק ביותר במשפחת המודלים של גוגל, שהוצג ב-19 במאי בוועידת המפתחים Google I/O. מנכ"ל גוגל סונדאר פיצ'אי הבטיח על הבמה שהמודל יגיע "בחודש הבא", אך נכון לאמצע יוני הוא עדיין לא שוחרר. בשווקי הניבוי כמו Polymarket ההימור המרכזי הוא על סוף יוני, עם הסתברות של כ-51% לשחרור עד ה-30 בחודש, אך עדיין כ-20% שזה לא יקרה גם אז.
2. מה גוגל מבטיחה במודל החדש?
המאפיין הבולט ביותר הוא חלון הקשר של 2 מיליון טוקנים, כלומר כמות הטקסט שהמודל יכול להחזיק ולעבד בבת אחת, שאם ההבטחה תתממש יהיה הגדול ביותר בכל מודל קיים. בנוסף מבטיחה גוגל מצב חשיבה בשם Deep Think, שמשקיע יותר זמן בבעיות מורכבות, והבנה רב-מודלית מתקדמת של טקסט, תמונות ווידאו. חשוב לזכור שרוב המידע מבוסס על הצהרות גוגל ולא על בדיקות עצמאיות, כי המודל עדיין לא בידי הציבור.
3. למה ההשקה מתעכבת?
באירוע במאי גוגל שחררה את הדגם הקטן יותר, Gemini 3.5 Flash, שכבר זמין לכולם. ה-Flash היכה את הדגם המקצועי מהדור הקודם ברוב מבחני הקוד והמשימות האוטונומיות, אך נסוג במבחנים של חשיבה קשה ושליפת מידע מהקשר ארוך. ההערכה הרווחת היא שגוגל מחזיקה את ה-Pro כדי לסגור בדיוק את הפער הזה ולוודא שהוא יבליט את עצמו במשימות שבהן ה-Flash היה חלש, במקום לשחרר מודל שלא יצדיק את תג ה-Pro.
4. מה המשמעות לעסקים?
חלון ההקשר הגדול פותח סוגי עבודה שהיו קודם מסורבלים. אפשר להזין חוזה ארוך, תיק בדיקת נאותות מלא או בסיס קוד גדול ולשאול עליו שאלות בלי לחתוך אותו מראש. לעסקים גדולים זה אומר קיצור תהליכים יקרים כמו ניתוח משפטי ובדיקת נאותות. לעסקים קטנים התמונה מורכבת יותר בגלל המחיר. גוגל עדיין לא פרסמה תמחור רשמי, וההערכות נעות מסדר גודל דומה לדגם הקודם ועד כמה עשרות דולרים למיליון טוקני פלט. העצה היא לא להתלהב מהמספרים עד שיוצא תמחור אמיתי, ואז לחשב את העלות של התהליך הספציפי.
5. האם משתמש פרטי צריך לחכות ל-Pro?
לרוב לא. Gemini 3.5 Flash כבר זמין בחינם בתוך אפליקציית Gemini ובחיפוש של גוגל, כך שרוב האנשים כבר מחזיקים מודל חזק ביד. ה-Pro, כשיגיע, צפוי להגיע בעיקר דרך מנויי התשלום של גוגל. למי שעובד הרבה עם מסמכים ארוכים, כמו סטודנטים, חוקרים או כל מי שצריך לעכל הרבה חומר בבת אחת, חלון ההקשר הגדול יכול להיות שדרוג ממשי, אבל לכל השאר אין סיבה אמיתית למהר.
