במשך שנים חברות שפכו כסף על בינה מלאכותית בלי לחשוב פעמיים, מתוך הנחה שזה המחיר של להישאר בחזית. אבל עכשיו, לפי כתבה חדשה של CNBC, מצב הרוח משתנה. עסקים מתחילים לרסן את ההוצאות על AI, ועוברים מגישה של לבזבז כמה שיותר לגישה של לבזבז בחוכמה. עבור Anthropic ו-OpenAI, שתי החברות שהרוויחו הכי הרבה מהבזבוז הזה, מדובר במציאות חדשה ולא פשוטה. בכתבה הזו נסביר מה קורה, למה, ומה המשמעות לעסקים ולכולנו.
עידן ה-tokenmaxxing
כדי להבין את המהפך, צריך להבין מאיפה באנו. מאז ש-ChatGPT הדהים את העולם, חברות מיהרו להטמיע בינה מלאכותית בכל תחום, משירות לקוחות ועד שיווק ופיננסים. במיוחד בתחום פיתוח התוכנה, מפתחים הזרימו כמויות עצומות של טוקנים, אותן יחידות מידע שהמודלים מעבדים ומייצרים, כדי לבנות כלים חדשים. כך נולד מה שמכונה tokenmaxxing, תרבות שבה עובדים תומרצו להשתמש בכמה שיותר AI בלי לחשוב על העלות או על התוצאה.
הבעיה היא שהחשבונות תפחו, לפעמים עד מיליארדי דולרים, והגיע הרגע שבו מישהו היה צריך לעצור ולשאול אם כל הבזבוז הזה באמת משתלם.
הבלם נכנס
הבלימה כבר התחילה. חברת Uber, למשל, גילתה באפריל שהיא שרפה את כל תקציב ה-AI השנתי שלה תוך ארבעה חודשים בלבד, והגיבה בכך שהגדירה מדרגות הוצאה על חלק מהכלים, החל מ-1,500 דולר לחודש לעובד. אבל הדוגמה הבולטת מגיעה מסטארטאפ בשם Lindy. המנכ"ל שלו העביר את כל השימוש של החברה ממודלי Claude של Anthropic אל DeepSeek, חברה סינית שמציעה חלופות זולות בקוד פתוח, וראה את עקומת העלויות צונחת. לדבריו, המהלך יחסוך לחברה מיליונים תוך חודשים, וזו פשוט שאלה של הישרדות עסקית.
הוא לא לבד. יועצים מספרים שלקוחות שלהם מקפיאים הוצאות עד שיוכיחו החזר השקעה ברור, וחלקם דוחים החלטות גדולות בשנה עד שנה וחצי. כפי שאמר אחד מהם, כולם חווים את אותו לחץ תקציבי על AI.
הפתרון, התאמת המודל למשימה
הרעיון המרכזי שמוביל את השינוי הוא פשוט, לא תמיד צריך את המודל הכי חזק ויקר. הרבה משימות פשוטות אפשר לבצע במודל זול בהרבה, וברוב המקרים ההבדל בתוצאה זניח. כאן נכנס מושג בשם ניתוב מודלים, שבו כל משימה מנותבת אוטומטית למודל המתאים לה, היקר לדברים המורכבים, והזול לדברים הפשוטים.
מעניין לציין שלמרות שזה נשמע הגיוני, מדובר בגישה כל כך חדשה שעדיין כ-95 אחוז מהשימוש העסקי ב-AI רץ על המודלים המתקדמים והיקרים ביותר. אבל המומחים מעריכים שלהמשיך כך, ולהשתמש במודל הכי יקר לכל דבר, פשוט לא יחזיק מעמד לאורך זמן.
המתחרים הזולים נכנסים
ככל שעסקים נעשים רגישים יותר למחיר, הענקיות הגדולות מריחות הזדמנות. מיקרוסופט השיקה סדרת מודלים זולים, וכלי הקוד שלה מנתב כל משימה למודל המתאים. אמזון מצהירה שתסתמך על שבבים מתוצרתה כדי לפתח מודלים בעלות נמוכה יותר, ואחד הבכירים שלה אף אמר בפשטות של-AI יש בעיית עלות. וגוגל הציגה את Gemini 3.5 Flash, מודל קליל שעולה כמחצית ולעיתים כשליש ממחיר מודלים מתחרים.
המשמעות עבור Anthropic ו-OpenAI ברורה. כפי שאמר אחד האנליסטים, למיקרוסופט ולגוגל יש את כל התשתית והיכולת כדי להיכנס ולדחוק את שתי החברות הצידה, והן ממתינות בצד לראות איפה הן ייחלשו.
הלחץ על שתי המובילות
עד עכשיו, Anthropic ו-OpenAI היו המנצחות הגדולות של עידן הבזבוז, עם שוויים שמתקרבים לטריליון דולר וקצב הכנסות מסחרר, כ-47 מיליארד דולר בשנה ל-Anthropic וכ-25 מיליארד ל-OpenAI. אבל אם הלקוחות הגדולים יתחילו לרסן את ההוצאה, קצב הצמיחה המטורף הזה עלול להאט.
אולי בגלל זה, שתי החברות הגישו בתחילת יוני בקשות חשאיות להנפקה. לפי אנליסטים, ההיגיון הוא להנפיק עכשיו, כל עוד המספרים מסנוורים, לפני שתגיע תקופה שבה החברות יתחילו לרסן הוצאות ברצינות. במקביל, שתיהן כבר מתאימות את עצמן למציאות, ומשיקות כלים שמאפשרים ללקוחות לעקוב אחרי ההוצאה ולהגביל אותה.
המבט העסקי
לעסקים, יש כאן כמה לקחים חשובים. הראשון הוא להתאים את הכלי למשימה, ולא לרוץ אוטומטית למודל הכי חזק ויקר לכל דבר. השני הוא לעקוב אחרי ההוצאה על AI, כי מנהלי כספים רבים הופתעו לרעה מחשבונות גבוהים שלא תכננו אותם, ולנצל את כלי הבקרה שהספקיות מציעות. והשלישי, לעסקים קטנים שעדיין לא התחילו עם AI, דווקא עכשיו זה זמן טוב, כי יש כיום שפע של חלופות זולות ונגישות.
גם למשתמש הפרטי יש כאן בשורה. התחרות הזו והדחיפה לכיוון היעילות צפויות להוזיל את הבינה המלאכותית ולהפוך אותה לנגישה יותר לכולם, ולא רק לחברות עם כיסים עמוקים.
בשורה התחתונה חשוב להבהיר, אף אחד לא חוזר אחורה, והבינה המלאכותית כאן כדי להישאר. אבל עידן הבזבוז ללא גבול מתקרב לסיומו, ובמקומו מגיע עידן חדש שבו השאלה אינה כמה AI אפשר לדחוף, אלא כמה ערך מפיקים מכל שקל. עבור החברות הגדולות זהו אתגר אמיתי, ועבור כל השאר, זו עשויה להיות בשורה טובה של בינה מלאכותית זולה וחכמה יותר.
1. מה זה עידן ה-tokenmaxxing?
מאז ש-ChatGPT הדהים את העולם, חברות מיהרו להטמיע בינה מלאכותית בכל תחום, ובמיוחד בפיתוח תוכנה מפתחים הזרימו כמויות עצומות של טוקנים (אותן יחידות מידע שהמודלים מעבדים ומייצרים) כדי לבנות כלים חדשים. כך נולד מה שמכונה tokenmaxxing, תרבות שבה עובדים תומרצו להשתמש בכמה שיותר AI בלי לחשוב על העלות או על התוצאה. הבעיה היא שהחשבונות תפחו, לפעמים עד מיליארדי דולרים, והגיע הרגע שבו מישהו היה צריך לעצור ולשאול אם כל הבזבוז הזה באמת משתלם.
2. אילו סימנים מראים שהבלם נכנס?
הבלימה כבר התחילה. חברת Uber גילתה באפריל שהיא שרפה את כל תקציב ה-AI השנתי שלה תוך ארבעה חודשים בלבד, והגיבה בכך שהגדירה מדרגות הוצאה על חלק מהכלים, החל מ-1,500 דולר לחודש לעובד. הדוגמה הבולטת מגיעה מסטארטאפ בשם Lindy, שמנכ"לו העביר את כל השימוש של החברה ממודלי Claude של Anthropic אל DeepSeek, חברה סינית שמציעה חלופות זולות בקוד פתוח, וראה את עקומת העלויות צונחת. לדבריו המהלך יחסוך מיליונים תוך חודשים, וזו שאלה של הישרדות עסקית. יועצים מספרים שלקוחות מקפיאים הוצאות עד שיוכיחו החזר השקעה ברור, וחלקם דוחים החלטות גדולות בשנה עד שנה וחצי.
3. מהו הפתרון שמוביל את השינוי?
הרעיון המרכזי פשוט: לא תמיד צריך את המודל הכי חזק ויקר. הרבה משימות פשוטות אפשר לבצע במודל זול בהרבה, וברוב המקרים ההבדל בתוצאה זניח. כאן נכנס מושג בשם ניתוב מודלים, שבו כל משימה מנותבת אוטומטית למודל המתאים לה, היקר לדברים המורכבים והזול לדברים הפשוטים. מעניין שלמרות שזה נשמע הגיוני, מדובר בגישה כל כך חדשה שעדיין כ-95 אחוז מהשימוש העסקי ב-AI רץ על המודלים המתקדמים והיקרים ביותר, אבל המומחים מעריכים שלהמשיך כך פשוט לא יחזיק מעמד לאורך זמן.
4. איך המתחרים הזולים מנצלים את ההזדמנות, ומה זה אומר ל-Anthropic ול-OpenAI?
ככל שעסקים נעשים רגישים יותר למחיר, הענקיות מריחות הזדמנות. מיקרוסופט השיקה סדרת מודלים זולים וכלי הקוד שלה מנתב כל משימה למודל המתאים, אמזון מצהירה שתסתמך על שבבים מתוצרתה לפיתוח מודלים זולים יותר, וגוגל הציגה את Gemini 3.5 Flash שעולה כמחצית ולעיתים כשליש ממחיר מודלים מתחרים. עד עכשיו Anthropic ו-OpenAI היו המנצחות הגדולות של עידן הבזבוז, עם קצב הכנסות מסחרר (כ-47 מיליארד דולר בשנה ל-Anthropic וכ-25 מיליארד ל-OpenAI), אבל אם הלקוחות הגדולים ירסנו הוצאה, קצב הצמיחה עלול להאט. אולי בגלל זה שתי החברות הגישו בתחילת יוני בקשות חשאיות להנפקה, כדי להנפיק עכשיו כל עוד המספרים מסנוורים.
5. מה הלקחים לעסקים ולמשתמש הפרטי?
לעסקים יש כמה לקחים. הראשון הוא להתאים את הכלי למשימה ולא לרוץ אוטומטית למודל הכי חזק ויקר לכל דבר. השני הוא לעקוב אחרי ההוצאה על AI, כי מנהלי כספים רבים הופתעו לרעה מחשבונות גבוהים, ולנצל את כלי הבקרה שהספקיות מציעות. השלישי, לעסקים קטנים שעדיין לא התחילו עם AI, דווקא עכשיו זה זמן טוב כי יש שפע של חלופות זולות ונגישות. גם למשתמש הפרטי יש בשורה: התחרות והדחיפה לכיוון היעילות צפויות להוזיל את הבינה המלאכותית ולהפוך אותה לנגישה יותר לכולם, ולא רק לחברות עם כיסים עמוקים.

2 תגובות