בינה מלאכותית – האמנם?

תמיר עיואן
16-06-2024 11:11

שמתם לב שהשימוש במונח בינה מלאכותית נמצא כבר בכל מקום? יצרניות רבות משתמשות במונח הזה, שבמקרה הטוב עלול להטעות, ולעיתים עלול ממש להיתפס כהטעיה מכוונת. כרגיל הכל קשור בכסף. בעוד אנו מדמיינים מחשבים או מכונות שמסוגלות לחשוב בעצמן, לעיתים קרובות מדובר במערכת המקבלת החלטות בהתאם לאלגוריתמים. במקרים אחרים מדובר בלמידת מכונה, כלומר מחשב שקורא טקסטים מרובים, ומסוגל לענות על שאילתות שאנו מפנים אליו, באמצעות השימוש במידע שקיבל מהטקסטים שסרק. כלומר "האימון" שעבר על טקסטים רבים, הביא אותו לענות על שאלות מורכבות, כשהוא מסתמך על המידע ש"אומן" על פיו.

כדי להיחשב כבינה מלאכותית, מערכת צריכה להכיל רמה מסוימת של למידה והתאמה. לכן, תכונות או יכולות של מוצרים שמקבלות החלטות באמצעות אוטומציה או מידע סטטיסטי, אינן נחשבות בינה מלאכותית.

כעיקרון, בינה מלאכותית מוגדרת בשתי קטגוריות:

בינה מלאכותית צרה (Artificial Narrow Intelligence - ANI) ובינה מלאכותית כללית (Artificial General Intelligence - AGI). נכון להיום, לא ידוע לי על כך שפותחה מערכת AGI, אולם אנו בדרך לשם. האתגר בפיתוחה הוא ליצור מודל שמתאים לכל המידע שקיים בעולם ויעבוד באופן קבוע, מה שדורש המון משאבים.

לכן, מה שאנו רואים כיום זה אינטליגנציה מלאכותית צרה, בה מערכת מסוימת מטפלת בתחום ספציפי, בו היא הוכשרה. לדוגמא, זיהוי פנים, המלצה על טיול, זיהוי הונאה וכו'.

מה צריכה בינה מלאכותית כדי לעבוד?

  • המון נתונים איכותיים בלתי מוטים. לדוגמא, Co-Pilot, הבינה המלאכותית של מיקרוסופט, שואבת את הנתונים ממיליארדי פרמטרים שקיימים ב-ChatGPT. כלים אחרים שואבים את המידע שלהם מסריקת מיליארדי אתרי אינטרנט ומסמכים שנמצאים ברשת האינטרנט. בינה מלאכותית שהופכת טקסט לתמונה, כמו DALLE-2 ו-Midjourney, לומדים משילובים של תמונה וטקסט ממאגרי נתונים. כולם לומדים מאינספור המאגרים שעוברים דיגיטציה בחיינו, ומספקים להם מקורות לנתונים.

  • יכולות חישוב מתקדמות. ככל שהמחשבים הופכים חזקים יותר, מודלים הופכים אינטנסיביים יותר. חלק מהם כבר יכול להיות מופעל במחשבים מקומיים ולא חייב סביבת ענן.

  • מודלים ואלגוריתמים משופרים שבעבר היו נחלתם של קוגניציה אנושית בלבד.

  • הכשרה מתמדת עם נתונים חדשים. זה החלק המכריע שבלעדיו מערכות בינה מלאכותית יספקו תשובות שגויות שלא לוקחות בחשבון מידע חדש שיצא לאחרונה.

זה כל מה שצריכה בינה מלאכותית?

יש הטוענים, שבינה מלאכותית אינה מסתיימת בהסקת מסקנות ממאגרי מידע. חשובה גם היכולת להקיש מסיטואציה אחת על אחרת. כי בינה אנושית אינה חד מימדית. מכיוון שלבינה מלאכותית של מכונות אין יכולת לחוש אירועים שחווינו בעבר, הווה ועתיד, חסר בה מרכיב הרגש, ולכן היא נותרת בחשיבה לוגית בלבד.

מנועים כמו ChatGPT יכולים כמובן להיות שימושיים מאוד, ויכולים אפילו לחזות אירועים על סמך מידע דומה שלמדו אותו בעבר, אבל לא מעבר לכך. כשאנו ממשיכים להשתמש במונח בינה מלאכותית ביישומים פשוטים, אנו מניחים שהעולם פועל רק על בסיס של רציונל ברור, כשבעצם בפועל זה לא כך.

מאד קל לייחס אינטליגנציה למנועים כמו ChatGPT, אבל יכולת החיזוי שלו נובעת לרוב מחישובים מתמטיים. היכולות שלו לזהות צירופי מילים מסוימות בכמויות טקסט עצומות שסרק ועיבד, הביאו אותו ללמוד תבניות דקדוק רבות, וזו גם אחת הסיבות שבכל פעם ChatGPT מספק תשובות שונות במקצת במידה ונשאל את אותה השאלה שוב ושוב.

היכולת שלו להתנסח בסגנון אנושי גורמת לנו לדמיין כאילו עונה לנו אדם, אבל בפועל מדובר בכלי שמשתמש במידע שלמד, על מנת לנסח תשובה בסגנון שמוכר לנו מבני האדם. למעשה הוא לא יודע את התשובה, אלא פשוט יודע לחבר את המילים אחת אחרי השניה למשפט שנשמע למשתמש הגיוני.

חשוב לציין שגם ל-AI הנוכחי יש שימושים אדירים, ואנשים רבים עשוים למצוא בו אינספור אפליקציות בעלות ערך רב. כבר עכשיו, הוא מספק כלים שימושיים לקבלת מידע ונמצא בשימוש בשגרה.

AI אילוסטרציה

מהי בינה אמיתית?

בינה אמורה להיות עם תובנה, כלומר היכולת לשפוט האם רעיון מסוים טוב או לא. ל-AI כיום אין באמת תובנה. ChatGPT לא יכול להגיד לנו אם התשובה שלו לשאלה שלנו תהיה טובה מזו של ג'מיני, המתחרה של גוגל, או טובה מתשובה אחרת שנציג לו. לכן, כיום ה-AI יכול לספק תוצאות טובות, אבל לא להמציא דבר שמעולם לא למד אותו.

יישומים המתהדרים בשם AI

כיום כמעט כל סמארטפון שכולל אפליקציה לשיפור איכות תמונה מתהדר במונח AI, כשבפועל חלקם פשוט כולל אלגוריתם המשפר תמונה. אחרים מציעים תרגום טקסט בזמן אמת, משפרים את הסאונד בטלוויזיה, מעמעמים את התאורה בהתאם לשעות היממה, מזהים פנים של אדם, הכל תוך שימוש במונח AI, כשבפועל בחלק מהמקרים מדובר ביכולות שכלל אינן נדרשות לבינה מלאכותית. אחת הסיבות לכך היא שרבים מהאנשים מצפים לכניסת ה-AI לחייהם ומוכנים בקלות רבה יותר לרכוש מוצרים שמתהדרים ביכולות אלה.

צפוי שבמיוחד אנו שכה אוהבים טכנולוגיה ומעריכים קידמה, נחשף בקרוב למגוון אדיר של מוצרים ושירותים שמתהדרים במונח AI, ולכן כדאי שנבחן כל תכונה במקצועיות ונזהה אם אמנם מדובר בשילוב AI, או בכסות עתידנית שהיצרנים מתהדרים בה.

 

מעבר לתגובות בפורום
exupgh12
חבר משקיען
על זה נאמר:

i want AI to do my laundry and dishes so that I can do art and writing, not for AI to do my art and writing so that I can do my laundry and dishes
T
Tamir Ivan
כתב האתר
הי גיא, הזכרת לי סרטון של ברקוני שהמסקנה שלו שבסוף המיקצועות היחידים שישארו לבני האדם הן עבודות הכפיים :-).
pruym
חבר משקיען
כבר שנים שאני טוען שלואו טק זה העתיד
במקצוע שלי זה הכי בולט…
T
Tamir Ivan
כתב האתר
@pruym
חשבת להשאיר אותנו במתח? :-)
תשתף מה המקצוע שלך ומהן התוכניות שלך לגביו?
ל
ליאור
חבר משקיען
הי, כמה הבהרות בנוגע למשפט הבא "לדוגמא, Co-Pilot, הבינה המלאכותית של מיקרוסופט, שואבת את הנתונים ממיליארדי פרמטרים שקיימים ב-ChatGPT. כלים אחרים שואבים את המידע שלהם מסריקת מיליארדי אתרי אינטרנט ומסמכים שנמצאים ברשת האינטרנט."

co-pilot של מיקרוסופט בנוי מעל התשתית (המודלים השפתיים) של openAI (שמציעה את שירות chatGPT), הוא אינו ניגש ל chatGPT ואינו שואב ממנו דבר בזמן פעולתו. אני לא יודע על אילו פרמטרים מדובר בטח שלא על מליארדים מהם. אני מעריך שזה פשוט ניסוח שאינו ברור (לי) דיו (כנראה שהתכוונת למערך נתונים - dataset).
מיקרוסופט מגינה על המשתמשים שלה והארגונים שמשתמשים בה, ועל המידע שלהם, זאת בשעה שמידע שמגיע ל chatGPT באמצעות אימון, שאלות, הפניות לאתרים, פידבק וכו.. נכנס לשירות הכללי וזמין לכל (כמו הפאשלה של סמסונג שבטעות חשפה את הקוד הפרטי שלה לעולם..).


בכל מקרה, למען הסדר הטוב: "סריקת מיליארדי אתרי אינטרנט ומסמכים שנמצאים ברשת האינטרנט" זו פעולה שבמודל שפה (או מודל למידת מכונה באופן כללי) נקראת "אימון" (training), כשה dataset (מערך נתונים - ביטוי שאני לא מכיר מי שמשתמש בו בעברית..) הוא אותם "מליארדיי..". הואיל ו co-pilot של מיקרוסופט משתמש בתשתית של openAI, אז בדיוק כמו אותם "כלים אחרים" הוא אומן באמצעות "מליארדי אתרי אינטרנט ..." (בגדול אותו dataset).
ההבדל הוא שבנוסף הוא מקבל כקלט (ללמידה, או "אימון" מתמשך), את המסמכים שהמשתמש מייצר ב 365 (אקסל, וורד וכו...), וגם את המסמכים (365) של כלל הארגון. זה מייצר קונטקסט ספציפי ל co-pilot, כשבשונה ממנו chatGPT עצמו, מתיימר להיות שירות מודל שפה כללי.

אגב, יש מוצר נוסף מודל שפה נוסף שנקרא Copilot של ארגון github , שגם הוא בנוי מעל המודלים של openAI, קרי גם הוא "אומן" באופן דומה למי שבנוי מעל המודלים של openAI, אבל הוא גם אומן בקוד של מאות אלפי פרוייקטים שמנוהלים דרכו מה שמייצר קונטקסט ספציפי, והוא כלי לא רע (שלא לומר מצויין) למפתחים (או לארגונים שרוצים לקצץ במשרות ג'וניור. אמיתי.).
להייטקיסטים, גם Stack overflow בחגיגה כשמסתמא הכלי שלהם עבר אימון מעל מליוני שו"ת במסד הנתונים של האתר.
pruym
חבר משקיען
@pruym
חשבת להשאיר אותנו במתח? :)
תשתף מה המקצוע שלך ומהן התוכניות שלך לגביו?
לא מתח אבל המקצוע שלי הוא מהנדס מכונות והוא לא קשור בשום צורה לתחומי העניין בפורום.
בתחומים שאני בקיא בהם בדקתי האם יש לבינה המלכותית תשובות סבירות והגעתי למסכנה מאוד חד משמעית שלא…
T
Tamir Ivan
כתב האתר
הי ליאור,
אנו אמנם סוטים מהפואנטה של הכתבה, אבל אשמח לדייק איתך את הכתוב.
בנוגע להתייחסותך ל"אני לא יודע על אילו פרמטרים מדובר בטח שלא על מליארדים מהם", לדעתי אתה מבלבל בין שורות קוד לפרמטרים, או במילים המיקצועיות "מישקלים". הקוד עצמו לא גדול, אבל הפרמטרים (מישקלים) רבים מאד. לכן גם האימון לוקח המון משאבי דיסק לשמור לעבד את התוצאות ובסוף מוציא קובץ משקלים.

copilot משתמש לא רק בתשתית של chat GPT, אלא משתמש במאגר שנוצר בעקבות האימון שלו. המודל של open AI הוא מאגר סגור ש- open AI סוחרת בו. זה המודל הכלכלי שלהם.

co-pilot של מיקרוסופט אכן בנוי מעל התשתית של openAI. הוא אכן אינו ניגש ל chatGPT ואינו שואב ממנו דבר בזמן פעולתו, אבל הוא משתמש במודל שנוצר לאחר תהליך האימון שעבר Chat GPT ב- Open AI. לא לחינם מיקרוסופט השקיעו סכומים אדירים ב-Open AI. אגב, Open AI מכרה את זכויות השימוש במודל שלהם גם לאפל, וגם היא תשתמש במודל שיצרה Open AI ל-Chat GPT, תעשה לו fine tuning, והנה עוד AI נולד.

גם אתה יכול לשלם להם והם יאפשרו לך להשתמש ב- API שלהם לצרכי פיתוח עתידי. אל תשכח שהמאגר של open AI מאד רגיש לקונטקסט. לכן יתכן שגם copilot עשו אימון בעצמם כדי לעשות fine tune לתוצאה של שאילתא שתיתן להם, אבל הם מסתמכים על האימון הבסיסי של open AI. אימון זה תהליך מאד יקר ואיטי, ולכן ברור ש-copilot לא יתחילו לאמן מההתחלה.

אנו סוטים לחלוטין מהנושא, אבל חשוב להבין את הדברים ולדייק אותם.
מוסכם?
ל
ליאור
חבר משקיען
הואיל ו co-pilot של מיקרוסופט משתמש בתשתית של openAI, אז בדיוק כמו אותם "כלים אחרים" הוא אומן באמצעות "מליארדי אתרי אינטרנט ..." (בגדול אותו dataset).

הוא אכן אינו ניגש ל chatGPT ואינו שואב ממנו דבר בזמן פעולתו, אבל הוא משתמש במודל שנוצר לאחר תהליך האימון שעבר Chat GPT ב- Open AI.


1.די בפירוש כתבתי ששניהם מבוססים על אותו dataset.
2. לא ברור לי עד הסוף מה הנושא, לא כל שכן מדוע יש כאן סטיה מוחלטת ממנו. עם זאת, כתבה שלך, נקבל הערתך ונמשיך הלאה.
3. לגבי "פרמטרים" אולי זה לא המקום להיכנס לדיון על העקרונות של רשתות ניורונים (שזה מבנה הנתונים התשתיתי של רוב הפרוייקטים). יחד עם זאת חשדתי ואף כתבתי "אני מעריך שזה פשוט ניסוח שאינו ברור (לי) דיו (כנראה שהתכוונת למערך נתונים - dataset)" שהרי בכל מקרה המודל עבר אימון מכמות עצומה של מקורות.
הניסוח בכתבה הותיר בי את הרושם (המוטעה) כאילו הטכנולוגיה של מיקרוסופט "שואבת את הנתונים ממיליארדי פרמטרים שקיימים ב-ChatGPT", לעומת "כלים אחרים שואבים את המידע שלהם מסריקת מיליארדי אתרי אינטרנט ומסמכים שנמצאים ברשת האינטרנט".
זאת בשעה שמיקרוסופט בהחלט עברה את אותו הטריינינג, שזה היה כל המסר.
עכשיו אני חושב, שבכלל התכוונת לכלי AI שמבצעים חיפוש "חי" באינטרנט לפני מתן תשובות (כמו Arya).

4. ככל שאני משתדל לנחש מה הנושא (האם לסווג חלק מהכלים שהוזכרו כ"בינה מלאכותית"), אז אני אכן לא מסכים עם התזה כלל ועיקר.
לא כי כתוב משהו לא נכון עובדתית, אלא שהמסקנות שלי לגבי הטכנוטלוגיות האלה שונות למדי.
T
Tamir Ivan
כתב האתר
ליאור,
נושא הכתבה הוא האמנם השימוש במונח בינה מלאכותית אכן ראוי למגוון המוצרים והיישומים אליהם אנו נחשפים כיום.
כמבוא לכתבה הצגתי את העיקרון עליו עובדים המנועים כדוגמת Chat GPT. בכתבה התייחסתי לכך שלהבנתי מדובר ביצירת כלי שמחקה באופן משכנע התבטאות אנושית שכולנו מתפעלים ממנה, ואפילו משתכנעים ממהימנותה, אבל כשיורדים לפרטים, אין כאן לדעתי באמת בינה ובוודאי שלא תבונה.
הכתבה פתוחה לדיון בפורום בדיוק על מנת שכל אחד יוכל להתייחס ולקיים דיון. תבוני :)
shushu
חבר משקיען
אחת הבעיות המרכזיות של מודלי שפה, כדוגמת gpt, היא ״הזיות״. המודלים ״מחרטטים חופשי״ כמו ילד בן 12 שרוצה לרצות את ההורים באופן כזה שנותן תשובות לא נכונות הנשמעות הגיוניות (למשל שדרייבר קראמי עדיף ). יש תחום שנקרא prompt engineering שבתכלס מנסה להנדס את השאילתות באופן כזה שיגרום למנוע ״לחרטט פחות״ ואפילו לתת תשובות יותר דטרמניסטיות כששואלים את אותה השאלה שוב ושוב

ישנם כלים שונים היום שמשתלבים עם מודלי שפה
לדוגמא נניח המודל צריך לבצע פעולה מתמטית, במקום לחרטט בעצמו הוא יפעיל מחשבון, יקבל תשובה מדויקת וישלב אותה בשאר הטקסט. או לדוגמא מודל שאימנו לפני שנה, שיקבל שאילתה על סיכויי טראמפ לזכות בבחירות, יכול להפנות את עצמו לסקרים שונים שלא התאמן עליהם ולהסיק מסקנה כלשהי ״מחומר פתוח״ שלא ראה קודם. זוהי כמובן לא תבונה אנושית, אבל היכולות מתקדמות די מהר.

כיום בעיקר חברות מאוד גדולות מסוגלות לאמן מודלי שפה. העסק דורש הרבה כסף וכח מחשוב. המודלים עובדים על סמך ההסתברות ״להגריל״ את המילה הבאה במשפט על סמך רצף המילים הקודם. למרות שנשמע אידיוטי, כמה פעמים שמעתם יצור אנושי מוציא משפט כמו ״שרה שרה שיר בורקס?״

ניתן להכניס כשאילתה למודלי שפה טקסטים שהם לעולם לא ראו או התאמנו, ולבקש לתמצת, או למצוא טעויות או סתירות פנימיות, ממש כמו מבחן עם ״חומר פתוח״. למשל סטרטאפ שבודק מבחנים בהסטוריה.. מכניסים את תוכן הספר, את התשובה של התלמיד ומבקשים מהמודל למצוא סתירות בטקסט... אם יש סתירות התלמיד לא ענה נכון.

המאמר שפרץ את הדרך למודלים של openAI נכתב בכלל על ידי Google... הם פרסמו אותו אבל לא האמינו שחברה אחרת תכנס בכל הכח.

עד כאן לשעת ליילה מאוחרת זו... מי שעדיין לא הפנים, החרא הזה שינה את העולם, והעסק רק יתגבר. יש הרבה סכנות, לא בטוח שהאנושות בכלל מבינה את כולן כרגע.
ל
ליאור
חבר משקיען
ליאור,
נושא הכתבה הוא האמנם השימוש במונח בינה מלאכותית אכן ראוי למגוון המוצרים והיישומים אליהם אנו נחשפים כיום.
כמבוא לכתבה הצגתי את העיקרון עליו עובדים המנועים כדוגמת Chat GPT. בכתבה התייחסתי לכך שלהבנתי מדובר ביצירת כלי שמחקה באופן משכנע התבטאות אנושית שכולנו מתפעלים ממנה, ואפילו משתכנעים ממהימנותה, אבל כשיורדים לפרטים, אין כאן לדעתי באמת בינה ובוודאי שלא תבונה.
הכתבה פתוחה לדיון בפורום בדיוק על מנת שכל אחד יוכל להתייחס ולקיים דיון. תבוני :)


אני מסתכל על כל העולם של בינה מלאכותית בצורה פחות דטרמיניסטית, או לפחות פחות כאילו יש רף* (נתייחס בהמשך) שבמידה ונחצה אותו אז נוכל להגדיר את הטכנולוגיה כ'בינה מלאכותית'.
כמו שאני תחפס את הנושא, ככול שמערכת AI עושה עבודה יצירתית (לאו דווקא יצרנית), שבעבר רק בני אדם היו עושים אותה, ועושה את זה טוב, אז מבחינתי לפחות זו בינה.
למשל: אם אני מבקש מ DaLL e2 לצייר משהו ע"פ תיאור בע"פ של רעיון, אז היא תעשה עבודה טובה, מהר מאוד, וצורה הרבה יותר משכנעת מהרבה מאוד אנשים.
אם אתה מבקש מ chatGPT לנסח מכתב רשמי, הוא יעשה את זה טוב יותר מהרבה מאוד אנשים.
אם אתה מבקש ממנו לכתוב מסמך אקדמאי, הוא יעשה את זה טוב. יותר מכמה וכמה בוגרי תואר שני.
אם אתה מבקש ממנו לייצר קוד תוכנה, אז הוא יעשה את זה בצורה יחסית משכנעת, גם אם כרגע הוא לא יצליח לעשות דברים יותר מדי מורכבים. בנושא זה של "עבודה יצירתית הנדסית" הוא עוד לא שם.
הרבה פעמים, כאשר יש משהו שאנו חושבים ש"רק בן אנוש יכול", ואז תוכנה עושה את זה' אנו חדלים לסווג את זה כ'בינה מלאכותית'. אולי זה נכון טכנית. אבל מבחינתי אני שומר על 'קונטקסט היסטורי' (אין לי ביטוי אחד כרגע) וכן מזהה את זה כבינה מלאכותית.
למשל, לפני שלושים שנה, היו מספרים לסטודנטים להנדסה ש"מחשב לא יכול לזהות גיל של בן אדם, וזה משהו שכל ילד בן 5 יכול לעשות". ובכן, זה כבר לא הכי מדוייק.
היה אתגר אדיר בכל הנושא של "הבנת שפה טבעית" (natural language understanding), ובפרט בניהול שיחה אנושית, ובימינו גם היום ה"רף האנושי" הזה נחצה. או לפחות בדרך הבטוחה להחצות (זוכר את מבחן טיורינג? משנות ה 50..?).

סה"כ, כל אחד מחליט אחרת היכן עובר הגבול בין 'אוטומציה', בה מחשב מבצע עבודה אנושית טריוויאלית, רק מהר מאוד ובאופן יעיל ואף על אנושי, או 'בינה', בה מחשב מבצע עבודה יצירתית שבעבר היתה 100% אנושית. זה שאתה מבין כיצד עובדת רשת ניורונים, וכיצד מאמנים דאטה סט אדיר, ועוד נושאים טכניים לגבי כיצד המנוע מתפקד, זה לא משנה את המבחן הפשוט שלי: האם העבודה היצירתית מתחרה במשהו שבן אנוש יעשה.


* הרף, לפחות מבפרי מדע בדיוני, זה כשבינה מלאכותית תגיע למודעות לעצמה (consciousness), ואז היא עשויה (או עלולה לפי הפסימיים) לפתח אג'נדה. ואולי האג'נדה שלה יהיה לשרוד. קצת skynet אבל לך תדע..
בכל מקרה, עד שיהיה לנו מחשב קוונטי אמין וזמין, נראה לי שאנו יחסית "בטוחים". אמנם הרבה משרות בסכנה, ויכולת החשיבה העצמית של אנשים תידרדר מעצלנות, אבל זה 'בחזקת לא נעים לא נורא'.
pruym
חבר משקיען
אם אתה מבקש מ chatGPT לנסח מכתב רשמי, הוא יעשה את זה טוב יותר מהרבה מאוד אנשים.
או הספד יותר טוב מ:
לאה יא לאה
היית מאה מתוך מאה
איך כולם בבאסה עליה
ואיך נמשיך פה בלעדיה

וואלק לא יודע
וואלה לא יודע
אל יופיה המשגע
אל קולה וחמוקיה