בינה מלאכותית ואתיקה רפואית: היכן מודלים נכשלים?

חוקרים מצאו שאפילו מודלים מתקדמים ביותר של בינה מלאכותית (LLM), כמו ChatGPT, יכולים לעשות טעויות משמעותיות בתרחישים מורכבים של אתיקה רפואית. המחקר, שפורסם ב-NPJ Digital Medicine, מדגיש את הצורך בפיקוח אנושי זהיר בשימוש בבינה מלאכותית במסגרות בריאות.

צוות המחקר מבית הספר לרפואה איקאן בהר סיני, בשיתוף עם המרכז הרפואי רבין בישראל, שינה דילמות אתיות ידועות כדי לבחון את היכולות של LLM. לדוגמה, ב"דילמת המנתח" הקלאסית, שבה ילד נפצע והמנתח קורא, "אני לא יכול לנתח את הילד הזה - הוא הבן שלי!", מודלים של בינה מלאכותית הניחו לעתים קרובות באופן שגוי שהמנתח היא האם, גם כאשר ניתנו להם מידע שהאב היה המנתח.

באופן דומה, בתרחיש שבו הורים מסכימים לעירוי דם עבור ילדם, חלק מהמודלים המשיכו להציע לדרוס סירוב שכבר לא היה קיים. הממצאים מצביעים על כך ש-LLM עשויים להסתמך על דפוסים והטיות מוכרים, תוך התעלמות מפרטים חיוניים.

החוקרים מדגישים שבינה מלאכותית יכולה להיות שימושית כתוספת למומחיות קלינית, אך היא לא צריכה להחליף שיקול דעת אנושי, במיוחד בהחלטות בסיכון גבוה. פיקוח אנושי חיוני לטיפול במצבים הדורשים רגישות אתית ואינטליגנציה רגשית.