מאיפה CHATGPT שואב את המידע ?
מאת: נדן פלדמן , מגזין דה-מרקר החודשי, אוקטובר 2025
מחקר חדש שערכה חברת מחקרי AI מבוסטון SEMRUSH , מראה שחלק משמעותי מהתשובות שמספק CHATGPT מגיע ממקורות שהמידע בהם מוטל בספק , ונוצר בעיקר ע"י חובבים ובראשם פלטפורמות מובילות להפצת פייקניוז: פייסבוק , יוטיוב , ואתר הפורומים רדיט . אלה בולטים בתוצאות לצד ויקיפדיה, שאמנם מהווה מקור מידע מרכזי אבל נכתבת על ידי מתנדבים , והיא עתירת אי-דיוקים ומידע כוזב בערכים השונים מאחר שהממשק שלה מאפשר לכל אחד לערוך ולייצור תוכן .
המקרה של הפורומים רדיט בולט מיוחד , הן משום שביחס לגודלו הצנוע יחסית באינטרנט הוא תופס נתח משמעותי בתשובות שמפיק CHATGPT .
המחקר How AI search really works ניתח את החיפושים בCHATGPT בחמש קטגוריות : פיננסים , טכנולוגיה דיגיטלית , שירותים עסקיים, מוצרי אלקטרוניקה ואופנה.
המחקר בחן 150 אלף תשובות לשאילתות , ונערך ביוני 2025. שיטת הבדיקה מתייחסת למספר הפעמים הממוצע שמקור מוזכר בתשובה לכל שאילתא ( פרומפט).
אם המקור מופיע פעם אחת בכל תשובה לשאילתא, השיעור הוא 100% , כשהוא מופיע בממוצע יותר מפעם אחת בכל שאילתא, הנתון גבוה מ100%.
לפי ממצאי המחקר, רדיט ( פורומים ) גובר על מידע מאתרים מומחים בציטוטי חיפוש מקצועיים, ושולט בתוצאות בפער גדול מהשאר . כך, למשל , הוא מופיע כמקור ב176.9% משאילתות הפיננסים של משתמשים בCHATGPT , כלומר , אזכור של כמעט פעמיים בכל שאילתא , וזאת אף שזהו תחום בו הדיוק קריטי.
זאת לא גזירת גורל : בהשוואה שערך המחקר מול גוגל AI MODE , נמצא כי בעוד CHATGPT מעניק לרדיט עדיפות כסמכות ראשונה בייעוץ פיננסי , כלי הבינה המלאכותית של גוגל מעניק עדיפות לאתרי פיננסים מקצועיים כגון BANKRATE ועוד. כלומר , אפשר גם אחרת .
רדיט כמקור מידע שולט בציטוטי CHATGPT בתחומים נוספים , ובראשם שירותים עסקיים ( 141% ) , טכנולוגיה ( 122% ) ומוצרי אלקטרוניקה ( 127% ) .
"כל זה סותר הנחות מסורתיות לגבי סמכות המקורות של בינה מלאכותית" , מציין ראש צוות המחקר , קרלוס סילבה. " זה קורה מאחר שמודלים של בינה מלאכותית עשויים לתעדף חוכמה קולקטיבית על פני מקורות מקצועיים" . " תוכן שנוצר ע"י קהילה ( כגון הפורומים של רדיט) נושא סמכות משמעותית מבחינת הבינה מלאכותית , ובמיוחד בCHATGPT " , לעתים קרובות אפילו יותר מאשר הסמכות של מומחים" .
במקרים מסוימים ההטיה מגיעה עד לכדי אבסורד. כך למשל , הבלוג הרשמי של מיקרוסופט מקבל פחות ציטוטים בCHATGPT מאשר שרשורים בפורומים של רדיט על מוצרי מיקרוסופט.

