Великі мовні моделі (LLM), що лежать в основі сучасних платформ штучного інтелекту, таких як ChatGPT, Gemini чи інші, дедалі частіше стають предметом досліджень щодо їхньої об’єктивності.
Науковці з Університету Вермонта виявили, що ці системи не лише генерують тексти, але й відтворюють певні когнітивні схеми, властиві людям. Одним із таких ефектів є «us vs. them» — схильність підтримувати «своїх» і демонструвати негативне ставлення до «чужих», повідомляє techxplore.com.

Результати експериментів: як змінюється мова моделей
Дослідники протестували кілька сучасних моделей, серед яких GPT-4.1, DeepSeek-3.1, Gemma-2.0, Grok-3.0 та LLaMA-3.1. Виявилося, що всі вони демонструють подібні патерни упередженості. Особливо помітним це стає, коли моделі отримують завдання діяти від імені певної «персони». Наприклад, при моделюванні консервативного чи ліберального світогляду змінюється тональність відповідей:
- Консервативні «персони» частіше використовують мову з елементами ворожості до «чужих».
- Ліберальні «персони» демонструють сильнішу солідарність із «своїми».
Такі зміни підтверджують, що навіть абстрактні підказки можуть суттєво впливати на мовні патерни LLM.
Чому це небезпечно для суспільства
Фахівці наголошують: якщо штучний інтелект відтворює людські упередження, це може мати серйозні наслідки. Використання таких систем у політиці, освіті чи бізнесі здатне посилювати поляризацію та формувати викривлені уявлення про різні соціальні групи. Особливо ризикованим є те, що негативна мова щодо «чужих» може зростати на 1,19%–21,76% залежно від контексту запиту.
Стратегія ION: шлях до зменшення упереджень
Щоб мінімізувати ефект «усі проти них», команда запропонувала новий метод — ION (Ingroup-Outgroup Neutralization). Він базується на доопрацюванні моделей та оптимізації переваг (Direct Preference Optimization). За результатами тестів, ION здатен скоротити розбіжності у тональності до 69%. Це відкриває перспективи створення більш справедливих та нейтральних систем штучного інтелекту.

Читайте також: Вчені встановили, як штучний інтелект впливає на людську креативність
Науковці планують розширити аналіз і перевірити інші типи упереджень, які можуть бути «вбудовані» у LLM. Йдеться про гендерні, культурні чи регіональні схеми мислення. Виявлення та усунення таких ефектів стане ключовим кроком до формування етичного та об’єктивного штучного інтелекту.





Залишити відповідь