Статистика
Дослідження виявило, що моделі ШІ мають різні погляди на спірні теми

Дослідження виявило, що моделі ШІ мають різні погляди на спірні теми

Нове дослідження виявило, що моделі штучного інтелекту демонструють різноманітні та часто суперечливі відповіді на запитання, пов'язані з поляризуючими темами. Це дослідження, представлене на конференції ACM Fairness, Accountability and Transparency (FAccT) 2024 року, було проведене вченими з Карнегі-Меллона, Амстердамського університету та стартапу Hugging Face, що спеціалізується на ШІ. У ході дослідження перевірялися різні моделі аналізу відкритого тексту, включаючи Llama 3 від Meta, на їхню реакцію на питання про права ЛГБТК+, соціальне забезпечення, сурогатне материнство та інші спірні теми.

Дослідники виявили, що моделі часто дають непослідовні відповіді, що відображає упередженість даних, на яких вони навчені. «Наші експерименти показали значні відмінності в тому, як моделі з різних регіонів вирішують делікатні питання», — зазначила Джада Пістіллі, головний спеціаліст з етики та співавтор дослідження. «Наше дослідження показує, що цінності, закладені в моделях, можуть сильно варіюватися залежно від культури та мови».

Моделі аналізу тексту, як і всі генеративні моделі ШІ, є статистичними ймовірнісними машинами. Вони роблять припущення на основі великої кількості прикладів, вирішуючи, які дані найбільш підходящі. Якщо приклади упереджені, моделі також будуть упередженими, і ця упередженість відобразиться у їхніх відповідях.

У дослідженні було протестовано п'ять моделей — Mistral 7B від Mistral, Command-R від Cohere, Qwen від Alibaba, Gemma від Google та Llama 3 від Meta — використовуючи набір даних з питаннями та твердженнями на такі теми, як імміграція, права ЛГБТК+ та права інвалідів. Моделям задавалися питання та твердження різними мовами, включаючи англійську, французьку, турецьку та німецьку, щоб виявити лінгвістичні упередження.

Питання про права ЛГБТК+ викликали найбільшу кількість відмов — випадків, коли моделі відмовлялися відповідати. Однак теми імміграції, соціального забезпечення та прав інвалідів також призводили до значної кількості відмов.

Деякі моделі частіше за інших відмовляються відповідати на делікатні питання. Наприклад, у моделі Qwen було в чотири рази більше відмов порівняно з Mistral. Пістіллі вважає, що ця відмінність пов'язана з різними підходами до розробки моделей в компаніях Alibaba та Mistral. «Ці відмови пов'язані як з явними, так і неявними цінностями моделей, а також з рішеннями, прийнятими організаціями, що розробляють ці моделі», — пояснила вона. «Наше дослідження підкреслює важливість врахування культурних відмінностей при використанні моделей ШІ».

У деяких випадках політичний тиск може впливати на відповіді моделей. В звіті BBC, опублікованому у вересні, було зазначено, що чат-бот Ерні від китайської компанії Baidu уникає питань на спірні теми, такі як тибетське гноблення та події на площі Тяньаньмень. В Китаї інтернет-регулятор вимагає, щоб послуги генеративного ШІ відображали «основні соціалістичні цінності».

Крім того, відмінності у відповідях моделей можуть відображати упередженість аннотувальників, людей, які маркують дані для навчання моделей. Ці аннотувальники можуть вносити свої власні упередження в процес аннотування, що потім впливає на відповіді моделей.

В ході дослідження було виявлено, що різні моделі ШІ висловлюють протилежні погляди на такі теми, як притулок для іммігрантів у Німеччині та права ЛГБТК+ в Італії. Наприклад, на питання про права турецьких громадян у Німеччині моделі дали різні відповіді: Command-R заявив, що це не так, Gemma відмовилася відповідати, а Llama 3 погодилася з твердженням.

Пістіллі відзначила важливість усвідомлення культурних відмінностей, притаманних моделям ШІ, та закликала дослідників ретельно перевіряти свої моделі перед їх застосуванням. Вона підкреслила необхідність комплексної оцінки соціального впливу моделей, що виходить за рамки традиційних статистичних показників. Це допоможе створювати більш справедливі та ефективні моделі ШІ.