ЗАТЕЛЕФОНУВАТИ

Синтетичні дані: Нова Ера Штучного Інтелекту

Цього тижня у сфері штучного інтелекту увага була зосереджена на синтетичних даних. OpenAI представила Canvas, новий інструмент для взаємодії з ChatGPT, який дозволяє користувачам створювати та редагувати текст і код в єдиному робочому просторі. Canvas покращує досвід користувачів, дозволяючи генерувати текст та код, а також вносити зміни за допомогою ChatGPT. Ця функція підтримується адаптованою моделлю GPT-4o, яка використовує синтетичні дані для створення нових взаємодій. Керівник продукту ChatGPT Нік Терлі зазначив, що синтетичні дані забезпечують якісні вбудовані коментарі та правки, що значно спрощує роботу.

 

Проте OpenAI не є єдиною компанією, що покладається на синтетичні дані. Meta під час розробки Movie Gen, інструменту для створення та редагування відеокліпів, також використовувала синтетичні субтитри, згенеровані її моделями Llama 3. Хоча для покращення якості субтитрів залучали анотувальників, основна робота була автоматизована, що прискорило процес. Генеральний директор OpenAI Сем Альтман вважає, що в майбутньому ШІ зможе виробляти синтетичні дані, які будуть достатніми для ефективного навчання, що допоможе знизити витрати на анотацію та ліцензування даних.

 

Однак підхід «синтетичні дані перш за все» несе ризики. Моделі, що використовуються для генерації таких даних, можуть викликати галюцинації і містити упередження, що вплине на якість виходу. Без ретельного відбору та фільтрації синтетичні дані можуть призвести до зниження якості моделей та погіршення їхньої функціональності. Тому необхідно проводити таку ж сувору перевірку синтетичних даних, як це роблять з традиційними даними, щоб уникнути потенційних проблем.

 

Незважаючи на труднощі, з якими стикаються розробники, синтетичні дані можуть стати єдиним прийнятним рішенням у ситуаціях, коли дані з реального світу стають дедалі дорожчими та важкодоступними. Сподіваємося, що компанії, які працюють у цій сфері, діяти обережно, враховуючи можливі наслідки.
Синтетичні дані в ШІ: як OpenAI та Meta змінюють технології

Автор: Анна
 

МАЄТЕ ПИТАННЯ?