Штучний інтелект навчається розуміти людські емоції – компанії залучають акторів та імпровізаторів.

Платформа Handshake пропонує імпровізаторам за роботу до 74 доларів на годину.

Компанії, що займаються штучним інтелектом, почали залучати акторів імпровізації для навчання моделей розпізнавати людські емоції та інтонацію спілкування. Вакансії пропонує платформа Handshake AI, яка постачає навчальні дані для провідних лабораторій у сфері ШІ. Учасники імпровізуватимуть сцени в онлайн-форматі та допомагатимуть моделям відтворювати природну людську комунікацію, повідомляє The Verge.

Згідно з описом вакансії, учасники братимуть участь у оплачуваному імпровізаційному проєкті для “однієї з провідних компаній у сфері штучного інтелекту”. Вони працюватимуть у відеодзвінках з іншими виконавцями, отримуючи короткі підказки або ситуації для спільної імпровізації.

Основною вимогою до кандидатів є досвід у театральній або імпровізаційній діяльності. Крім того, у вакансії підкреслюється необхідність “емоційної обізнаності”, зокрема “здатності розпізнавати, виражати та переходити від однієї емоції до іншої так, щоб це виглядало природно та по-людськи”.

Такі дані необхідні для вдосконалення великих мовних моделей, які часто демонструють нерівномірні результати. Вони можуть успішно виконувати складні завдання, але водночас помилятися у простих речах, тому розробники намагаються заповнити прогалини за допомогою вузькоспеціалізованих наборів даних.

У вакансії зазначено, що імпровізаційні сесії будуть відкритими та не матимуть жорсткого сценарію. Учасники будуть “імпровізувати сцени, розкривати персонажів і природно реагувати в конкретній ситуації, маючи достатньо творчої свободи для формування ходу кожної взаємодії”.

Роль передбачає часткову зайнятість із гнучким графіком та середньою оплатою близько 74 доларів за годину. Водночас журналісти The Verge раніше повідомляли, що в подібних проєктах початкові ставки часто знижуються після приєднання виконавців, а кількість доступних завдань може бути обмеженою.

Обговорення вакансії активно триває у спільноті r/improv на Reddit, де здебільшого її сприйняли як “антиутопічну” спробу ШІ привласнити людську щирість. Поки одні користувачі іронізують щодо втрати “прибуткових” місць у комедії, інші закликають саботувати навчання моделей. Проте багато хто вірить, що цифровізація лише збільшить попит на “живий”, неідеальний гумор, який комп’ютер не здатен відтворити.

Зростання попиту на подібні дані пов’язане з розвитком мультимодальних моделей. Такі системи здатні не лише генерувати текст, зображення або відео, а й спілкуватися з користувачами голосом із реалістичними інтонаціями. 

Минулого року компанія OpenAI розширила голосовий режим ChatGPT, додавши кілька нових функцій та варіантів голосів для спілкування. Подібні функції також тестують інші розробники, зокрема xAI у чат-боті Grok та Anthropic у системі Claude.