Джейсон Коэн считает, что синтетические данные на основе генеративного ИИ преобразят разработку товаров повседневного спроса

Фото: Baltphoto

В 2007 году Джейсон Коэн был начинающим политологом, изучавшим Китай. Как оказалось, местные жители и китайское правительство — не слишком обрадовались тому, что американский студент политологии задает множество вопросов.

К счастью для Коэна, это первоначальное сопротивление со стороны китайских чиновников стало началом извилистого пути, который в конечном итоге привел его к чаю и, неожиданно, к разработке инструментов ИИ, помогающих брендам продуктов питания ускорить выход на рынок. The Spoon недавно связался с Коэном, чтобы узнать о его пути от чайных рынков провинции Юньнань до его текущей роли в Simulacra Data.

Случайное начало на чайных рынках

Вскоре после прибытия в Китай молодой вундеркинд Коэн, который окончил школу раньше и был отправлен изучать политику, столкнулся с трудностями.

Это неожиданное погружение в дегустацию чая развило вкусовые рецепторы Коэна и заложило основу для его будущих начинаний в понимании предпочтений потребителей.

Вскоре после прибытия в Китай молодой вундеркинд Коэн, который окончил школу раньше и был отправлен изучать политику, столкнулся с трудностями.

«Оказывается, блондинистые волосы, голубые глаза и плохой китайский язык не располагают к тому, чтобы задавать вопросы о правительстве в сельском юго-западе Китая», — сказал Коэн.

После того как его политические исследования были прерваны, Коэн был привлечен местными чайными рынками, где он встретил Цзи Хая, мастера ферментации в коммунистическом чайном конгломерате CNNP. Именно здесь зародилась его увлеченность чаем.

«Я начал проводить время на чайном рынке, изначально из интереса к практике китайского языка», — сказал он. «Но довольно быстро я понял, что здесь происходит что-то большее».

Это неожиданное погружение в дегустацию чая развило вкусовые рецепторы Коэна и заложило основу для его будущих начинаний в понимании предпочтений потребителей.

Оттуда Коэн отправился жить на чайную плантацию Макайбари в Индии, где продолжил изучать чай. Затем он предпринял длительное путешествие из Гуанчжоу, Китай, через Тибет и Непал в Индию, посещая чайные места и подрабатывая по пути.

В конце концов Коэн вернулся в Соединенные Штаты, где поступил в Пенсильванский государственный университет по стипендии по политологии. Однако, как и в Китае, его интерес к политике был отодвинут его страстью к чаю. «Как и все, к чему я прикасаюсь, это вышло из-под контроля», — говорит Коэн, описывая, как небольшая исследовательская группа, которую он основал, превратилась в полноценный чайный исследовательский институт, где он изучал сенсорную науку и искусственный интеллект. Исследования Коэна в Tea Institute в конечном итоге стали основой для его первой компании, Gastrograph AI.

Gastrograph AI: Новаторское предприятие в предсказании вкуса

В 2011 году Коэн взял наработки из чайного института и использовал их для основания Gastrograph AI. В то время он думал, что сможет построить модель ИИ для прогнозирования предпочтений потребителей на основе вкуса. Со временем Gastrograph создал проприетарную базу данных с более чем 100 000 оценок продуктов из 35 стран, что, по утверждению Коэна, позволило компании точно прогнозировать, какие вкусы будут привлекательны для определенных сегментов потребителей.

«Мы создавали базовую модель для вкуса», — объяснил Коэн.

Будучи генеральным директором, Коэн помог Gastrograph AI привлечь в качестве клиентов крупные бренды товаров повседневного спроса, где модель компании помогала настроить их продукты в соответствии со вкусами разных демографических групп. В это время Коэн заметил, что исследователи ИИ начали создавать большие языковые модели с использованием нейронных сетей и глубокого обучения, но он еще не был убежден в силе генеративного ИИ для исследований в области товаров повседневного спроса.

«Я всегда скептически относился к использованию традиционных нейронных сетей и моделей глубокого обучения», — сказал он. «В потребительских исследованиях вы имеете дело с небольшими, дорогими и труднодоступными наборами данных. Вы не можете просто применить к ним модель глубокого обучения и ожидать хороших результатов».

Переломный момент

Скептицизм Коэна по поводу генеративного ИИ изменился, когда он наблюдал быстрый прогресс новых инструментов на основе больших языковых моделей за последние пару лет. Особый инструмент, который привлек его внимание, — это Midjourney, генеративный ИИ-инструмент, создающий реалистичные изображения по простым запросам.

«Момент, когда переключатель щелкнул, был с выпуском MidJourney», — сказал Коэн. «Если вы можете генерировать изображения на основе текстового запроса, вы должны уметь делать то же самое с табличными бизнес-данными».

После того как Midjourney заставил Коэна пересмотреть потенциал ИИ в потребительских исследованиях, он начал думать о том, как генеративный ИИ может позволить компаниям генерировать синтетические данные для сценариев, которые иначе были бы слишком дорогими или трудоемкими для изучения.

«Стало очень, очень ясно для меня в 2022 году, что генеративный ИИ изменит то, что возможно достичь в потребительских исследованиях», — сказал Коэн.

Вскоре после этого осознания Коэн отошел от своей роли в Gastrograph и основал Simulacra Synthetic Data Studio.

Simulacra: Переосмысление потребительских исследований с помощью генеративного ИИ

По словам Коэна, Simulacra использует ИИ совершенно иначе, чем то, что он и его команда разработали в Gastrograph; вместо того чтобы полагаться на проприетарные данные, Simulacra использует модель «принеси свои собственные данные». Это позволяет компаниям вводить свои существующие потребительские данные в модель компании, которая затем использует генеративный ИИ для создания синтетических данных для широкого спектра сценариев.

«Мы построили ИИ, который учится создавать модель генерации синтетических данных на основе загруженных данных», — сказал Коэн. Он объяснил, что это позволяет компаниям моделировать результаты — от реакции рынка на новые продукты до оптимизации ценовых стратегий — без обширных маркетинговых исследований. «Это гораздо более математически точно. Это гораздо более корректно для прямого статистического вывода», — сказал он.

В основе технологии Simulacra лежит диффузионное моделирование, которое Коэн описывает как бросающее вызов традиционному мышлению об ИИ-моделях. «Генерация синтетических данных переворачивает многое из того, что мы думаем о моделях», — сказал он. Относясь ко всем переменным как к зависимым и независимым одновременно, ИИ Simulacra может создавать более целостную и точную модель поведения потребителей.

Влияние генеративного ИИ на пищевую промышленность

Коэн считает, что генеративный ИИ окажет глубокое влияние на пищевую промышленность и индустрию потребительских товаров.

«Мы видели, как рынок раскалывается, и мы видели большее количество потребительских когорт, чем было ранее».

Коэн считает, что на быстро меняющемся рынке традиционные маркетинговые исследования часто слишком медленны и дороги, чтобы идти в ногу с изменяющимися предпочтениями потребителей. Из-за растущей стоимости традиционных исследований компании вынуждены полагаться на меньшие исследования с меньшей статистической силой, принимая решения на основе неполных данных или интуиции. Simulacra, объясняет Коэн, предлагает компаниям способ принимать решения, основанные на данных, которые одновременно точны и доступны по цене.

«Вот где Simulacra действительно окажет влияние».

За пределами цифровых двойников

По словам Коэна, существует большая разница между подходом Simulacra и традиционной технологией цифровых двойников. В то время как технология цифровых двойников обычно включает создание точных виртуальных реплик конкретных сущностей или наборов данных для моделирования и прогнозирования поведения, Simulacra использует данные опросов — от сотен до сотен тысяч наблюдений — для синтетического создания новых данных или включения новых знаний. Он считает, что такой подход позволяет Simulacra корректировать и прогнозировать результаты с большей математической точностью и статистической значимостью. Вместо того чтобы производить текстовые выходные данные, подобные тем, что создают большие языковые модели (LLM), Simulacra возвращает количественные и категориальные данные, которые компании могут использовать для строгого статистического анализа.

Взгляд в будущее: Будущее ИИ в потребительских исследованиях

По мере развития технологий ИИ Коэн видит будущее, в котором управляемые ИИ потребительские исследования — включая синтетические данные — станут нормой, а не исключением. Он прогнозирует, что такие инструменты, как Simulacra, помогут компаниям снизить высокий уровень неудач, связанный с запуском новых продуктов, предоставляя более надежные данные и идеи на ранних этапах процесса разработки.

Несмотря на преобразующий потенциал этой технологии, Коэн быстро отвергает опасения, что использование ИИ-моделей и синтетических данных приведет к однородности потребительских продуктов.

«Идея о том, что эта технология станет конвергентной силой в различных циклах разработки продуктов, я не думаю, что это так», — сказал он.

Компании все еще будут иметь разные цели, ограничения и потребительские сегменты, что приведет к разнообразным результатам, даже при использовании схожих технологий.