Что такое GPT Food Cam? Вкратце, это бесплатное приложение для учета питания, которое позволяет вам сфотографировать каждый прием пищи или перекус с помощью камеры смартфона и использует ИИ для оценки калорийности. Приложение, доступное для загрузки в App Store для iOS, не требует прохождения опросов или подписки, и, насколько я могу судить после дня использования, оно действительно довольно хорошее.
Согласно Сингху, который недавно опубликовал информацию о приложении в LinkedIn, GPT Food Cam отличается от других приложений для учета питания тремя основными способами:
- Мгновенный доступ к камере: Приложение открывается сразу на камеру, позволяя пользователям быстро запечатлеть свою еду без навигации по меню. «Я хотел, чтобы это было быстро и без лишних препятствий», — сказал Сингх. «В социальных ситуациях менее навязчиво быстро сделать снимок».
- Диапазоны калорий вместо точных цифр: Сингх отметил, что поскольку ИИ имеет свои ограничения, а размеры порций варьируются, приложение предоставляет диапазон калорий. «Предоставляя диапазон, оно в основном точно», — сказал Сингх. «Цель — выработать привычку ведения дневника питания и стать более осознанным едоком».
- Бесплатно и ненавязчиво: В отличие от многих приложений, которые требуют подписки или засыпают пользователей рекламой, GPT Food Cam полностью бесплатен и поддерживается случайной, ненавязчивой рекламой. «Сейчас реклама приносит в четыре раза больше дохода, чем стоят расходы на ИИ», — сказал Сингх в телефонном интервью с The Spoon. «Это позволяет нам держать приложение бесплатным и потенциально расширять его функции и доступность в большем количестве стран».
После работы с тренером по питанию, который поощрял его отправлять фотографии своих приемов пищи для обратной связи, Сингх искал удобное цифровое решение для продолжения практики. Однако он обнаружил, что существующие приложения не соответствуют его потребностям — либо слишком сложны, дороги, либо и то, и другое.
«Они были разработаны для тех 5%, кому нужна точность, а я хотел что-то простое, бесплатное, для остальных 95%», — сказал Сингх.
По словам Сингха, GPT Food Cam использует Gemini Flash, быструю и экономичную модель ИИ, для анализа изображений и оценки калорийности. Пользователи просто делают снимок своего блюда, и приложение обрабатывает изображение, чтобы предоставить приблизительный диапазон калорий.
«Многое здесь — это инженерия запросов», — объяснил Сингх. «Мы используем «цепочку размышлений» в запросах, где разбиваем задачу ИИ на конкретные шаги. Запрос инструктирует ИИ посмотреть, что на картинке, рассмотреть каждый ингредиент отдельно, оценить размеры порций на основе контекста — например, находится ли еда в миске или на тарелке — а затем оценить калорийность каждого элемента перед суммированием».
Сингх подчеркнул, что хотя ИИ не идеален — с точностью около 95% — этого достаточно для продвижения осознанного питания.
«ИИ стабильно был точен на 95%», — сказал он. «Он отлично подходит для рекомендаций и предложений, но когда дело доходит до критических процессов, он может ошибаться в 5% случаев. Для учета питания, где точность не столь критична, такой уровень точности приемлем».
Создание GPT Food Cam произошло после случайного разговора с другом. Друг Сингха, Цвика Ашкенази, упомянул, что его сын, Бен Ашкенази, ищет неоплачиваемую летнюю стажировку и поинтересовался, может ли Сингх наставлять его. Сингх вскоре начал работать с Беном, и через шесть недель появился GPT Food Cam.
«Бен заканчивает обучение в ASU по специальности «Компьютерные науки» в декабре», — сказал Сингх. «Этим летом он самостоятельно выучил React, разработку для iOS и многое другое с минимальной помощью из моей сети. Он создал это от начала до конца».
Хотя GPT Food Cam появился всего пару месяцев назад после озарения Сингха и работы по кодированию Бена Ашкенази, Сингх уже десять лет играет с идеей приложения с низким уровнем трения для отслеживания потребления пищи. В 2009 году он пытался разработать похожее приложение, но вскоре понял, что технология еще не была достаточно зрелой.
«В 2009 году я пытался создать именно это приложение», — сказал Сингх, который в настоящее время является главой отдела продуктов Mozilla Solo после того, как браузерная компания приобрела его стартап Pulse в 2022 году. «Оно было недостаточно хорошим, и поэтому мы перешли в компанию по рецептам, которая стала Allthecooks».
Allthecooks стала сообществом рецептов номер один на Android в 2010 году с 30 миллионами пользователей и позже была приобретена Cookpad.
В отличие от того времени, «теперь технология здесь, делая GPT Food Cam реальностью», — сказал Сингх. «Прогресс в области ИИ и распознавания изображений наконец-то догнал видение, которое у меня было более десяти лет назад».
Имея технологию, чтобы сделать учет питания без трения реальностью, Сингх сказал мне, что хочет изменить индустрию учета питания, предлагая бесплатное приложение с низким уровнем трения, но считает, что это можно сделать с небольшим его участием в будущем.
«Я создаю некоторые вещи для удовольствия. В начале нового проекта я думаю: «Это не принесет денег, но миру это нужно», или «Это будет мой следующий бизнес, и я покидаю то, где я сейчас»».
Сингх ясно дал понять, что он счастлив в Mozilla и, фактически, использовал продукт, который задумал создать для Mozilla (Solo, конструктор сайтов на основе ИИ), чтобы создать веб-сайт для GPT Food Cam. Отсюда он позволит Ашкенази работать с продуктом, даже если периодически будет предлагать некоторые идеи для его успеха.
«Я думаю, это может быть очень, очень революционным. Люди платят 10 долларов в месяц за приложения, которые им не нужны. Это приложение может поощрять лучшие привычки без затрат и сложности».
Сингх сказал, что также рассматривает возможность расширения возможностей и охвата приложения. Поскольку доход от рекламы уже превышает затраты на ИИ в четыре раза, есть потенциал для увеличения дневных лимитов использования (в настоящее время пользователи ограничены шестью снимками в день) и сделать приложение доступным в большем количестве стран.
Эгоистично, я надеюсь, что он и Ашкенази добьются успеха, потому что, исходя из того, что я видел до сих пор, я думаю, что приложение действительно может стать революционным, и я надеюсь продолжать его использовать. Кто знает, возможно, Ашкенази (с небольшой помощью от Сингха) сможет направить свое приложение по пути, похожему на тот, который мы видели с приложением Overcast Марко Армента, которое изначально было проектом, возникшим из-за неудовлетворенности Армента состоянием подкаст-приложений, и стало самым удобным для пользователей подкаст-приложением (и самым популярным после подкаст-приложения Apple) в мире.