make sense#265: Об универсальных и нишевых моделях машинного обучения, своих моделях и продуктах на основе ChatGPT

«Уметь отсеивать, где совсем хайп-хайп, а где есть то, на что надо в том или ином виде перестраиваться — это искусство, к сожалению. То есть говорить, что мы были ecommerce-компанией, а сейчас вышла GPT, и мы в спешке переобуваемся и начинаем делать сервисы на основе GPT — это в лучшем случае тупняк. А сказать, что сейчас мы используем GPT для своих организационных задач, для своих оптимизационных задач и вообще думаем о GPT каждый раз, когда запускаем что-то новое — это нормальный майндсет».

«В Machine Learning есть два типа задач. Первый — это когда ты делаешь какой-то core-продукт, в котором без ML вообще никак-никак. А бывает, когда компания вообще немного про другое, а ML — это просто свистелки. Эти свистелки могут что-то оптимизировать, в каких-то случаях они оптимизируют очень многое и без такой оптимизации вообще никак — ты просто не выдержишь конкуренцию. Однако это все еще оптимизация, а не основной продукт или сервис».

iTunes | YouTube | Castbox | Яндекс.Музыка | Google Подкасты | mave

Гость: Арсений Кравченко, ML Engineer, Ntropy, Соавтор книги Machine Learning System Design

Ведущий подкаста: Юра Агеев

Подписывайтесь на канал анонсов подкаста.

Подкаст выходит при поддержке конференции ProductSense. Конференция пройдет 4—5 сентября 2023 в Москве.

О чем говорим:
2:22 Почему прогнозы в науке работают плохо
4:53 Переход из продукта в ML
7:19 История и причины успеха ChatGPT
9:56 Почему попытки сделать продукты на основе ChatGPT часто проваливаются
14:26 Как маленьким компаниям делать нишевые ML-инструменты
19:03 Почему нельзя без серьезных вложений сделать свою модель даже при наличии Open Source-решений
20:20 Что такое Foundation Model
24:39 Механика работы ChatGPT
26:24 Почему успешные модели могут построить либо очень большие, либо маленькие компании
28:04 Зачем одна большая компания выложила в открытый доступ продвинутую модель
31:55 Что нужно, чтобы сделать свою Foundation Model
36:09 Вопросы безопасности моделей
37:25 Как зарабатывать на моделях
38:46 Какой спектр задач может решать модель машинного обучения
40:54 Гипотетический кейс: зачем супермаркету ChatGPT
42:53 Два типа задач в ML
46:00 Почему опасно делать продукты на основе ChatGPT
47:34 Модели-полуфабрикаты, внутренние Foundation-модели и модель как инструмент
51:00 Использование ChatGPT при написании книги
52:18 Как проверить свое представление о мире с помощью ChatGPT
54:44 Модель и доступ к ней как продукт
58:47 Зачем скрывать, какая модель под капотом твоего продукта

В подкасте упоминаются
Личный сайт Арсения
Книга, которую Арсений пишет в соавторстве
Timing is Everything
Stratechery by Ben Thompson
GPT-4 Technical Report

* В подкасте упоминается Meta — запрещенная в России организация

Добавить комментарий

ProductSense'24: 5-6 сентября, Москва. Продакты не нужны? Подробнее