
🔍 Универсальная нейросеть для табличных данных
Лаборатория Yandex Research представила архитектуру TabM для работы с табличными данными. Разработка превзошла классические модели машинного обучения.
🎯 Что особенного в TabM?
1️⃣ Универсальность: На 46 наборах данных модель заняла в среднем 1,7 место (между первым и вторым). Ближайший конкурент занял 2,9 место (почти третье).
2️⃣ Простота применения: Не требует глубокой донастройки под каждый новый набор данных, в отличие от специализированных решений.
3️⃣ Эффективность: Конкурирует по качеству с лучшими моделями градиентного бустинга (CatBoost, XGBoost).
💊 Где уже используется?
На платформе Kaggle TabM применяли для предсказания выживаемости пациентов после трансплантации костного мозга. Модель анализировала данные аналогичных случаев и делала прогнозы для новых пациентов.
🔬 Научное признание
Работа была представлена на конференции ICLR и выложена в открытый доступ на GitHub. С 2019 года исследователи Yandex Research опубликовали 8 статей по табличным данным, набравших более 1900 цитирований.
👩💻 Data Flow
🚀 Если уже успели потестить архитектуру, пишите в комментариях ваши впечатления.
Комментарии
0Войдите, чтобы участвовать в обсуждении.
Комментариев пока нет.