🔍 Универсальная нейросеть для табличных данных

Лаборатория Yandex Research представила архитектуру TabM для работы с табличными данными. Разработка превзошла классические модели машинного обучения.

🎯 Что особенного в TabM?

1️⃣ Универсальность: На 46 наборах данных модель заняла в среднем 1,7 место (между первым и вторым). Ближайший конкурент занял 2,9 место (почти третье).

2️⃣ Простота применения: Не требует глубокой донастройки под каждый новый набор данных, в отличие от специализированных решений.

3️⃣ Эффективность: Конкурирует по качеству с лучшими моделями градиентного бустинга (CatBoost, XGBoost).

💊 Где уже используется?

На платформе Kaggle TabM применяли для предсказания выживаемости пациентов после трансплантации костного мозга. Модель анализировала данные аналогичных случаев и делала прогнозы для новых пациентов.

🔬 Научное признание

Работа была представлена на конференции ICLR и выложена в открытый доступ на GitHub. С 2019 года исследователи Yandex Research опубликовали 8 статей по табличным данным, набравших более 1900 цитирований.

👩‍💻 Data Flow

🚀 Если уже успели потестить архитектуру, пишите в комментариях ваши впечатления.