Перейти к содержанию

SHAP HeatMap

Как интерпретировать HeatMap-график?


🔍 Как читать график:

  • Оси:
  • X-ось — признаки (фичи модели).
  • Y-ось — отдельные наблюдения (строки из выборки).
  • Цвет клетки показывает значение SHAP (вклад признака в предсказание):
  • Красный/жёлтый — положительное влияние на предсказание.
  • Синий — отрицательное влияние.
  • Белый/нейтральный — нулевое влияние.
  • Можно навести курсор и увидеть точное значение SHAP и значение признака.

🧪 Кейс классификации: Iris Dataset

Модель: LogisticRegression

  • Цель: классифицировать вид цветка (setosa, versicolor, virginica) по длине и ширине лепестков и чашелистиков.
  • Что показывает HeatMap:
  • Как каждый из четырёх признаков влияет на вероятности классов.
  • Возможность сравнивать влияние признаков между классами и экземплярами.
  • Явные зоны "решающих" признаков — например, petal length резко влияет на классификацию setosa.

Визуализация Iris dataset


🧪 Кейс регрессии: California Housing

Модель: RandomForestRegressor

  • Цель: предсказать стоимость дома по характеристикам района (например, средний доход, число комнат, близость к океану и др.).
  • Что показывает HeatMap:
  • Какие признаки в наибольшей степени повлияли на цену в конкретном случае.
  • Вклад признаков в завышенные или заниженные предсказания.
  • Тепловая карта помогает быстро увидеть, какие районы зависят, например, от median_income больше всего.

Визуализация California Housing dataset


🔧 Реализация

  • Используется Plotly для построения интерактивного SHAP HeatMap:
  • График масштабируется.
  • Можно навести курсор и изучить значения.
  • Основано на оригинальном shap.Explanation и визуализировано через кастомную обёртку.
  • Доступно сравнение с визуализацией внутри платформы SMILE.