Principle:Evidentlyai Evidently Data Drift Detection

Knowledge Sources	Failing Loudly: An Empirical Study of Methods for Detecting Dataset Shift Evidently Drift Methods Evidently
Domains	ML_Monitoring, Statistical_Testing, Data_Quality
Last Updated	2026-02-14 12:00 GMT

Overview

A statistical testing mechanism that detects distribution changes between reference and current datasets at the column level.

Description

Data Drift Detection identifies when the statistical distribution of a feature column has changed significantly between a reference (baseline) dataset and a current (production) dataset. This is critical for ML monitoring because model performance often degrades when input data distributions shift away from training data.

Evidently supports multiple drift detection methods depending on column type:

Numerical columns: Kolmogorov-Smirnov test, Wasserstein distance, Population Stability Index (PSI), Jensen-Shannon divergence
Categorical columns: Chi-squared test, PSI, Jensen-Shannon divergence
Text columns: Domain classifier, model-based approaches

The method is auto-selected based on column type and dataset size, or can be explicitly specified. A drift score is computed and compared against a threshold to determine if drift is detected.

Usage

Use this principle when monitoring ML pipelines in production to detect data distribution shifts. Apply it to individual columns (ValueDrift) or across all columns simultaneously (DriftedColumnsCount). It requires a reference dataset for comparison.

Theoretical Basis

Column-level drift detection compares the empirical distributions of a feature across two datasets:

Failed to parse (syntax error): {\displaystyle \text{drift\_score} = D(P_{\text{ref}}, P_{\text{cur}}) }

Where $D$ is a divergence measure. Common choices:

KS test: $D = \sup_{x} | F_{ref} (x) - F_{cur} (x) |$ (max CDF difference)
PSI: $P S I = \sum_{i} (p_{i} - q_{i}) \ln \frac{p_{i}}{q_{i}}$ (binned distribution comparison)
Wasserstein: Earth mover's distance between distributions
Chi-squared: $χ^{2} = \sum \frac{(O_{i} - E_{i})^{2}}{E_{i}}$ (categorical frequency comparison)

Drift is flagged when drift_score exceeds the method-specific threshold.

Related Pages

Implemented By

Implementation:Evidentlyai_Evidently_ValueDrift_Metric

Uses Heuristic

Page Connections

Double-click a node to navigate. Hold to expand connections.

Principle

Implementation

Heuristic

Environment