Search: Autoregressive - ai.jp.net

Research Paper #Generative Models, Classification, Distribution Shift 🔬 ResearchAnalyzed: Jan 3, 2026 06:13

Generative Classifiers Outperform Discriminative Ones on Distribution Shift

Published:Dec 31, 2025 18:31

•

1 min read

•

ArXiv

Analysis

This paper addresses a critical problem in machine learning: the vulnerability of discriminative classifiers to distribution shifts due to their reliance on spurious correlations. It proposes and demonstrates the effectiveness of generative classifiers as a more robust alternative. The paper's significance lies in its potential to improve the reliability and generalizability of AI models, especially in real-world applications where data distributions can vary.

Key Takeaways

•Discriminative classifiers often fail under distribution shift due to reliance on spurious correlations.
•Generative classifiers, using class-conditional generative models, are proposed as a more robust alternative.
•Diffusion-based and autoregressive generative classifiers achieve state-of-the-art performance on distribution shift benchmarks.
•Generative classifiers reduce the impact of spurious correlations in realistic applications.
•The paper provides analysis of generative classifier inductive biases and data properties for optimal performance.

Reference

“Generative classifiers...can avoid this issue by modeling all features, both core and spurious, instead of mainly spurious ones.”

Generative Classifiers Outperform Discriminative Ones on Distribution Shift

Analysis

Key Takeaways

HiGR: Efficient Generative Slate Recommendation

Analysis

Key Takeaways

RadAR: Efficient Visual Generation with Radial Autoregression

Analysis

Key Takeaways

Real-time Dyadic Talking Head Generation with Low Latency

Analysis

Key Takeaways

Unified Embodied VLM Reasoning for Robotic Action

Analysis

Key Takeaways

AI Predicts Plasma Edge Dynamics for Fusion

Analysis

Key Takeaways

Pretraining for Long Video Compression

Analysis

Key Takeaways

Entropy-Guided Token Dropout for LLMs with Limited Data

Analysis

Key Takeaways

Argus: Token-Aware LLM Inference Optimization

Analysis

Key Takeaways

Long-Range Distillation for AI Weather Forecasting

Analysis

Key Takeaways

EgoReAct: Generating 3D Human Reactions from Egocentric Video

Analysis

Key Takeaways

WeDLM: Faster LLM Inference with Diffusion Decoding and Causal Attention

Analysis

Key Takeaways

Autoregressive Flow Matching for Motion Prediction

Analysis

Key Takeaways

Visual Autoregressive Depth Estimation

Analysis

Key Takeaways

Dream-VL & Dream-VLA: Diffusion-Based Vision-Language Models for Robotics

Analysis

Key Takeaways

TiDAR: Think in Diffusion, Talk in Autoregression (Paper Analysis)

Analysis

Key Takeaways

ManchuTTS: High-Quality Speech Synthesis for an Endangered Language

Analysis

Key Takeaways

Real-Time Interactive Human Avatars with Streaming Diffusion Models

Analysis

Key Takeaways

Prediction Intervals for Quantile Autoregression

Analysis

Key Takeaways

DPAR: Dynamic Patchification for Efficient Image Generation

Analysis

Key Takeaways

Accelerating Visual Autoregressive Models with Adaptive Draft Trees

Analysis

Key Takeaways

CRBMs for Systemic Risk Regime Detection

Analysis

Key Takeaways

Knot Forcing for Real-time Interactive Portrait Animation

Analysis

Key Takeaways

Autoregressive Video Modeling: Effective Representations via Next-Frame Prediction

Analysis

Key Takeaways

Autoregressive Models' Temporal Abstractions Advance Hierarchical Reinforcement Learning

Analysis

Key Takeaways

Accelerating Particle Physics Simulations with AI: Inverse Autoregressive Flows for Calorimeter Design

Analysis

Key Takeaways

UMAMI: New Approach to View Synthesis with Masked Autoregressive Models

Analysis