VISA DEEP

Fishr: Invariant Gradient Variances for Out-of-distribution Generalization

Alexandre Ramé, Corentin Dancette, Matthieu Cord

ICML 2022

We introduce and motivate a new regularization that enforces invariance in the domain-level gradient variances across the different training domains in order to improve out-of-distribution generalization.

PDF Code

Beyond question-based biases: Assessing multimodal shortcut learning in visual question answering

Corentin Dancette, Rémi Cadène, Damien Teney, Matthieu Cord

ICCV 2021

We propose an experimental protocol to evaluate model’s reliance on multimodal biases.

PDF Code

MixMo: Mixing Multiple Inputs for Multiple Outputs via Deep Subnetworks

Alexandre Ramé, Rémy Sun, Matthieu Cord

ICCV 2021

We introduce a new generalized framework for learning multi-input multi-output subnetworks and study how to best mix the inputs. We obtain sota on CIFAR and Tiny ImageNet by better leveraging the expressiveness of large networks.

PDF Code

DICE: Diversity in Deep Ensembles via Conditional Redundancy Adversarial Estimation

Alexandre Ramé, Matthieu Cord

ICLR 2021

Driven by arguments from information theory, we introduce a new learning strategy for deep ensembles that increases diversity among members: we adversarially prevent features from being conditionally redundant.

PDF Poster Slides Video OpenReview

RUBi: Reducing unimodal biases for Visual Question Answering

Rémi Cadène, Corentin Dancette, Hedi Ben-Younes, Devi Parikh, Matthieu Cord

NeurIPS 2019

We introduce a strategy to reduce bias in models for Visual Question Answering.

PDF

Chaire VISA DEEP

Towards visual reasoning in deep learning

Matthieu Cord

Sorbonne Université, Valéo

Professor

Alexandre Ramé

Sorbonne Université

PhD Student. Thesis subject: deep ensembles to boost image understanding

Corentin Dancette

Sorbonne Université

PhD Student. Thesis subject: deep learning for vision reasoning

Mustafa Shukor

Sorbonne Université

Research Engineer. Working on large multimodal models.

Objective

Thematics

Robustness of deep neural networks

Publications

Fishr: Invariant Gradient Variances for Out-of-distribution Generalization

Beyond question-based biases: Assessing multimodal shortcut learning in visual question answering

MixMo: Mixing Multiple Inputs for Multiple Outputs via Deep Subnetworks

DICE: Diversity in Deep Ensembles via Conditional Redundancy Adversarial Estimation

RUBi: Reducing unimodal biases for Visual Question Answering

Chaire VISA DEEP

Towards visual reasoning in deep learning

Matthieu Cord

Sorbonne Université, Valéo

Professor

Alexandre Ramé

Sorbonne Université

PhD Student. Thesis subject: deep ensembles to boost image understanding

Corentin Dancette

Sorbonne Université

PhD Student. Thesis subject: deep learning for vision reasoning

Mustafa Shukor

Sorbonne Université

Research Engineer. Working on large multimodal models.

Objective

Thematics

Multi-modal Learning and biases

Robustness of deep neural networks

Publications

Fishr: Invariant Gradient Variances for Out-of-distribution Generalization

Beyond question-based biases: Assessing multimodal shortcut learning in visual question answering

MixMo: Mixing Multiple Inputs for Multiple Outputs via Deep Subnetworks

DICE: Diversity in Deep Ensembles via Conditional Redundancy Adversarial Estimation

RUBi: Reducing unimodal biases for Visual Question Answering