Extension de l'Intersection over Union pour améliorer la détection d'objets de petite taille en régime d'apprentissage few-shot

Abstract

L’Intersection over Union (IoU) est un critère mesurant la proximité entre deux boîtes englobantes. C’est un critère fondamental pour la détection d’objets car il permet à la fois d’entraîner les modèles de détection (en tant que fonction de coût) et de les évaluer. C’est la valeur d’IoU entre les boîtes vraies et prédites qui détermine si une détection est correcte ou non, selon un seuil défini. La détection d’objets de petite taille est un problème persistent en vision par ordinateur, notamment lorsque l’on dispose de peu de données annotées (few-shot learning). La faible supervision disponible empêche l’apprentissage d’une localisation robuste, ce qui est particulièrement néfaste pour les petits objets. En effet, lorsque un objet est petit, quelques pixels d’écart entre la boîte englobante prédite et la boîte annotée suffisent pour que la prédiction soit considérée comme une fausse détection. Nous proposons dans cet article Scale-adaptive Intersection over Union (SIoU), un nouveau critère de similarité contrôlable et adaptatif en fonction de la taille des objets. Premièrement, SIoU permet de trouver un meilleur équilibre entre petits et grands objets pendant l’entraînement de méthodes de détection few-shot, pour lesquelles les petits objets sont extrêmement problématiques. Des expériences sur quatre jeux de données distincts montrent des performances de détection supérieures en utilisant SIoU comme fonction de coût. Deuxièmement, en étant plus laxiste envers les petits objets, SIoU est mieux aligné avec la perception humaine que l’IoU, ce qui en fait un critère d’évaluation plus adéquat.

Pierre Le Jeune
Pierre Le Jeune
PhD Student in Deep Learning

My research interests include computer vision, deep learning and applications in low-data regime.