Amélioration de la détection d'objets few-shot à travers une analyse de performances sur des images aériennes et naturelles

Abstract

L’entraînement de modèles de détection d’objets requiert l’accès à de grandes bases de données annotées. Etant donné le coût élevé des annotations, en particulier pour la détection, celles-ci ne sont souvent pas disponibles pour des applications réelles. La détection d’objets few-shot (FSOD) tente de combler cette lacune en entraînant des modèles à partir de peu de données annotées. Les méthodes existantes se concentrent sur des images naturelles, et notamment les jeux de données MS COCO et Pascal VOC. Lorsque l’on applique naïvement ces méthodes sur des images aériennes, les performances sont moins bonnes que sur des images naturelles. Une analyse détaillée des performances et des jeux de données utilisés est réalisée afin de comprendre l’origine de ces différences. Des adaptations compatibles avec la plupart des méthodes FSOD sont finalement proposées afin d’améliorer les performances sur les images aériennes, permettant ainsi de gagner en moyenne 5% de performance.

Pierre Le Jeune
Pierre Le Jeune
PhD Student in Deep Learning

My research interests include computer vision, deep learning and applications in low-data regime.