Uma abordagem de localização de íris baseada em aprendizado profundo
Abstract
Resumo: A iris é considerada uma das características biométricas que possui maior grau de unicidade. A localização automática da íris consiste em uma importante tarefa em sistemas biométricos, podendo afetar diretamente os resultados obtidos por aplicações específicas, tais como reconhecimento de íris, detecção de lentes de contato, spoofing, dentre outras. Esse trabalho define o problema de localização da íris como a delimitação, por meio da menor janela quadrada, que engloba a região da íris. Nesse contexto, o objetivo geral deste trabalho consiste em propor um método baseado em deep learning para a localização de íris em imagens da região periocular. Por meio desse objetivo, pretende-se obter um detector de íris aplicável em diferentes bases de imagens, em ambientes cooperativos e não cooperativos, superando os desafios e limitações observados nos métodos propostos na literatura. Utilizamos como arcabouço de aprendizagem profunda a Darknet, que implementa uma rede neural open source utilizada pela YOLO (You Only Look Once), sendo estado da arte em detecção de objetos em tempo real. Para o aprendizado e avaliação de tais detectores, é necessário ter, além das bases de dados, as anotações das bounding boxes, isto é, o groundtruth, nas imagens utilizadas. Portanto, a tarefa de criar as anotações manuais das bases de dados consiste em um dos objetivos específicos deste trabalho. Foram criadas as anotações de mais de 10 000 imagens, pertencentes à sete bases de dados. Tais anotações estão disponíveis publicamente e podem ser utilizadas para fins científicos. Adicionalmente, com o propósito de criar um baseline para detectores de íris, foi proposto um detector baseado em janela deslizante, usando características extraídas por Histogram of Oriented Gradients (HOG) e Support Vector Machine (SVM) sendo utilizado como classificador, ou seja, uma adaptação do método de detecção de pedestres proposto por Dalal & Triggs. Os experimentos mostram que o uso do detector de objetos YOLO, baseado em Deep Learning, aplicado para a localização de íris apresenta resultados promissores em todas as bases de dados utilizadas. Nos experimentos em que a YOLO foi testada em bases "desconhecidas", em mais de 90% das imagens testadas foi reportado um valor de IoU superior à 80%. Tal observação também é válida para as métricas recall e precision. Palavras-chave: Localização de Íris, HoG & Linear SVM, Darknet YOLO, Aprendizado Profundo. Abstract: The iris is considered as the biometric trait with the highest unique probability. The iris location is an important task for biometrics systems, affecting directly the results obtained in specific applications such as iris recognition, spoofing and contact lenses detection, among others. This work defines the iris location problem as the delimitation of the smallest squared window that encompasses the iris region. In this context, the general objective of this work is to propose a deep learning method for iris location in periocular region images. Through this objective, it is intended to obtain an iris detector applicable in different databases, in cooperative and non-cooperative environments, overcoming the limitations observed in the methods proposed in the literature. As a deep learning approach, we use the Darknet, which implements an open source neural network used by YOLO, being state of the art in real time object detection. Additionally, for the purpose of creating a baseline for iris detectors, we also propose a sliding window detector based on features from Histogram of Oriented Gradients (HOG) and a linear Support Vector Machines (SVM) classifier, i.e., an adaptation from the human detection method proposed by Dalal & Triggs. For the learning and evaluation of such detectors, it is necessary to have, besides the databases, the annotations of bounding boxes (groundtruth). Therefore, the task of creating manual database annotations is one of the specific objectives of this work. Annotations of over 10 000 images from seven databases were created. These annotations are publicly available and may be used for scientific purposes. Experiments show that the use of the Deep Learning-based YOLO object detector for iris location has shown promising results in all databases used. In experiments where YOLO was applied to "unknown" databases, IoU greater than 80% was reported in more than 90% of the images tested. This observation is also valid for the recall and precision metrics. Keywords: Iris location, HOG & Linear SVM, Darknet YOLO, Deep Learning.
Collections
- Dissertações [355]