НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
БИОМЕТРИЯ
ФОРМАТЫ ОБМЕНА БИОМЕТРИЧЕСКИМИ ДАННЫМИ
ЧАСТЬ 5
ДАННЫЕ ИЗОБРАЖЕНИЯ ЛИЦА
Information technologies. Biometrics. Biometric data interchange formats. Part 5. Face image data ISO/IEC 19794-5:2011 Information technology - Biometric data interchange formats - Part 5: Face image data (IDT)
ГОСТ Р ИСО/МЭК 19794-5-2013
(в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст, Изменения N 2, утв. Приказом Росстандарта от 25.11.2021 N 1607-ст)
Дата введения
1 января 2015 года
Предисловие
1 ПОДГОТОВЛЕН Научно-исследовательским и испытательным центром биометрической техники Московского государственного технического университета имени Н.Э. Баумана (НИИЦ БТ МГТУ им. Н.Э. Баумана) на основе собственного аутентичного перевода на русский язык стандарта, указанного в пункте 4, при консультативной поддержке Ассоциации автоматической идентификации "ЮНИСКАН/ГС1 РУС"
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 355 "Технологии автоматической идентификации и сбора данных и биометрия"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 6 сентября 2013 г. N 987-ст
4 Настоящий стандарт идентичен международному стандарту ИСО/МЭК 19794-5:2011 "Информационные технологии. Форматы обмена биометрическими данными. Часть 5. Данные изображения лица" (ISO/IEC 19794-5:2011 "Information technology - Biometric data interchange formats - Part 5: Face image data", IDT), включая изменение A1:2014. (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
Изменение к указанному международному стандарту, принятое после его официальной публикации, внесено в текст настоящего стандарта и выделено двойной вертикальной линией, расположенной на полях от соответствующего текста, а обозначение и год принятия изменения приведены в скобках после соответствующего текста. (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
Наименование настоящего стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2012 (пункт 3.5).
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении ДА
5 ВЗАМЕН ГОСТ Р ИСО/МЭК 19794-5-2006
Правила применения настоящего стандарта установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящему стандарту публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе "Национальные стандарты", а официальный текст изменений и поправок - в ежемесячном информационном указателе "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя "Национальные стандарты". Соответствующие информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (gost.ru)
Введение
Изображения лица (фотографии) использовались в течение многих десятилетий для проверки личности людей. В последние годы цифровые изображения лица применяются во многих областях, в том числе при визуальной экспертизе и компьютерном автоматическом распознавании лица. Форматы фотографий были стандартизированы, например, для паспортов и водительских прав. Но существует необходимость определения стандартного формата данных цифровых изображений лица для обеспечения совместимости приложений разных изготовителей.
Настоящий стандарт определяет формат записи изображения лица в приложениях распознавания лица, требующих обмена данными. Типичными приложениями являются:
1) визуальная экспертиза изображения лица с разрешением, достаточным для определения оператором таких особенностей, которыми можно пользоваться для проверки личности (родинки, шрамы);
2) визуальная верификация личности человека путем сравнения с изображениями лица;
3) автоматическая биометрическая идентификация лица (поиск "один ко многим");
4) автоматическая биометрическая верификация лица (поиск "один к одному").
Для обеспечения работы приложений на различных устройствах, в том числе с ограниченными ресурсами для хранения данных, а также для повышения точности распознавания лица в настоящем стандарте кроме формата данных установлены требования к условиям получения изображения (освещение, положение головы, выражение лица и т.д.), фотографированию (расположение камеры, фокусировка и т.д.) и параметрам цифрового изображения (разрешение изображения, размер изображения и т.д.).
Для обозначения категорий, отвечающих требованиям разных приложений, определены следующие типы изображения лица:
Основной: фундаментальный тип изображения лица, который определяет формат записи, включающей заголовок и данные изображения лица. Все остальные типы изображения лица наследуют свойства данного типа. Для данного типа не установлены требования к условиям получения изображения, фотографированию и параметрам цифрового изображения.
Фронтальный: основной тип изображения лица, соответствующий дополнительным требованиям, обеспечивающим возможность распознавания и (или) проведения визуальной экспертизы по изображению лица во фронтальном положении. В настоящем стандарте установлены два фронтальных типа изображения лица: полный фронтальный и условный фронтальный.
Полный фронтальный: фронтальный тип изображения лица, характеризующийся достаточным разрешением для проведения визуальной экспертизы и автоматического распознавания лица. Данный тип изображения лица включает: целиком голову (как правило, с волосами), шею и плечи. Данный тип изображения лица предназначен для долговременного хранения информации об изображении лица; его используют в качестве фотографии для паспорта, водительского удостоверения и т.д.
Условный фронтальный: фронтальный тип изображения лица, характеризующийся определенными геометрическими размерами изображения и местоположением глаз, определяемым горизонтальным и вертикальным размерами изображения. Данный тип изображения лица позволяет минимизировать требования к хранению информации для задач автоматического распознавания лица, например верификации, обеспечивая независимость биометрической системы от изготовителя оборудования и возможность визуальной верификации (в отличие от визуальной экспертизы, которая требует более детализированного изображения).
Обработанный фронтальный: применение цифровой постобработки может сделать цифровое изображение более подходящим для автоматического распознавания лица. Обработанный фронтальный тип изображения лица представляет собой формат обмена для этих видов изображения лица.
Основной трехмерный: основной трехмерный тип изображения лица - это базовый класс всех трехмерных типов изображения лица. Все трехмерные типы изображения лица должны удовлетворять нормативным требованиям к этому типу изображения.
Полный фронтальный трехмерный: полный фронтальный трехмерный тип изображения объединяет полное фронтальное двухмерное изображение с дополнительной трехмерной информацией.
Условный фронтальный трехмерный: условный фронтальный трехмерный тип изображения объединяет условное фронтальное двухмерное изображение с дополнительной трехмерной информацией.
Взаимосвязь типов изображения лица с использованием понятия "наследование" приведена в таблице 1. Например, фронтальный тип изображения лица наследует все требования, предъявляемые к основному типу изображения лица, т.е. фронтальный тип изображения лица подчиняется всем нормативным требованиям, предъявляемым к основному типу изображения лица.
Взаимосвязь типов изображения лица
Требования к условиям получения изображения, фотографированию, параметрам цифровых изображений и форматам для указанных в настоящем стандарте типов изображения лица представлены на рисунке 1.
Рисунок 1 - Требования к изображению лица
Примечание - Для основного типа изображения лица не установлены требования к условиям получения изображения, фотографированию и параметрам цифрового изображения.
Представлен пересмотр ИСО/МЭК 19794-5:2005. Структура формата данных несовместима с предыдущей версией.
Примечание - Настоящий стандарт взаимосвязан с международными стандартами ИСО.
(Введен дополнительно, Изм. A1:2014). (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
1 Область применения
Настоящий стандарт устанавливает требования к:
- формату записи данных для хранения, регистрации и передачи информации об одном или более изображениях лица или к видеопотоку изображений лица;
- условиям получения изображений лица;
- фотографированию для получения изображений лица;
- характеристикам цифровых изображений лица;
- обеспечению лучшего метода организации фотографирования лица.
(в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
Методология испытаний на соответствие, приведенная в настоящем стандарте, не устанавливает:
- испытания других характеристик биометрических продуктов или другие типы испытаний биометрических продуктов (например, степень приемлемости, производительность, устойчивость, уровень безопасности);
- испытания на соответствие систем, которые не производят записи данных в соответствии с настоящим стандартом.
(Введены дополнительно, Изм. A1:2014). (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
2 Соответствие
Соответствие требованиям настоящего стандарта обеспечивается выполнением всех обязательных требований, относящихся к:
a) структуре данных, значениям данных и отношениям между элементами данных, определенных в разделах 5 - 8 настоящего стандарта для полного фронтального типа изображения лица, в разделах 5 - 7, 9 настоящего стандарта для условного фронтального типа, в разделах 5 - 7, 10 настоящего стандарта для обработанного фронтального типа;
b) соотношению между значениями данных и входными биометрическими данными, из которых была произведена запись биометрических данных, определенных в разделах 5 - 8 настоящего стандарта для полного фронтального типа изображения лица, в разделах 5 - 7, 9 настоящего стандарта для условного фронтального типа, в разделах 5 - 7, 10 настоящего стандарта для обработанного фронтального типа.
Система, создающая записи биометрических данных, соответствует настоящему стандарту, если все производимые записи биометрических данных соответствуют настоящему стандарту согласно Заявлению о соответствии реализации данной системы. В системе должны производиться записи биометрических данных, которые удовлетворяют не обязательно всем аспектам настоящего стандарта, а только тем, которые определены в Заявлении о соответствии реализации.
Система, использующая записи биометрических данных, соответствует настоящему стандарту, если в ней могут быть считаны и использованы по назначению записи биометрических данных, соответствующие настоящему стандарту согласно Заявлению о соответствии реализации данной системы. В системе должны использоваться записи биометрических данных, которые удовлетворяют не обязательно всем аспектам настоящего стандарта, а только тем, которые определены в Заявлении о соответствии реализации.
3 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты и другие нормативные документы, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, в которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним:
ИСО/МЭК 10918-1 Информационные технологии. Цифровое сжатие и кодирование полутоновых изображений. Часть 1. Требования и рекомендации (ISO/IEC 10918-1, Information technology - Digital compression and coding of continuous-tone still images - Part 1: Requirements and guidelines) (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
ИСО/МЭК 14496-2:2004 Информационные технологии. Кодирование аудиовизуальных объектов. Часть 2. Визуальные объекты (ISO/IEC 14496-2:2004, Information technology - Coding of audio-visual objects - Part 2: Visual)
ИСО/МЭК 15444-1 Информационные технологии. Система кодирования изображения JPEG2000. Часть 1. Внутренняя система кодирования (ISO/IEC 15444-1, Information technology - JPEG 2000 image coding system - Part 1: Core coding system) (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
ИСО/МЭК 15948 Информационные технологии. Компьютерная графика и обработка изображений. Переносимая сетевая графика (Portable Network Graphics, PNG): Функциональная спецификация (ISO/IEC 15948, Information technology - Computer graphics and image processing - Portable Network Graphics (PNG): Functional specification)
ИСО/МЭК 19794-1:2011 Информационные технологии. Форматы обмена биометрическими данными. Часть 1. Структура (ISO/IEC 19794-1:2011, Information technology - Biometric data interchange formats - Part 1: Framework)
ИСО/МЭК 29794-1 Информационные технологии. Качество биометрического образца. Часть 1. Структура (ISO/IEC 29794-1, Information technology - Biometric sample quality - Part 1: Framework)
(Введена дополнительно, Изм. A1:2014). (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
4 Термины и определения
В настоящем стандарте используются термины, определения и аббревиатуры, установленные в ИСО/МЭК 19794-1, а также следующие:
4.1 двухмерное изображение; 2D изображение (2D image): Двухмерное представление яркости и/или текстуры объекта съемки в определенных условиях освещения.
4.2 трехмерное изображение; 3D изображение (3D image): Представление поверхности в трехмерном пространстве.
4.3 трехмерная карта точек; 3D карта точек (3D point map): Множество трехмерных точек, представляющее объект съемки, в котором каждая точка записывается с помощью значений координат X, Y и Z в трехмерном пространстве.
4.4 трехмерное представление вершин; 3D представление вершин (3D vertex representation): Представление, использующее трехмерные координаты вершин и треугольники между ними для кодирования трехмерной поверхности.
4.5 антропометрическая точка (anthropometric landmark): Контрольная точка на лице, используемая для распознавания и классификации людей.
4.6 код антропометрической точки (anthropometric landmark code): Код, состоящий из двух частей, который уникальным образом идентифицирует антропометрическую точку.
4.7 прямоугольная система координат (Cartesian coordinate system): Трехмерная прямоугольная система координат.
4.8 подбородок (chin): Центральная выступающая часть нижней челюсти.
4.9 цветное изображение (color image): Полутоновое изображение, имеющее более чем один канал, каждый из которых кодируется одним или несколькими битами.
4.10 цветовое пространство (colorspace): Способы представления цветов пикселей в изображении. В настоящем стандарте используются способы представления RGB, YUV и градации серого.
4.11 макушка (crown): Верхняя точка головы, если она видна и не закрыта волосами или головным убором, или предполагаемая верхняя точка головы (черепа) в случае, если человек не лысый или находится в головном уборе.
4.12 цилиндрическая система координат (cylindrical coordinate system): Трехмерная система полярных координат, описывающая положение точки в пространстве с помощью трех координат: радиуса, азимута и высоты.
4.13 точки на дюйм; dpi (dots per inch; dpi): Единица измерения пространственного разрешения сканера или принтера.
4.14 изображение лица (facial image): Электронное представление изображения лица человека.
4.15 тип изображения лица (face image type): Категория изображений лица, которые удовлетворяют определенным требованиям.
4.16 контрольная точка (feature point): Опорная точка на изображении лица, используемая алгоритмами распознавания лица.
Пример - Контрольные точки центров глаз.
4.17 бочкообразная дисторсия (fish eye): Аберрация оптических систем, при которой степень увеличения центральной части изображения больше, чем периферийной.
4.18 изображение в градациях серого (grayscale image): Полутоновое изображение, которое имеет один канал яркости. Если канал кодируется восемью битами, такое изображение также называется монохромным или черно-белым.
4.19 визуальная экспертиза (human examination): Процесс тщательного визуального сравнения изображения лица с лицом человека или с другим изображением лица с целью установления личности человека по особенностям лица.
4.20 визуальная верификация (human verification): Проверка подлинности изображения лица путем сравнения с лицом человека или с другим изображением лица; сопоставление 1:1 ("один к одному").
4.21 формат JPEG (JPEG): Стандарт сжатия цифрового изображения, определенный в ИСО/МЭК 10918-1.
Примечание - Базовыми стандартами, устанавливающими требования к формату JPEG, являются ИСО/МЭК 10918-1 и документ МСЭ-Т <*> Рекомендации T.81 (ITU-T Rec. T.81).
<*> МСЭ - Международный союз электросвязи.
4.22 формат JPEG2000 (JPEG2000): Стандарт сжатия цифрового изображения, определенный в ИСО/МЭК 15444-1.
Примечание - Базовыми стандартами, устанавливающими требования к JPEG2000, являются ИСО/МЭК 15444-1 и документ МСЭ-Т Рекомендации T.800.
4.23 формат PNG (PNG format): Стандарт сжатия изображения без потерь, спецификация которого установлена в ИСО/МЭК 15948.
4.24 портрет (portrait): Фотография человека, которая включает целиком голову (как правило, с волосами), шею и верхнюю часть плеч.
4.25 карта глубины (range image): Числовая матрица, кодирующая точки поверхности в трехмерном пространстве, в которой координаты ячейки кодируют положение точки (первые две координаты), а значение в этой ячейке кодирует третью координату.
4.26 эффект красных глаз (red-eye): Красное свечение в глазу человека, вызванное светом от вспышки, отраженным от кровеносных сосудов сетчатки.
4.27 текстура (texture): Двухмерное представление яркости и/или цвета объекта съемки в определенных условиях освещения.
4.28 матрица текстурной проекции (texture projection matrix): Матрица размером 3x4 для преобразования координат трехмерной поверхности из прямоугольной системы координат в координаты двухмерного текстурного изображения. Преобразование позволяет использовать координаты точки в трехмерном пространстве так же, как координаты точки в двухмерном пространстве.
Примечание - Более подробная информация приведена в [2].
5 Формат записи изображения лица
5.1 Общие положения
Формат записи изображения лица, определенный в настоящем стандарте, предназначен для хранения представлений лица в записи биометрических данных. Каждая запись должна относиться к одному и тому же субъекту, содержать не менее одного изображения лица и может дополнительно включать геометрические представления лица (карты глубины, трехмерные карты точек, данные вершин). В зависимости от типа изображения дополнительно к двухмерному представлению лица может быть включено трехмерное представление. Структура записи представлена на рисунках 2 и 3.
Рисунок 2 - Формат записи изображения лица
Под каждым полем указано значение размера поля в байтах. Белые прямоугольники обозначают обязательные поля или блоки, светло-серые прямоугольники - обязательные поля с допускаемыми неопределенными значениями, темно-серые прямоугольники - необязательные поля или блоки
Рисунок 3 - Блок "Информация о трехмерном изображении" и три возможных блока "Данные трехмерного изображения", определенных в настоящем стандарте
Под каждым полем указано значение размера поля в байтах. Белые прямоугольники обозначают обязательные поля или блоки, светло-серые прямоугольники - обязательные поля с допускаемыми неопределенными значениями, темно-серые прямоугольники - необязательные поля или блоки
Использование данного формата требует соответствия перечисленным выше стандартам. В частности, данные двухмерного изображения лица должны быть закодированы в форматах JPEG, JPEG2000 или PNG.
При описании элементов формата записи термин "поле" обозначает единичный элемент, например "Тип изображения лица" или "Тип данных изображения", термин "блок" - группу полей, например блок "Информация о лице" или блок "Информация об изображении", и термин "запись" - данные, состоящие из общего заголовка и не менее одного представления.
Все хранимые данные должны быть представлены в двоичном формате, за исключением полей "Идентификатор формата" и "Номер" версии стандарта", являющихся нуль-терминированными строками с символами ASCII.
В формате не используются разделительные записи или отметки полей. Разграничение полей осуществляется только путем подсчета байтов.
Структура записи изображения лица организована следующим образом:
- блок "Общий заголовок" фиксированной длины (17 байтов), содержащий информацию о записи, включая число представлений изображений лица и длину всей записи в байтах;
- блок "Представление" для каждого представления лица, состоящий из блоков "Заголовок представления" и "Данные представления";
- блок "Заголовок представления" состоит из:
- общих элементов фиксированной длины (19 байтов), определенных в ИСО/МЭК 19794-1:2011;
- нескольких (или ни одного) блоков "Качество" фиксированной длины (5 байтов), содержащих информацию о качестве представления;
- блока "Информация о лице" фиксированной длины (17 байтов), содержащего информацию о характеристиках субъекта, например о его поле;
- нескольких (или ни одного) блоков "Контрольная точка" фиксированной длины (8 байтов), содержащих информацию о контрольных точках на изображении лица;
- блока "Информации об изображении" фиксированной длины (11 байтов), содержащего информацию о параметрах цифрового изображения, например о типе изображения лица, горизонтальном и вертикальном размерах изображения.
- блок "Данные представления" состоят из:
- блока "Данные изображения", включающего данные, которые закодированы в формате JPEG, JPEG2000 или PNG;
- блока "Информация о трехмерном изображении" (95 байтов) для типов изображения лица, содержащих информацию о трехмерном изображении лица (с описанием свойств этих данных);
- блока "Данные трехмерного изображения" для типов изображения лица, содержащих информацию о трехмерном изображении лица (с описанием трехмерной геометрии лица).
Одна запись может содержать несколько двухмерных/трехмерных представлений одного и того же биометрического объекта. Это обеспечивается включением нескольких блоков "Представление" после общего заголовка. Блоки "Представление", содержащие данные двухмерного изображения, могут храниться совместно с блоками "Представление", содержащими данные трехмерного изображения. Структура такой записи представлена на рисунке 4.
Рисунок 4 - Запись с несколькими двухмерными/трехмерными представлениями
5.2 Представление данных
5.2.1 Последовательность байтов
Все многобайтовые значения должны быть представлены в формате обратного порядка следования байтов (Big-Endian): старшие байты любого многобайтового значения записывают в память раньше младших байтов.
Пример - Число 1025 (два в 10-й степени плюс один) будет храниться как первый байт 00000100 и второй байт 00000001.
5.2.2 Численные значения
Все численные значения должны быть целочисленными и беззнаковыми величинами фиксированной длины, если не оговорено иное требование.
5.2.3 Преобразование к целочисленному типу
Преобразование численного значения в целочисленный тип должно производиться округлением до меньшего значения, если дробная часть меньше 0,5, и округлением до большего значения, если дробная часть равна или больше 0,5.
5.2.4 Неуказанное значение поля
Следующие обязательные поля, представленные на рисунках 2 и 3, могут содержать неопределенные значения: "Идентификатор технологии биометрического 2D сканера лица", "Идентификатор изготовителя биометрического 2D сканера лица", "Идентификатор типа биометрического 2D сканера лица", "Пол", "Цвет глаз", "Цвет волос", "Рост человека", "Маска свойств", "Выражение лица", "Угловые координаты", "Погрешность угловых координат", "Цветовое пространство изображения", "Идентификатор технологии биометрического 3D сканера лица", "Идентификатор изготовителя биометрического 3D сканера лица", "Идентификатор типа биометрического 3D сканера лица", "Синхронность получения двухмерного и трехмерного изображений", "Синхронность получения текстурной карты и трехмерного изображения", "Продолжительность получения трехмерного изображения", "Продолжительность получения текстурной карты", "Тип текстурной карты", "Спектр текстурной карты".
5.2.5 Неизвестное значение поля
Для обозначения того, что информация, кодируемая в данном поле, не может быть определена по результатам исследования изображения лица, полю должно быть присвоено значение "неизвестный".
5.3 Блок "Общий заголовок"
5.3.1 Структура
Блок "Общий заголовок" состоит из шести <*> полей: "Идентификатор формата", "Номер версии стандарта", "Длина записи", "Число представлений", "Сертификационный флаг" <**> и " семантика", согласно таблице 2.
<*> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - вместо шести полей указано семь полей.
<**> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - вместо поля "Сертификационный флаг" указаны поле "Идентификатор изготовителя биометрического 2D сканера лица" и поле "Идентификатор типа биометрического 2D сканера лица".
5.3.2 Поле "Идентификатор формата"
Поле "Идентификатор формата" (4 байта) является нуль-терминированной строкой с тремя символами ASCII "FAC".
5.3.3 Поле "Номер версии стандарта"
Поле "Номер версии стандарта" (4 байта) является нуль-терминированной строкой с тремя символами ASCII.
Первый и второй символы обозначают номер версии стандарта, третий символ - номер поправки или изменения данной редакции.
Номер версии стандарта ИСО/МЭК 19794-5:2011 <*> должен быть 0x30333000; "030" - номер версии - 3, номер поправки/изменения - 0".
<*> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - вместо ИСО/МЭК 19794-5:2011 указан ИСО/МЭК 19794-5:2010
Примечание - Записи обмена данными, соответствующие Дополнению N 2 ИСО/МЭК 19794-5:2005, в поле "Номер версии стандарта" должны содержать значение "020".
5.3.4 Поле "Длина записи"
Поле "Длина записи" (4 байта) должно содержать значение полной длины записи в байтах. Полную длину записи определяют как сумму длин записи общего заголовка и одной и/или нескольких записей представлений.
5.3.5 Поле "Число представлений"
В поле "Число представлений" (2 байта) должно быть указано число представлений лица, включенных в запись. Требованием является наличие минимум одного представления.
5.3.6 Поле "Сертификационный флаг"
Примечание - Для настоящего стандарта схемы сертификации не представлены.
5.3.7 Поле "
семантика"
Данное поле (2 байта) должно быть заполнено в соответствии с таблицей 3. Это позволяет хранить несколько представлений, полученных: во время одной сессии (например, при фотографировании); во время нескольких сессий (например, при транзакциях банкомата); и во время последовательности (например, видеопоследовательность представлений с равным временным интервалом между ними).
Примечание 1 - Минимальный интервал - 4 x 0,001 с = 0,004 с.
Примечание 2 - Максимальный интервал - 65 534 x 0,001 с = 65,534 с.
Примечание 3 - При использовании видеокодеков с более компактным кодированием видеопоследовательности, например ITU-T H264, добавляются дополнительные служебные данные, которые не поддерживаются настоящим стандартом.
5.4 Блок "Заголовок представления"
5.4.1 Структура
Блок "Заголовок представления" предназначен для описания отдельных свойств индивида, различаемых на изображении. Заголовок указывается для каждого представления, включенного в запись. Структура данного блока представлена на рисунке 2.
Блок "Заголовок представления" состоит из следующих полей: "Длина представления", "Дата и время регистрации", "Идентификатор технологии биометрического 2D сканера лица", "Идентификатор изготовителя биометрического 2D сканера лица", "Идентификатор типа биометрического 2D сканера лица" <*>. Далее следуют поля: "Число блоков "Качество" и соответствующие блоки "Качество". Блок "Заголовок представления" завершается блоком "Информация о лице", необязательным блоком "Контрольные точки" и блоком "Информация об изображении".
<*> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - пропущено поле "Идентификатор типа биометрического 2D сканера лица".
5.4.2 Поле "Длина представления"
Поле "Длина представления" (4 байта) должно содержать значение длины представления в байтах, включая поле "Заголовок представления".
Минимальное значение поля "Длина представления" - 51 байт, что включает: 1) минимальные 47 байтов поля "Заголовок представления"; 2) размер поля "Данные представления" - минимальные 4 байта поля "Размер данных изображения" при 0 байтов изображения.
5.4.3 Поле "Дата и время регистрации"
Поле "Дата и время регистрации" должно содержать дату и время регистрации данного представления по Гринвичу (универсальное глобальное время). Поле "Дата и время регистрации" (9 байт) содержит значения, которые должны быть закодированы в соответствии с формой, представленной в ИСО/МЭК 19794-1.
5.4.4 Поле "Идентификатор технологии биометрического 2D сканера лица"
Поле "Идентификатор технологии биометрического 2D сканера лица" (1 байт) должно содержать класс технологии устройства, используемого при регистрации биометрического образца. Если технология неизвестна или не определена, то должно быть установлено значение 0x00. Возможные значения представлены в таблице 4. часть различных типов биометрических сканеров работает в видимом или ближнем инфракрасном диапазоне спектра. Для обозначения, что биометрический 2D сканер лица работает в ближнем инфракрасном диапазоне спектра, старший бит в поле "Идентификатор технологии биометрического 2D сканера лица" должен быть установлен в 1. Таким образом, если представление зарегистрировано с помощью цифровой видеокамеры, работающей в видимом диапазоне спектра, то значение поля должно быть 0x06, а для работающей в ближнем инфракрасном диапазоне спектра значение поля должно быть 0x86.
Коды поля "Идентификатор технологии биометрического 2D сканера лица"
5.4.5 Поле "Идентификатор изготовителя биометрического 2D сканера лица"
Поле "Идентификатор изготовителя биометрического 2D сканера лица" (2 байта) должно содержать информацию о биометрической организации, являющейся владельцем продукта. Идентификатор изготовителя алгоритма биометрического 2D сканера лица кодируется в 2 байтах идентификатора биометрической организации ЕСФОБД (зарегистрированной МАБИ <*> или другим разрешенным регистрационным органом). Если данное поле содержит нули, то изготовитель биометрического 2D сканера лица неизвестен. (в ред. Изменения N 2, утв. Приказом Росстандарта от 25.11.2021 N 1607-ст)
<*> МАБИ - Международная ассоциация биометрии и идентификации [The International Biometrics & Identification Association (IBIA)]. Деятельность по присвоению уникальных идентификаторов биометрическим организациям, осуществляющим деятельность в Российской Федерации, и биометрическим продуктам, разрабатываемым и/или серийно выпускаемым, и/или реализуемым в Российской Федерации, а также по ведению соответствующих реестров для открытых форматов обмена осуществляет Некоммерческое партнерство "Русское биометрическое общество", официально зарегистрированное МАБИ в качестве ведущей организации ЕСФОБД. (в ред. Изменения N 2, утв. Приказом Росстандарта от 25.11.2021 N 1607-ст)
5.4.6 Поле "Идентификатор типа биометрического 2D сканера лица"
Поле "Идентификатор типа биометрического 2D сканера лица" (2 байта) должно содержать информацию о типе продукта, производящего запись биометрических данных. Тип продукта определяется владельцем зарегистрированного продукта или другим разрешенным регистрационным органом. Если данное поле содержит нули, то тип биометрического 2D сканера лица неизвестен. Если идентификатор изготовителя биометрического 2D сканера лица равен 0x0000, то идентификатор типа биометрического 2D сканера лица также должен быть равен 0x0000.
5.4.7 Поле "Число блоков "Качество"
Поле "Число блоков "Качество" содержит информацию о числе 5-байтовых блоков "Качество". Если оценка качества не проводилась, то значение в данном поле будет 0; соответственно блоки "Качество" представлены не будут.
Примечание - В соответствии с ИСО/МЭК 19794-1:2011 (12.3.1) несколько блоков "Качество" является записью качества.
5.4.8 Поле "Показатель качества"
Поле "Показатель качества" (1 байт) в соответствии с ИСО/МЭК 29794-1 определяет количественное выражение расчетных эксплуатационных характеристик биометрического образца. Допустимыми значениями для показателя качества являются целые числа в диапазоне от 0 (минимальное значение показателя качества) до 100 (максимальное значение показателя качества). Если при определении значения показателя качества произошла ошибка, то должно быть установлено значение 255. Значение показателя качества гармонизировано с ИСО/МЭК 19784-1, где значению 255 соответствует значение минус 1.
Примечание - В стандартах БиоАПИ в отличие от комплекса стандартов ИСО/МЭК 19794 используются целые числа со знаком.
5.4.9 Поле "Идентификатор разработчика алгоритма оценки качества"
Чтобы отличать показатели качества, рассчитанные с помощью разных алгоритмов, в данном поле (2 байта) должен быть указан идентификатор разработчика алгоритма оценки качества. Данный идентификатор регистрируется МАБИ или другим разрешенным регистрационным органом. (в ред. Изменения N 2, утв. Приказом Росстандарта от 25.11.2021 N 1607-ст)
5.4.10 Поле "Идентификатор алгоритма оценки качества"
Поле "Идентификатор алгоритма оценки качества" (2 байта) определяет целочисленный код продукта, определенный разработчиком алгоритма оценки качества. Данное поле отображает, какой из алгоритмов (включая номер версии алгоритма) используется при расчете показателя качества. Значения в данном поле должны быть в диапазоне от 1 до 65 535.
Примечание - В одном представлении не должно указываться несколько показателей качества, рассчитанных с использованием одного алгоритма (при одинаковых идентификаторах разработчика и алгоритма).
В таблице 5 представлены блоки "Качество" в целом. Все значения являются целыми числами без знака фиксированной длины, представленными в формате обратного порядка следования байтов.
5.5 Блок "Информация о лице"
5.5.1 Структура
Блок "Информация о лице" состоит из следующих полей: "Число контрольных точек", "Пол", "Цвет глаз", "Цвет волос", "Рост человека", "Маска свойств", "Выражение лица", "Угловые координаты", "Погрешность угловых координат".
5.5.2 Поле "Число контрольных точек"
Поле "Число контрольных точек" (2 байта) должно содержать информацию о числе блоков "Контрольная точка", которые следуют за блоком "Информация о лице". Требования к блоку "Контрольная точка" приведены в 5.6.
5.5.3 Поле "Пол"
Поле "Пол" (1 байт) должно содержать информацию о половой принадлежности человека в соответствии с таблицей 6.
5.5.4 Поле "Цвет глаз"
Поле "Цвет глаз" (1 байт) должно содержать информацию о цвете радужных оболочек глаз в соответствии с таблицей 7. Если глаза человека имеют разный цвет, то должен кодироваться цвет правого глаза.
<*> Встречается очень редко, связан с лейкизмом. В мире очень малое число людей болеет лейкизмом.
5.5.5 Поле "Цвет волос"
Поле "Цвет волос" (1 байт) должно содержать информацию о цвете волос в соответствии с таблицей 8.
5.5.6 Поле "Рост человека"
Поле "Рост человека" (1 байт) должно содержать информацию о росте человека в соответствии с таблицей 9.
5.5.7 Поле "Маска свойств"
Поле "Маска свойств" (3 байта) - трехбайтовое битовое поле, в котором каждый бит, расположенный в соответствии с таблицей 10, должен иметь значение, равное 1, если соответствующее свойство присутствует, и 0, если свойство отсутствует. Нумерация битов поля начинается с нуля, соответствующего младшему биту. Значение младшего бита, равное нулю, означает, что свойства не определены. Значение младшего бита, равное единице, означает, что все перечисленные свойства были проверены. Нулевое значение любого бита свойств указывает на отсутствие соответствующего свойства.
Структура поля "Маска свойств"
Все зарезервированные биты должны иметь значение, равное нулю.
Свойство "зрачок или радужка не видна" при значении, равном 1, указывает на несоответствие фронтальному, полному фронтальному и условному фронтальному типам изображения лица.
5.5.8 Поле "Выражение лица"
Поле "Выражение лица" (2 байта) - двухбайтовое битовое поле, в котором каждый бит, расположенный в соответствии с таблицей 11, должен иметь значение, равное единице, если соответствующее выражение лица присутствует, и нулю, если выражение лица отсутствует. Нумерация битов поля начинается с нуля, соответствующего младшему биту. Значение младшего бита, равное нулю, означает, что свойства не определены (и все остальные биты должны быть иметь значение нуль). Значение младшего бита, равное единице, означает, что все перечисленные свойства были проверены. Нулевое значение любого бита свойств указывает на отсутствие соответствующего выражения лица.
Структура поля "Выражение лица"
Все зарезервированные биты должны иметь значение, равное нулю.
5.5.9 Поле "Угловые координаты"
Поле "Угловые координаты" (3 байта) должно содержать информацию об оценке или результате измерения положения головы на изображении. Каждый байт поля соответствует угловой координате поворота BY, наклона BP и отклонения BR в указанном порядке. Угловые координаты определяются углами Тайт-Брайна <*>:
- угол поворота - вращение вокруг вертикальной оси y;
- угол наклона - вращение вокруг горизонтальной оси x, направленной слева направо;
- угол отклонения - вращение вокруг горизонтальной оси z, направленной вперед.
<*> В русскоязычной научной литературе данные углы называются углами Крылова.
Углы определены относительно фронтального положения головы, для которого указанные угловые координаты равны (0, 0, 0) в соответствии с рисунком 5. Фронтальное положение определяется следующим образом: Франкфуртская горизонталь (см. приложение E) в качестве плоскости xz; вертикально симметричная плоскость как плоскость yz; ось z направлена в сторону взгляда лица. Пример приведен на рисунке 6.
Рисунок 5 - Определение угловых координат относительно фронтального положения головы
Рисунок 6 - Примеры угловых положений головы и их кодирование.
Угловые положения головы Y, P, R и их обозначения от a до g следующие: (0°; 0°; 0°), (+45°; 0°; 0°), (-45°; 0°; 0°), (0°; -45°; 0°), (0°; +45°; 0°), (0°; 0°; -45°) и (0°; 0°; +45°) соответственно. Закодированные значения угловых координат BY, BP, BR в соответствии с 5.5.9.1 - 5.5.9.3 следующие: (1; 1; 1), (23; 1; 1), (158; 1; 1), (1; 158; 1), (1; 23; 1), (1; 1; 158) и (1; 1; 23) соответственно.
Конечное положение головы зависит от последовательности вращений вокруг координатных осей, поэтому кодировка углового положения должна проводиться в определенном порядке относительно фронтального положения. Порядок вращений должен быть следующим: сначала отклонение (вокруг горизонтальной оси z), после этого наклон (вокруг горизонтальной оси x), затем поворот (вокруг вертикальной оси y). Таким образом, преобразование отклонения всегда будет проводиться в плоскости xy.
При проведении преобразования от наблюдаемого положения к фронтальному порядок должен быть следующим; поворот, наклон и затем отклонение. Кодируемые угловые координаты соответствуют выполнению преобразования от фронтального положения к наблюдаемому.
5.5.9.1 Угловая координата - поворот
Угол поворота Y должен быть выражен в градусах и соответствовать вращению вокруг оси y (вертикальная ось), как показано на рисунке 5. Фронтальное положение головы должно соответствовать углу поворота 0°. Угол поворота должен иметь положительное значение, если лицо повернуто влево (вращение вокруг оси y против часовой стрелки).
(Измененная редакция, Изм. A1:2014). (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
- если 180° >= Y >= 0°, то BY = Y/2 + 1; остаток от деления отбрасывают;
- если -180° <= Y < 0°, то BY = 181 + Y/2; остаток от деления отбрасывают.
Максимальное значение BY должно быть равно 180°. Если угол поворота не определен, то значение BY должно быть равно нулю.
5.5.9.2 Угловая координата - наклон
Угол наклона P должен быть выражен в градусах и соответствовать вращению вокруг оси x (горизонтальная ось), как показано на рисунке 5. Фронтальное положение головы должно соответствовать углу наклона 0°. Угол наклона должен иметь положительное значение, если лицо наклонено вперед (вращение вокруг оси x против часовой стрелки).
(Измененная редакция, Изм. A1:2014). (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
- если 180° >= P >= 0°, то BP = P/2 + 1; остаток от деления отбрасывают;
- если -180° <= P < 0°, то BP = 181 + P/2; остаток от деления отбрасывают.
Максимальное значение BP должно быть равно 180°. Если угол наклона не определен, то значение BP должно быть равно нулю.
Необходимо учесть, что нулевое значение наклона не является точно определяемым значением.
5.5.9.3 Угловая координата - отклонение
Угол отклонения R должен быть выражен в градусах и соответствовать вращению вокруг оси z (горизонтальная ось, направленная вперед), как показано на рисунке 5. Фронтальное положение головы должно соответствовать углу отклонения 0°. Угол отклонения должен иметь положительное значение, если лицо наклонено к правому плечу (вращение вокруг оси z против часовой стрелки).
(Измененная редакция, Изм. A1:2014). (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
- если 180° >= R >= 0°, то BR = R/2 + 1; остаток от деления отбрасывают;
- если -180° <= R < 0°, то BR = 181 + R/2; остаток от деления отбрасывают.
Максимальное значение BR должно быть равно 180°. Если угол отклонения не определен, то значение BR должно быть равно нулю.
5.5.10 Поле "Погрешность угловых координат"
Поле "Погрешность угловых координат" (3 байта) должно содержать информацию об ожидаемом значении погрешности угловых координат поворота UY, наклона UP и отклонения UR. Каждый байт поля содержит данные о погрешности координат поворота, наклона и отклонения в указанном порядке. Допускается указывать значение экспериментальной погрешности, установленное изготовителем.
Для кодирования погрешности угловых координат выделяют три байта UY, UP, UR. Каждый байт Uk (k = Y, P, R) поля характеризует погрешность по одной из координат с шагом в 1°. Он вычисляется как Uk = (погрешность +1) и может иметь значения в диапазоне от 1° до 181° включительно. Чем больше погрешность, тем выше должно быть значение погрешности Uk. Если погрешность не установлена, то значения UY, UP и UR должны быть равны нулю.
5.6 Блок "Контрольная точка"
5.6.1 Структура
Необязательный для заполнения блок "Контрольная точка" (8 байтов) определяет тип, код и положение контрольной точки на изображении лица. Число блоков "Контрольная точка" определяется в поле "Число контрольных точек" блока "Информация о лице". Структура данного блока представлена в таблице 12.
Контрольные точки могут указываться как контрольные точки MPEG-4 в соответствии с ИСО/МЭК 14496-2:2004 (приложение C) или как антропометрические точки с двухмерными или трехмерными координатами. Определение антропометрических точек и их взаимосвязь с набором контрольных точек MPEG-4 приводятся в 5.6.6.
Горизонтальное и вертикальное положение контрольных точек указываются в координатах текстурного изображения или в прямоугольной системе координат (см. 5.10.2.2).
5.6.2 Поле "Тип контрольной точки"
Поле "Тип контрольной точки" (1 байт) определяет тип контрольной точки, записанной в блоке "Контрольная точка" (таблица 13). Это поле должно иметь значение 0x01 для обозначения двухмерной контрольной точки MPEG-4 в соответствии с ИСО/МЭК 14496-2:2004 (приложение C). Поле должно иметь значение 0x02 для обозначения двухмерной антропометрической контрольной точки. Поле должно иметь значение 0x03 для обозначения трехмерной антропометрической контрольной точки. Все другие значения поля зарезервированы ПК37 для будущего использования.
Коды поля "Тип контрольной точки"
5.6.3 Поле "Код контрольной точки"
Поле "Код контрольной точки" (1 байт) определяет контрольную точку, записанную в блоке "Контрольная точка".
Для контрольной точки типа 0x01 в этом блоке должны быть сохранены коды контрольных точек MPEG-4, указанные в 5.6.4, в соответствии с ИСО/МЭК 14496-2:2004 (приложение C), или дополнительные контрольные точки глаз и ноздрей из 5.6.5.
Для контрольных точек типов 0x02 или 0x03 в этом блоке записываются коды контрольных точек, определенных в 5.6.6.
5.6.4 Контрольные точки MPEG-4
Коды, присвоенные контрольным точкам в соответствии ИСО/МЭК 14496-2:2004 (приложение C), показаны на рисунке 7. Код каждой контрольной точки задается условным обозначениям в формате A.B. Значение A является основным, значение B - дополнительным. Кодировка контрольной точки производится записью значения (1 байт), полученного по формуле A x 16 + B.
- Контрольные точки, на которые влияют параметры движения лица (определены в ИСО/МЭК 14496-2);
Рисунок 7 - Коды контрольных точек MPEG-4 по ИСО/МЭК 14496-2
5.6.5 Контрольные точки глаз и ноздрей
Контрольные точки центров глаз 12.1 (левого) и 12.2 (правого) определяются как середины отрезков, соединяющих углы глаз (3.7, 3.11) и (3.8, 3.12) соответственно. Контрольная точка центра левой ноздри 12.3 имеет такую же горизонтальную координату, как середина отрезка, соединяющего контрольные точки носа (9.1, 9.15), и такую же вертикальную координату, как середина отрезка, соединяющего контрольные точки носа (9.3, 9.15). Контрольная точка центра левой ноздри 12.4 имеет такую же горизонтальную координату, как середина отрезка, соединяющего контрольные точки носа (9.2, 9.15), и такую же вертикальную координату, как середина отрезка, соединяющего контрольные точки носа (9.3, 9.15). Контрольные точки центров глаз и ноздрей изображены на рисунке 8, их значения приведены в таблице 14.
Рисунок 8 - Контрольные точки центров глаз и ноздрей, определяемые относительно середины отрезков между контрольными точками MPEG-4
Коды контрольных точек центров глаз и ноздрей
Код каждой контрольной точки, показанной на рисунке 8, задается основным значением A и дополнительным значением B. Например, код для левого угла левого глаза задается основным значением 3 и дополнительным значением 7.
5.6.6 Антропометрические точки
Антропометрические точки расширяют модель MPEG-4 точками, которые используются в криминалистике и антропологии для идентификации человека с помощью двух изображений лица или изображения лица и черепа <*>. (в ред. Изменения N 2, утв. Приказом Росстандарта от 25.11.2021 N 1607-ст)
<*> Многие современные алгоритмы распознавания могут не использовать антропометрические точки для идентификации человека. (в ред. Изменения N 2, утв. Приказом Росстандарта от 25.11.2021 N 1607-ст)
На рисунке 9 и в таблице 15 приводится определение антропометрических точек. Набор точек представляет собой черепно-лицевые контрольные точки на голове и лице. Последние используются в криминалистике для идентификации по принципу "Лицо с лицом" или "Череп с лицом". Некоторые из этих точек имеют эквиваленты в MPEG-4, другие - не имеют.
Определения данных точек представлены в таблице 15.
(в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
Рисунок 9 - Антропометрические точки, которые имеют (красные) и не имеют (синие) эквиваленты в MPEG-4
Определения антропометрических точек
Антропометрическая точка имеет формат A.B. Параметр A определяет область на изображения лица, которой принадлежит эта контрольная точка, например нос, рот и т.д. Параметр B определяет отдельную точку. Если контрольная точка имеет два симметричных положения (левое и правое), то правое положение всегда имеет большее и четное значение параметра A. В результате все контрольные точки на левой части изображения лица имеют нечетные дополнительные коды, а на правой - четные. Параметры A и B имеют значения в диапазоне от 1 до 15. Код A x 16 + B записывается в поле "Код контрольной точки" размером 1 байт.
5.6.7 Трехмерные антропометрические точки
Ошибка определения положения трехмерной антропометрической точки должна составлять не более 3 мм. Точка должна находиться от ближайшей точки поверхности на расстоянии не более 3 мм. Точкой на поверхности считается вершина, точка на ребре или точка на грани поверхности.
5.6.8 Поле "Координата Z"
Это поле не используется, если тип контрольной точки относится к контрольным точкам MPEG-4 или двухмерным антропометрическим точкам. Если тип контрольной точки относится к трехмерным антропометрическим точкам, то это поле вместе с положением по горизонтали и положением по вертикали определяет координаты контрольной точки в прямоугольной системе координат. Метрические координаты трехмерных контрольных точек вычисляются путем умножения координат X, Y и Z на постоянный коэффициент масштаба, равный 0,02 мм. Таким образом, поле "Тип контрольной точки" кодирует тип контрольной точки и определяет способ интерпретации координаты Z.
5.7 Блок "Информация об изображении"
5.7.1 Структура
Блок "Информация об изображении" (11 байтов) предназначен для описания параметров цифрового изображения лица. Каждое изображение лица, входящее в запись, имеет свой блок "Информация об изображении". Структура данного блока представлена на рисунке 2. За каждым блоком "Информация об изображении" следует один блок "Данные представления".
5.7.2 Поле "Тип изображения лица"
Поле "Тип изображения лица", согласно таблице 16, должно содержать информацию о типе изображения лица, записанного в блоке "Данные изображения", и, при наличии, в блоке "Данные трехмерного изображения". Фронтальный тип изображения лица является полным фронтальным, условным фронтальным, обработанным фронтальным либо полным фронтальным трехмерным или условным фронтальным трехмерным типом изображения. Поэтому не используется отдельное значение "фронтальный".
Коды поля "Тип изображения лица"
Основной тип изображения лица определен в разделе 6. Фронтальный, полный фронтальный, условный фронтальный и обработанный фронтальный типы изображения лица определены в разделах 7, 8, 9 и 10 соответственно. Для данных типов изображения лица используется понятие "наследование". Например, фронтальный тип изображения лица наследует все требования для основного типа изображения лица. Это означает, что фронтальный тип изображения лица подчиняется всем нормативным требованиям, установленным для основного типа изображения лица. Структура наследования типов изображения лица показана на рисунке 10.
Рисунок 10 - Типы двухмерных изображений лица и их наследование
Если двухмерная запись, отвечающая требованиям основного, полного фронтального или условного фронтального типов изображений, содержит данные трехмерного изображения, это определяется установкой единицы для старшего бита поля "Тип изображения лица", в результате чего код типа изображения лица задается в диапазоне от 0x80 до 0x82.
Нормативные требования к основному, фронтальному, полному фронтальному, условному фронтальному и обработанному фронтальному типам изображения лица приведены в разделах 6, 7, 8, 9 и 10 соответственно. Основной, полный фронтальный и условный фронтальный трехмерные типы изображения лица определены в разделах 11, 12 и 13 соответственно.
5.7.3 Поле "Тип данных изображения"
Поле "Тип данных изображения" (1 байт) должно содержать информацию об используемом формате кодирования данных изображения (таблица 17). Должен быть определен формат JPEG (ИСО/МЭК 10918-1 и МСЭ-Т Рекомендации T.81), JPEG2000 (ИСО/МЭК 15444-1) или PNG (ИСО/МЭК 15948).
Коды поля "Тип данных изображения"
Для сжатия информации без потерь должен быть использован формат PNG или формат JPEG2000 (без потерь). Для изображений с более чем 8 битами на канал без потерь необходимо использовать формат PNG или формат JPEG2000 (без потерь). Для изображений с более чем 8 битами на канал с потерями необходимо использовать формат JPEG2000.
Примечание - Значение "Не определен" не может быть использовано.
5.7.4 Поле "Горизонтальный размер изображения"
Поле "Горизонтальный размер изображения" (2 байта) должно содержать информацию о числе пикселей в горизонтальном направлении.
5.7.5 Поле "Вертикальный размер изображения"
Поле "Вертикальный размер изображения" (2 байта) должно содержать информацию о числе пикселей в вертикальном направлении.
5.7.6 Поле "Пространственная дискретизация"
Для разных приложений может потребоваться различная минимальная частота пространственной дискретизации. Например, использование высокой частоты пространственной дискретизации необходимо для визуальных и автоматических методов, требующих анализа очень маленьких деталей. Поле "Пространственная дискретизация" (1 байт) содержит информацию о числе пикселей горизонтального размера головы на изображении (таблица 18). (Горизонтальный размер головы CC определен на рисунке 14).
Коды поля "Пространственная дискретизация"
Примечание - Расстояние между центрами глаз в пикселях приблизительно равно половине горизонтального размера головы.
5.7.7 Поле "Постобработка изображения"
Несмотря на то что данные изображения не должны подвергаться изменению, возможны случаи, когда нет иных вариантов:
- унаследованные базы данных, содержащие фронтальное изображение лица с поворотом 3/4, которые должны быть повернуты к полному фронтальному изображению для биометрического сравнения;
- нефронтальные изображения, автоматически сгенерированные из фронтального изображения с использованием полной модели головы и т.п. (многоракурсные изображения). Такие изображения могут быть полезны в процессе сравнения или визуального анализа благодаря более похожему ракурсу, чем исходное фронтальное изображение;
- отдельное изображение подвергается прогнозированию возрастных изменений и используется для верификации владельца паспорта;
- из небольшого видеопотока вырезается отдельное изображение лица (обработка значительным приближением) для сравнения со списком лиц.
Поле "Постобработка изображения" (2 байта) предоставляет перечень вариантов постобработок, которые могут применяться к исходным изображениям. Каждый бит маски на позиции, указанной в таблице 19, должен быть установлен на 1, если соответствующая постобработка изображения проводилась, и на 0 в обратном случае. Нулевая позиция маски соответствует самому низкому биту. Если у всех битов установлены нулевые значения, то постобработка изображения не проводилась. Все зарезервированные биты должны быть заполнены нулями.
Для исходных изображений обычно необходима некоторая постобработка, чтобы изображение соответствовало требованиям настоящего стандарта, особенно для фронтального типа изображения. Однако эта постобработка должна быть минимальной и не должна искажать характеристики исходного изображения. В правой колонке таблицы 19 указано, при каких вариантах постобработки изображение обязательно должно сохраняться в обработанном типе изображения (см. раздел 10).
5.7.8 Поле "Перекрестная ссылка"
Поле "Перекрестная ссылка" (1 байт) определяет внутренние зависимости при хранении записи обмена нескольких изображений и имеет значение при применении постобработки изображения (см. раздел 10). Для изображений обработанного типа в поле "Перекрестная ссылка" должен указываться порядковый номер изображения, из которого получено данное изображение (таблица 20). Первое по порядку изображение имеет код 0x01.
Коды поля "Перекрестная ссылка"
Например, в записи четыре представления. Второе представление было использовано для постобработки, и результат сохранен как четвертое представление. Тогда четвертое представление должно иметь в поле "Перекрестная ссылка" значение 2, а все остальные представления - значение 0.
5.7.9 Поле "Цветовое пространство изображения"
Поле "Цветовое пространство изображения" (1 байт) должно содержать информацию о цветовом пространстве, используемом при кодировании данных изображения, в соответствии с таблицей 21. Значения 0x80 - 0xFF зарезервированы и определяются изготовителем. Для получения описания этих значений разработчикам приложений следует обращаться к изготовителю.
Коды поля "Цветовое пространство изображения"
5.8 Блок "Данные представления"
Блок "Данные представления" состоит из следующих блоков: блок "Данные изображения", блок "Информация о трехмерном изображении" и блок "Данные трехмерного изображения".
5.9 Блок "Данные изображения"
5.9.1 Структура
Блок "Данные изображения" (переменной длины) должен состоять из двух полей, согласно таблице 22.
Структура блока "Данные изображения"
5.9.2 Поле "Размер данных изображения"
Поле "Размер данных изображения" (4 байта) содержит информацию о размере данных изображения в байтах.
5.9.3 Поле "Данные изображения"
Поле "Данные изображения" (переменной длины) содержит данные изображения, закодированные с помощью одного из следующих форматов: JPEG, JPEG2000 или PNG.
5.10 Блок "Информация о трехмерном изображении"
Блок "Информация о трехмерном изображении" состоит из следующих полей: "Длина данных трехмерного изображения", "Тип системы координат", "Матрица текстурной проекции", "Масштаб", "Смещение", "Тип трехмерного представления", "Вспомогательные данные трехмерного изображения", зарезервированное для будущего использования поле, "Идентификатор технологии биометрического 3D сканера лица", "Идентификатор изготовителя биометрического 3D сканера лица", "Идентификатор типа биометрического 3D сканера лица", "Синхронность получения двухмерного и трехмерного изображений", "Синхронность получения текстурной карты и трехмерного изображения", "Продолжительность получения трехмерного изображения", "Продолжительность получения текстурной карты", "Тип текстурной карты", "Спектр текстурной карты".
5.10.1 Поле "Длина данных трехмерного изображения"
Данное поле (4 байта) определяет размер блоков "Информация о трехмерном изображении" и "Данные трехмерного изображения", включая необязательные поля и блоки при их наличии.
5.10.2 Поле "Тип системы координат"
5.10.2.1 Общие положения
Исходные данные трехмерного изображения регистрируются в собственной системе координат устройства. С использованием значений внутренних параметров устройства получения трехмерного изображения данные трехмерного изображения могут быть преобразованы в метрические мировые координаты. Однако у этого способа имеется два недостатка:
- происходит потеря периодической структуры данных, созданной устройством получения трехмерного изображения (что приводит, например, к различиям в расстояниях между точками);
- для обеспечения периодичности структуры в мировой системе координат требуется интерполяция, при этом исходные данные не сохраняются. Это вполне приемлемо для многих приложений, однако настоящий стандарт предназначен и для сохранения исходных данных.
По этой причине настоящим стандартом предусмотрено несколько способов хранения данных трехмерного изображения в различных представлениях. Все представления поддерживают прямоугольную систему координат. Представление в виде карты глубины дополнительно поддерживает цилиндрическую систему координат. В дальнейшем применение системы координат может быть ограничено для различных типов изображения лица (см. 11 - 13 и B.7).
Преобразование в метрические мировые координаты определено соответствующими коэффициентами пересчета и неявными правилами (например, используемыми в типе трехмерной антропометрической точки), определенными в настоящем стандарте (см. 5.10.2.2 и 5.10.2.3).
Поле "Тип системы координат" (1 байт) определяет систему координат данных трехмерного изображения (таблица 23).
Коды поля "Тип системы координат"
Различные системы координат определяются в 5.10.2.2 и 5.10.2.3.
5.10.2.2 Прямоугольная система координат (рисунок 11)
Рисунок 11 - Пример прямоугольной системы координат
В прямоугольной системе координат начало отсчета данных, полученных с датчика, обычно используется в качестве начала отсчета системы координат.
Преобразование прямоугольных координат в метрические прямоугольные координаты производится следующим образом:
X = x x Масштаб X + Смещение X;
Y = y x Масштаб Y + Смещение Y;
Z = z x Масштаб Z + Смещение Z.
Примечание 1 - Для определенных типов изображения лица началом отсчета системы прямоугольных координат является нос, т.е. контрольная точка prn, определенная в таблице 15.
Примечание 2 - Для определенных типов изображения лица определяются ограничения в отношении положения головы. Фронтальное положение определяется Франкфуртской горизонталью FH (см. приложение E) в качестве плоскости XOZ и вертикальной плоскостью симметрии в качестве плоскости YOZ с осью Z, направленной в сторону взгляда лица.
Кроме того, между антропометрическими точками и системой координат существует точное соотношение, определяемое:
- анатомическими требованиями к расположению соответствующего двухмерного изображения лица,
- соответствием между трехмерной картой глубины и соответствующим двухмерным изображением лица после применения матрицы текстурной проекции.
5.10.2.3 Цилиндрическая система координат (рисунок 12)
Рисунок 12 - Пример цилиндрической системы координат
Примечание - FH означает Франкфуртскую горизонталь, см. приложение E.
Точка в цилиндрической системе координат задается координатами , h, r. Угол
и ось h определяются таким образом, что они составляют правостороннюю систему координат.
Преобразование цилиндрических координат в метрические прямоугольные координаты производится следующим образом:
X = r x Масштаб Z x sin ( x Масштаб X) + Смещение X;
Y = h x Масштаб Y + Смещение Y;
Z = r x Масштаб Z x cos ( x Масштаб X) + Смещение Z.
Масштаб X, Масштаб Y, Масштаб Z, Смещение X, Смещение Y и Смещение Z являются постоянными величинами для преобразования. Масштаб X измеряется в радианах. Масштаб Y, Масштаб Z, Смещение X, Смещение Y и Смещение Z измеряются в миллиметрах. Следует обратить внимание на то, что большие значения полей "Масштаб X", "Масштаб Y" или "Масштаб Z" указывают на низкое разрешение в соответствующем измерении.
Обычно начало отсчета данных, полученных с датчика, используется в качестве начала отсчета системы цилиндрических координат.
Примечание - Для определенных типов изображения лица началом отсчета системы цилиндрических координат является нос, т.е. контрольная точка prn, определенная в таблице 15.
Кроме того, между антропометрическими точками и системой координат существует точное соотношение, определяемое:
- анатомическими требованиями к расположению соответствующего двухмерного изображения лица,
- соответствием между трехмерной картой глубины и соответствующим двухмерным изображением лица после применения матрицы текстурной проекции.
Преобразование из цилиндрической в прямоугольную систему координат производится с помощью преобразования, определенного в 5.10.2.3, а затем - с помощью преобразования, обратного преобразованию, определенному в 5.10.2.2.
5.10.3 Поле "Матрица текстурной проекции"
Матрица текстурной проекции P (размер 3x4, тип float, 48 байт) предназначена для отображения данных трехмерного изображения на текстурное двухмерное изображение. Матрица записывается ряд за рядом, начиная с верхнего левого угла.
Проецирование точки в трехмерном пространстве [X,Y,Z] на текстурное изображение производится умножением матрицы текстурной проекции P на так называемые однородные трехмерные координаты точки [13]:
Однородные трехмерные координаты являются вектором четырех чисел [X,Y,Z,1]T. В данном случае X, Y, Z - это координаты точки в метрической прямоугольной системе координат. В результате умножения получается вектор [x,y,w]T так называемых однородных двухмерных координат со вспомогательной координатой w. Чтобы получить двухмерные координаты пикселей текстурного изображения, следует разделить первые две координаты однородных двухмерных координат на соответствующую третью координату w.
Таким образом, [x:w, y:w] - это результирующие координаты пикселей текстурного изображения, связанного с определенной трехмерной точкой [X,Y,Z]T. Получаемые координаты являются значениями с плавающей точкой. В настоящем стандарте не регламентируются правила округления или интерполяции полученных значений до целочисленных значений координат пикселей.
При использовании цилиндрической системы координат для проецирования данных трехмерного изображения на текстуру требуется преобразовать трехмерные данные сначала в метрическую прямоугольную систему координат. В случае наложения на текстуру проецируется первая трехмерная точка по линии взгляда (ближайшая к наблюдателю).
В следующих двух блоках хранятся все параметры, необходимые для расчета метрических значений глубины на основе данных трехмерного изображения.
5.10.4 Блоки "Масштаб" и "Смещение"
Как указано в 5.10.2.2 и 5.10.2.3, параметры Масштаб X, Масштаб Y, Масштаб Z, Смещение X, Смещение Y, Смещение Z применяются в преобразовании цифровых координат в метрические. Это относится ко всем трехмерным представлениям, описанным в настоящем стандарте. Значения этих полей определены в физических единицах - миллиметрах. Масштаб X имеет размерность физических единиц "мм" при использовании прямоугольных координат, а при использовании цилиндрических координат - "радианы".
(Измененная редакция, Изм. A1:2014). (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
Большие значения полей "Масштаб X", "Масштаб Y" или "Масштаб Z" указывают на низкое разрешение в соответствующем измерении. Для различных типов изображений могут быть ограничены верхние пределы значений полей "Масштаб X", "Масштаб Y" или "Масштаб Z" (см. разделы 11 - 13, B.7).
Масштаб X и Масштаб Y в карте глубины представляют пространственное разрешение, а в карте точек - интервалы квантования трехмерного пространства. Масштаб Z в любом из этих представлений определяет интервал квантования.
5.10.5 Поле "Тип трехмерного представления"
Поле "Тип трехмерного представления" (1 байт) определяет тип представления, кодирующего данные трехмерного изображения (таблица 24).
Коды поля "Тип трехмерного представления"
5.10.6 Поле "Вспомогательные данные трехмерного изображения"
Маска вспомогательных данных трехмерного изображения - это битовая маска размером в 1 байт. Биты в каждой позиции маски, перечисленные в таблице 25, должны быть установлены в значение 1, если имеется соответствующая информация о трехмерном изображении, и в значение 0, если такая информация отсутствует. Поэтому битовая маска, состоящая из одних нулей, указывает на отсутствие какой-либо вспомогательной информации. Позиция маски начинается с младшего бита. Маска показывает, присутствует ли в записи карта ошибок/ошибки в вершинах и/или текстурная карта.
Структура поля "Вспомогательные данные трехмерного изображения"
Все зарезервированные биты должны быть установлены на значение 0.
5.10.7 Поле "Идентификатор технологии биометрического 3D сканера лица"
По аналогии с полем "Идентификатор технологии биометрического 2D сканера лица", в котором содержится информация о технологии получения двухмерного изображения лица, поле "Идентификатор технологии биометрического 3D сканера лица" (1 байт) должно использоваться для указания типа биометрического сканера, использованного для получения данных о трехмерном изображении (таблица 26). Кроме того, самый старший разряд (Most Significant Bit, MSB) определяет то, какая технология сканирования используется для устройства данного типа: активная или пассивная.
Коды поля "Идентификатор технологии биометрического 3D сканера лица"
5.10.8 Поле "Идентификатор изготовителя биометрического 3D сканера лица"
Поле "Идентификатор изготовителя биометрического 3D сканера лица" (2 байта) описывает уникальный для изготовителя идентификатор биометрического 3D сканера лица. Идентификатор изготовителя биометрического 3D сканера лица кодируется двухбайтовым значением идентификатора биометрической организации ЕСФОБД (зарегистрированной МАБИ или другим разрешенным регистрационным органом). Значение, состоящее из одних нулей, является допустимым и означает, что изготовитель биометрического 3D сканера лица не определен. (в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст, Изменения N 2, утв. Приказом Росстандарта от 25.11.2021 N 1607-ст)
5.10.9 Поле "Идентификатор типа биометрического 3D сканера лица"
Поле "Идентификатор типа биометрического 3D сканера лица" (2 байта) описывает уникальный для изготовителя идентификатор типа биометрического 3D сканера лица. Значение, состоящее из одних нулей, является допустимым и означает, что тип биометрического 3D сканера лица не определен. Разработчики приложений могут получить значение этого кода у изготовителя.
5.10.10 Поле "Синхронность получения двухмерного и трехмерного изображений"
Обязательное поле "Синхронность получения двухмерного и трехмерного изображений" (2 байта) определяет временную взаимосвязь между двухмерным изображением блока "Данные изображения" и данными трехмерного изображения. Поле не содержит ссылки на необязательное текстурное изображение блока "Данные трехмерного изображения". Значение равно разнице во времени, указанной в миллисекундах (мс), между началом получения двухмерного изображения лица и началом получения трехмерного изображения. Допускаются положительные и отрицательные значения.
В настоящем стандарте отрицательная разница во времени означает, что процесс получения трехмерного изображения начался раньше процесса получения двухмерного изображения. Разница во времени, выраженная в миллисекундах (мс), указывается в системе дополнения до двух. Таким образом, значение 0x8001 определяет максимальную по модулю отрицательную разницу во времени минус 32767 мс, а значение 0x7FFF соответствует максимальной положительной разнице во времени плюс 32767 мс. Значение 0x8000 является допустимым и указывает, что синхронность получения двухмерного и трехмерного изображения не определена (таблица 27).
Коды поля "Синхронность получения двухмерного и трехмерного изображений"
5.10.11 Поле "Синхронность получения текстурной карты и трехмерного изображения"
Обязательное поле "Синхронность получения текстурной карты и трехмерного изображения" (2 байта) определяет временную взаимосвязь между данными трехмерного изображения и данными текстурной карты (необязательное поле) блока "Данные трехмерного изображения". Значение равно разнице во времени, выраженной в миллисекундах (мс), между началом получения текстурной карты и началом получения трехмерных данных.
Примечание - Поле не имеет отношения к синхронности получения двухмерного изображения в блоке "Данные изображения" и данными трехмерного изображения.
Допускаются положительные и отрицательные значения. В настоящем стандарте отрицательная разница во времени означает, что процесс получения трехмерного изображения начался раньше процесса получения текстурной карты. Разница во времени, выраженная в миллисекундах (мс), указывается в системе дополнения до двух. Таким образом, значение 0x8001 определяет максимальную по модулю отрицательную разницу во времени минус 32767 мс, а значение 0x7FFF соответствует максимальной положительной разнице во времени плюс 32767 мс. Значение 0x8000 является допустимым и указывает, что синхронность получения текстурной карты и трехмерного изображения не определена (таблица 28).
Коды поля "Синхронность получения текстурной карты и трехмерного изображения"
5.10.12 Поле "Продолжительность получения трехмерного изображения"
Продолжительность получения трехмерного изображения существенно различается при использовании различных методов сканирования и может напрямую повлиять на качество данных (при движении объекта съемки во время получения данных). Поле "Продолжительность получения трехмерного изображения" (2 байта) определяет значение интервала времени, выраженное в миллисекундах (мс), между началом процесса получения трехмерного изображения и его окончанием. Значение 0xFFFF является допустимым и указывает, что поле не определено (таблица 29).
Коды поля "Продолжительность получения трехмерного изображения"
5.10.13 Поле "Продолжительность получения текстурной карты"
Текстурная карта (необязательное поле) в блоке "Данные трехмерного представления" может быть получена как одновременно, так и не одновременно с данными трехмерного изображения. Поле "Продолжительность получения текстурной карты" (2 байта) определяет значение интервала времени между началом и окончанием получения текстурной карты, выраженное в миллисекундах (мс). Значение 0xFFFF является допустимым и указывает, что поле не определено (таблица 30).
Примечание - Значение поля "Продолжительность получения текстурной карты" не является продолжительностью получения двухмерного изображения блока "Данные изображения".
Коды поля "Продолжительность получения текстурной карты"
5.10.14 Поле "Тип текстурной карты"
Поле "Тип текстурной карты" (1 байт) определяет тип кодирования текстурной карты (таблица 31). Если в поле "Вспомогательные данные трехмерного изображения" задано наличие текстурной карты в записи, то следует указать формат: JPEG (ИСО/МЭК 10918-1 и рекомендации МСЭ-Т T.81), JPEG 2000 (ИСО/МЭК 15444-1) или PNG (ИСО/МЭК 15948:2004). Для формата JPEG данные должны быть отформатированы в соответствии со стандартом формата обмена файлами JPEG (JPEG File Interchange Format, JFIF), версия 1.02.
Коды поля "Тип текстурной карты"
Если в поле "Вспомогательные данные трехмерного изображения" не указано наличие текстурной карты, то тип текстурной карты должен иметь значение "не определено".
5.10.15 Поле "Спектр текстурной карты"
Поле "Спектр текстурной карты" (1 байт) определяет диапазон спектра, в котором получена текстурная карта, указанная в 5.11.9. Для получения двухмерного изображения всегда используется видимый диапазон спектра, при получении же текстурной карты условия могут быть иными.
Если в поле "Вспомогательные данные трехмерного изображения" указано наличие текстурной карты, то следует также указать значение поля "Спектр текстурной карты". Если в поле "Вспомогательные данные трехмерного изображения" не указано наличие текстурной карты, то спектр текстурной карты должен иметь значение "не определено" (таблица 32).
Коды поля "Спектр текстурной карты"
5.11 Блок "Данные трехмерного изображения"
5.11.1 Структура
Блок "Данные трехмерного изображения" содержит данные трехмерного изображения. Предусмотрено три варианта хранения трехмерных данных: карта глубины, карта точек или данные вершин. Допускается запись дополнительной информации в поле "Карта ошибок", блоке "Ошибки вершин", а также в поле "Текстурная карта".
Карты глубины предназначены для кодирования значений глубины от определенной точки ракурса до проекции объекта на плоскость или цилиндрическую поверхность. Карта глубины допускает кодирование только одного значения глубины на пиксель, что ограничивает топологическую сложность кодируемой поверхности. Тем не менее для изображений лица, особенно фронтальных, такое представление является хорошей аппроксимацией. В меньшей степени карта глубины подходит для кодирования информации о глубине в отсутствие фронтального положения. Кроме того, данные карты глубины (в отличие от данных карты точек) в большей степени подвергаются обработке (сглаживанию, изменению шага дискретизации, интерполяции и т.д.).
Карта точек в большей степени подходит для обмена и хранения необработанных данных трехмерного изображения, полученных от биометрического 3D сканера лица. Сохранение данных в их первичной форме может привести к увеличению объема хранимых данных.
Данные вершин определяют трехмерные точки с непостоянным шагом дискретизации, что обычно приводит к разреженному кодированию. Ввиду того, что выборка точек вершин является вариативной, полученный результат может иметь форму либо очень компактных представлений, либо очень точных представлений при использовании большого числа вершин.
Поле "Тип трехмерного представления" (см. 5.10.5) определяет формат данных трехмерного изображения, который применялся в фактической записи.
5.11.2 Поле "Разрядность карты глубины"
Поле "Разрядность карты глубины" (1 байт) определяет число бит, используемых для представления каждого пикселя карты глубины (таблица 33). Это поле предусмотрено для быстрого и простого доступа к данной информации, поскольку разрядность глубины можно также получить из заголовка записи PNG.
Коды поля "Разрядность карты глубины"
5.11.3 Поле "Карта глубины"
Поле "Карта глубины" содержит данные глубины в двухмерном формате. Карта глубины должна храниться в формате PNG (ИСО/МЭК 15948). Формат PNG обеспечивает сжатие без потерь как для 8-битных, так и для 16-битных изображений в градациях серого. Разрядность данных в PNG изображении записывается в заголовок PNG и указывается в поле "Разрядность карты глубины" (см. 5.11.2). Разрядность карты глубины (8 бит или 16 бит) должна быть определена из заголовка PNG записи.
Размер поля "Карта глубины" является переменным, поскольку зависит от алгоритма сжатия. Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины. Эти значения указаны в заголовке PNG записи.
Значения пикселя 0xFF в случае 8-битного кодирования и 0xFFFF в случае 16-битного кодирования изображения указывают на отсутствие данных о глубине.
5.11.4 Поля "Ширина карты точек" и "Высота карты точек"
Поля определяют ширину и высоту карты точек, в которой хранятся данные трехмерного изображения. Оба поля (2 байта) могут иметь значения в диапазоне от 0 до 65535.
5.11.5 Поле "Карта точек"
Карта точек предназначена для записи исходных данных, полученных с биометрического 3D сканера лица. Карта представляет собой трехканальное изображение, сжатое без потерь в формате PNG, с 16-битным кодированием каждого канала. Первый канал содержит значения X, второй - Y, а третий - Z координат точек. Значение (X, Y, Z) = (0xFFFF, 0xFFFF, 0xFFFF) означает недействительную трехмерную точку.
Координаты определяются в произвольной прямоугольной системе координат. Информация о связности точек явным образом не сохраняется. Для действительных значений координаты соседних пикселей соответствуют соседним точкам на поверхности лица.
5.11.6 Блок "Данные вершин"
Блок "Данные вершин" переменной длины содержит блок "Координаты вершин", необязательный блок "Нормали вершин", необязательный блок "Ошибки вершин" и необязательный блок "Текстуры вершин". Каждый из указанных блоков содержит наборы значений характеристик вершин. Число вершин определено в поле "Число вершин" (2 байта).
Положение каждой вершины определяется X координатой, Y координатой и Z координатой в соответствии с 2-байтными полями "Координата X вершины", "Координата Y вершины" и "Координата Z вершины" соответственно. Значения определяют местоположение с фиксированной точностью в соответствии с 11.3.2.
Если флаг нормали равен 0x01, то соответствующий вектор нормали каждой вершины должен быть определен в 2-байтовых полях "Нормаль X", "Нормаль Y", "Нормаль Z" (таблица 34).
Необязательное поле "Ошибка вершины" (1 байт) содержит дополнительную информацию о вершине в соответствии с описанием в таблице 35. Если в поле "Вспомогательные данные трехмерного изображения" задано наличие карты ошибок, то поле "Ошибка вершины" должно быть определено для каждой вершины.
Необязательные поля "Текстурная координата X" и "Текстурная координата Y" определяют соответствующие X и Y позиции пикселя на текстурной карте. При этом значение (0,0) соответствует верхнему левому углу. Если в поле "Вспомогательные данные трехмерного изображения" определено наличие текстурной карты, то текстурные координаты X и Y должны быть определены для каждой вершины.
Число треугольных граней определяется в соответствующем поле "Число треугольных граней" (4 байта).
Данные вершин позволяют определять дополнительные нормали для вершин. Наличие нормалей определяется значением в поле "Флаг нормали" размером 1 байт (таблица 34).
5.11.7 Поле "Данные треугольных граней"
Поле "Данные треугольных граней" переменной длины содержит список параметров треугольных граней. Число треугольных граней задается в поле "Число треугольных граней" (см. 5.11.6). Каждая треугольная грань задается тремя 2-байтовыми индексами вершин в списке данных вершин, образующих треугольную грань. Для определения внешней стороны треугольной грани порядок расположения индексов вершин должен соответствовать движению против часовой стрелки.
5.11.8 Поле "Карта ошибок"
Необязательное поле "Карта ошибок" содержит информацию о способе обработки данных трехмерного изображения до его записи в форме трехмерного представления. Карта ошибок кодируется в формате PNG как 8-битное изображение в градациях серого. Размер карты (в байтах) является переменным, поскольку зависит от эффективности алгоритма сжатия изображения.
Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины, если они связаны с картой глубины, либо размеры, равные произведению ширины карты точек на высоту карты точек, если они связаны с картой точек.
Значения пикселя t в диапазоне от 0 до 199 зарезервированы ПК37 для будущего использования. Значение t, равное 200, определяет корректное значение глубины. Значения t, равные 201 и более, определяют потенциальный или исправленный дефект данных трехмерного изображения или соответствующего изображения текстуры (таблица 35).
Более полная информация об использовании значений в пикселях для данных вершин приведена в 5.11.6.
5.11.9 Поле "Текстурная карта"
Необязательное поле "Текстурная карта" должно использоваться только для хранения текстурных данных, которые получены с помощью биометрического 3D сканера лица во время получения трехмерного изображения, и поэтому могут отличаться по своей геометрии от стандартных двухмерных изображений лица, сохраненных в блоке "Данные изображения" в той же записи.
Формат текстурной карты указывается в поле "Тип текстурной карты". Карта может быть представлена как 8-битное или 16-битное изображение в градациях серого, либо как 24-битное цветное изображение. Размер карты (в байтах) является переменным, поскольку зависит от эффективности алгоритма сжатия изображения.
Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины, если они связаны с картой глубины, либо размеры, равные произведению ширины карты точек на высоту карты точек, если они связаны с картой точек. Несжатые данные имеют переменные размеры, если они связаны с данными вершин.
6 Основной тип изображения лица
6.1 Требования наследования для основного типа изображения лица
Основной тип изображения лица является базовым для всех типов изображения лица. Все остальные типы изображения лица должны соответствовать требованиям, установленным в настоящем разделе. Схема наследования типов изображения лица представлена на рисунке 10.
6.2 Требования к кодированию данных изображения для основного типа изображения лица
Для кодирования всех типов двухмерных изображений необходимо использовать один из следующих форматов:
1) формат JPEG (ИСО/МЭК 10918-1), кодируемый в формате файла JFIF (формат файла JPEG);
2) формат JPEG-2000 (ИСО/МЭК 15444-1) с потерями или без потерь, кодируемый в формате файла JP2 (формат файла JPEG2000);
3) формат PNG (ИСО/МЭК 15948). Данный формат не может быть использован в режиме чересстрочной развертки и для изображений, которые ранее были сжаты в формате JPEG.
6.3 Требования к сжатию данных изображения для основного типа изображения лица
Возможность сжатия данных изображения обеспечивается всеми допускаемыми методами кодирования. Нормативные требования к сжатию для основного типа изображения лица не установлены. Рекомендуемые требования к сжатию приведены в приложении B.
6.4 Требования к формату записи данных для основного типа изображения лица
6.4.1 Требования к блоку "Общий заголовок"
В блоке "Общий заголовок" должны быть определены следующие поля: "Идентификатор формата", "Номер версии", "Длина записи", "Число представлений", "Сертификационный флаг" и " семантика" <*>.
<*> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - вместо блока "Общий заголовок" указан блок "Заголовок записи изображения лица", а также пропущены поля "Сертификационный флаг" и " семантика".
6.4.2 Требования к блоку "Информация о лице"
В блоке "Информация о лице" должно быть определено поле "Число контрольных точек" <**>.
<**> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - указано лишнее поле "Длина представления".
6.4.3 Требования к блоку "Информация об изображении"
В блоке "Информация об изображении" полю "Тип изображения лица" должно быть присвоено значение 0x00.
В блоке "Информация об изображении" должны быть определены следующие поля: "Тип данных изображения", "Горизонтальный размер изображения" и "Вертикальный размер изображения".
7 Фронтальный тип изображения лица
7.1 Требования наследования для фронтального типа изображения лица
Фронтальный тип изображения лица является наследуемым от основного типа изображения лица и поэтому должен соответствовать всем требованиям 6.1 - 6.3, 6.4.1 и 6.4.2. Фронтальный тип изображения лица является формальным типом изображения лица, предназначенным для описания общих свойств полного фронтального и условного фронтального типов изображения лица. Поэтому фронтальный тип изображения лица должен быть либо полным фронтальным, либо условным фронтальным (см. 5.7.2).
7.2 Требования к условиям получения фронтального типа изображения лица
7.2.1 Общие положения
В данном подразделе установлены требования к условиям получения фронтального типа изображения лица, включающего полный фронтальный и условный фронтальный типы изображения лица. Данный подраздел следует рассматривать совместно с B.2.
7.2.2 Требования к положению головы
Качество работы автоматических систем распознавания лица зависит от положения головы. Поворот и наклон головы должны быть не более 5° от фронтального положения (см. 5.5.9). Для изображений с отклонением головы в плоскости камеры системами автоматического распознавания лица может проводиться постобработка. Поэтому отклонение головы должно быть не более 8° (см. 5.5.9). На рисунке 13 представлен пример отклонения головы +/- 8°.
Рисунок 13 - Пример отклонения головы +/- 8°
Примечание - В настоящем стандарте не определяется явным образом нулевое значение наклона головы.
Данное ограничение накладывается на положение головы субъекта для всех приложений, использующих данный формат.
7.2.3 Требования к выражению лица
Качество работы автоматических систем распознавания лица зависит от выражения лица. Рекомендуется следующая классификация выражений лиц:
a) нейтральное (без улыбки), оба глаза нормально (не широко) открыты, рот закрыт;
b) улыбка с закрытым ртом (губы сомкнуты), когда не видны внутренняя часть рта и/или зубы;
c) улыбка с открытым ртом, когда видны внутренняя часть рта и/или зубы;
e) взгляд не в направлении камеры;
Рекомендуемые требования, основанные на приведенной классификации, приведены в B.2.4.
7.2.4 Требования к помощи в позиционировании лица
Изображение лица фронтального типа не должно содержать изображение другого лица, попавшего в кадр. Рекомендуемые требования приведены в B.2.
7.2.5 Требования к положению плеч
Плечи должны быть "обращены" к камере. Не допускается "портретный стиль" фотографий, когда человек смотрит через плечо.
7.2.6 Требования к фону
При создании фронтальных типов изображения лица требования к фону не предъявляются. Рекомендуемые требования приведены в B.2.9.
7.2.7 Требования к освещению
Лицо должно быть равномерно освещено. Не допускается наличия преимущественного направления освещения (см. 7.2.8, B.2.6). Отношение между средними интенсивностями квадратных областей вокруг контрольных точек 5.3 и 5.4 с размером сторон, равным 20% расстояния между центрами глаз, должно быть между 0,5 и 2,0.
7.2.8 Требования к бликам изображения
На изображении лица не допускается наличие "ярких пятен" (бликов). Данные артефакты обычно возникают, если для освещения используется один высокоинтенсивный направленный источник. Необходимо использовать диффузное освещение, несколько сбалансированных источников или другие методы освещения.
Примечание 1 - Разработчики должны ознакомиться с приложениями B и C настоящего стандарта.
Примечание 2 - Единичный "точечный" источник освещения не должен использоваться для получения изображения. Освещение также может быть организовано с использованием других методов, соответствующих требованиям данного пункта.
7.2.9 Требования к фотографированию в очках
Очки должны иметь чистые и прозрачные стекла, чтобы зрачки глаз и радужные оболочки были четко видны. Наличие очков с темными стеклами или солнечных очков допускается только по медицинским показаниям, во всех остальных случаях фотографирование должно проводиться без очков. При наличии темных очков в структуре заголовка должен быть установлен указатель темных очков.
Оправа очков не должна закрывать глаза. Оправа очков не должна быть толще 5% расстояния между контрольными точками 12.1 и 12.2 (центры правого и левого глаза), представленными на рисунке 8.
Примечание - Дополнительная информация по данной теме представлена в B.2.6.
7.2.10 Требования к ношению головного убора
При наличии головного убора должен быть установлен соответствующий флаг.
7.2.11 Требования к видимости зрачков и радужной оболочки глаз
В случае, когда зрачки или радужная оболочка глаз не видны, должен быть установлен соответствующий флаг.
7.2.12 Требования к артефактам освещения
Не допускается наличие световых артефактов или отражения вспышки от очков. Изображения со световыми артефактами, закрывающими какую-либо часть глаза, не должны быть представлены. Данное требование применимо к любому участку в многоугольнике между контрольными точками 3.8, 3.2, 3.12 и 3.4 для правого глаза и между контрольными точками 3.11, 3.1, 3.7 и 3.3 для левого глаза, представленными на рисунке 7.
7.2.13 Требования к повязке на глазах
Наличие повязки на глазе допускается только по медицинским показаниям, во всех остальных случаях фотографирование должно проводиться без повязки. В случае наличия повязки в структуре заголовка должен быть установлен указатель правой или левой повязки.
7.3 Требования к фотографированию для фронтального типа изображения лица
7.3.1 Общие положения
В данном подразделе установлены требования к фотографированию лица для получения изображений фронтального типа, включающего полный фронтальный и условный фронтальный типы изображения. Данный подраздел устанавливает требования к получаемым изображениям, а не к оборудованию и системе освещения. Требования данного подраздела распространяются на методы фотографирования на пленку и к цифровой фотографии и должны рассматриваться совместно с B.2.
7.3.2 Требования к контрасту и насыщенности
На изображении должна быть четко видна текстура кожи в каждой области лица. При этом на лице не должно быть областей с насыщением (недостаточной или слишком большой экспозицией).
7.3.3 Требования к фокусировке и глубине резкости
Все точки полученного изображения лица должны быть в фокусе (от носа до ушей и от подбородка до макушки). Требование к резкости заднего плана изображения не предъявляют.
Примечание - Как принято в фотографической практике для получения изображения оптимального качества, диафрагменное число оптической системы должно быть не менее чем на два значения ниже, чем максимальное диафрагменное число, обеспечивающее достаточную глубину резкости.
При съемке должна обеспечиваться глубина резкости, достаточная для разрешения деталей лица, размером по крайней мере 2 мм.
Более подробная информация, касающаяся глубины резкости, приведена в C.2.1.1.
7.3.4 Требования к воспроизведению исходных цветов объекта на изображении
Не допускается использование неестественного освещения: желтого, красного и т.д. Необходимо осуществлять корректировку баланса белого. Освещение не должно искажать естественный цвет кожи при рассмотрении в естественных условиях. Не допускается эффект "красных глаз", т.е. простое появление эффекта "красных глаз" на фотографиях из-за фотовспышки, находившейся очень близко к линзам. Радужная оболочка глаз и цвет радужной оболочки глаз должны быть отчетливо различимы.
Примечание - Рекомендации по данному вопросу приведены в приложении B.
7.3.5 Требования к редактированию цветного или черно-белого изображения
Не допускается редактирование цветного или черно-белого изображения с целью улучшения внешнего вида изображенного лица или его художественной обработки. На изображении должны быть достоверно отражены все оттенки спектра. Зубы и белки глаз должны быть отчетливо светлыми или белыми (если это соответствует действительности), темные волосы или особенности лица должны быть темными (если это соответствует действительности).
7.3.6 Требования к бочкообразной дисторсии
Наличие бочкообразной дисторсии, связанной с широкоугольными объективами, не должно приводить к кажущемуся увеличению носа на изображении лица.
Примечание - Допускается наличие небольших искажений на портретном изображении, если они не могут быть замечены при визуальном анализе. Рекомендуемые требования приведены в B.2.
7.4 Требования к параметрам цифрового изображения для фронтального типа изображения лица
Данный подраздел содержит нормативные требования к параметрам цифровых изображений для фронтального типа изображения лица, включающего полный фронтальный и условный фронтальный типы изображений лица.
7.4.1 Требования к геометрическим параметрам
7.4.1.1 Отношение размеров пикселя
Цифровые камеры и сканеры, используемые для получения изображений лица, должны обеспечивать отношение сторон пикселя в изображении один к одному (1:1). Следовательно, число пикселей на дюйм в вертикальном направлении должно совпадать с числом пикселей на дюйм в горизонтальном направлении.
7.4.1.2 Начало отсчета
За начало отсчета системы координат, т.е. точку с координатами 0, 0, принят левый верхний угол изображения. Положительным направлениям соответствуют направления слева направо (первая координата) и сверху вниз (вторая координата).
7.4.2 Требования к цветовому профилю
7.4.2.1 Цветовое пространство
Цвета пикселей изображений фронтального типа должны быть представлены в одном из следующих форматов:
a) 24-битное цветовое пространство RGB, в котором на каждый пиксель приходится по 8 битов на каждый компонент цвета: красный, зеленый и синий;
b) 8-битное монохромное цветовое пространство, в котором на каждый пиксель приходится 8 битов значения яркости;
c) YUV422 цветовое пространство, в котором для задания яркости используется число битов, в 2 раза большее, чем для каждой из двух координат цветности. Изображения, представленные в YUV422, обычно содержат два 8-битных параметра для величины Y и по одному 8-битному параметру для величин U и V в каждой четверке байтов.
Примечание - Для достижения аппаратной независимости значения координат RGB, полученные с камеры или сканера, должны быть преобразованы в значения в стандартном цветовом пространстве RGB, например sRGB [19], с использованием цветового профиля и методов управления цветом устройства. Информация об управлении цветом устройств может быть получена с сайта Международного консорциума по цвету www.color.org.
7.4.3 Требования к чересстрочной развертке
Не допускается использование телевизионных полукадров для фронтального типа изображения лица. Чересстрочная развертка не может быть компенсирована и не должна использоваться.
7.4.4 Требования к использованию камер, работающих в ближнем инфракрасном излучении
Не допускается использование камер, работающих в ближнем инфракрасном излучении, для получения фронтального типа изображений.
7.5 Требования к формату записи данных для получения фронтального типа изображения лица
7.5.1 Требования наследования
Требования к формату, наследуемые от основного типа изображения лица, должны быть определены в соответствии с 6.4. Кроме того, должны быть определены следующие требования.
7.5.2 Требования к блоку "Информация об изображении"
Изображения лица фронтального типа являются изображениями полного или условного фронтальных типов, поэтому значение поля "Тип изображения лица" должно быть установлено в соответствии с 8.5.2 или 9.3.2.
8 Полный фронтальный тип изображения лица
8.1 Требования наследования для полного фронтального типа изображения лица
Полный фронтальный тип изображения лица является подтипом фронтального типа изображения лица и должен соответствовать всем требованиям разделов 6 и 7.
8.2 Требования к условиям получения полного фронтального типа изображения лица
Полный фронтальный тип изображения лица является подтипом фронтального типа изображения лица и должен соответствовать всем требованиям разделов 6 и 7.
8.3 Требования к фотографированию для полного фронтального типа изображения лица
8.3.1 Общие положения
В данном подразделе установлен минимальный набор требований к соотношениям размеров лица и всего изображения, что обеспечивает нахождение всей головы и контура плеч в поле изображения. Требования данного подраздела могут быть выполнены для изображений с горизонтальной и вертикальной ориентациями кадра. Портретное изображение с контуром головы и нанесенными размерами A, B, BB, CC и DD, которые рассмотрены далее, показано на рисунке 14. Видимым должно быть изображение головы от подбородка до макушки (см. 8.3.5) и по всему горизонтальному размеру (см. 8.3.4).
Рисунок 14 - Геометрические характеристики изображения лица полного фронтального типа
Дополнительные требования к размерам изображения головы, установленные для проездных документов, приведены в B.3.2.
Примечание - Для цифровых изображений должны выполняться нормативные требования к минимальному расстоянию между центрами глаз (см. 8.4.1) и требования к минимальному размеру головы. В приложении B более подробно рассмотрен вопрос о связи между частотой пространственной дискретизации и требованиями данного подраздела.
8.3.2 Требования к положению головы по горизонтали
Серединные по горизонтали точки рта и переносицы должны лежать на воображаемой вертикали AA, совпадающей с осью симметрии лица. Воображаемая линия BB определяется как линия, проходящая через центр правого и левого глаз. Точка пересечения линии AA и линии BB - центр изображения лица (точка M). Значение координаты X точки M должно находиться между 45 и 55% горизонтального размера изображения.
8.3.3 Требования к положению головы по вертикали
Значение координаты Y точки M должно находиться между 30 и 50% вертикального размера изображения. Допускается исключение для детей моложе 11 лет. В этом случае предельное верхнее значение составляет 60% (т.е. точка центра головы находится ниже на изображениях детей моложе 11 лет).
Примечание - Начало отчета системы координат - верхний левый угол изображения.
8.3.4 Требования к горизонтальному размеру головы на изображении
Горизонтальный размер головы определяют как расстояние между двумя воображаемыми вертикальными линиями, проходящими через верхнюю и нижнюю доли уха в месте прилегания ушной раковины к голове. Горизонтальный размер головы обозначен CC на рисунке 14.
Для гарантии того, что изображение будет полностью включать лицо, горизонтальный размер головы CC должен находиться в диапазоне от 50 до 75% горизонтального размера изображения (A).
8.3.5 Требования к вертикальному размеру головы на изображении
Вертикальный размер головы DD определяют как расстояние по вертикали AA между основанием подбородка и макушкой согласно рисунку 14. Макушка головы является верхушкой головы, волосы не учитываются.
Для гарантии того, что изображение будет полностью включать лицо, вертикальный размер головы DD должен находиться в диапазоне от 60 до 90% вертикального размера изображения B. Допускается исключение для детей моложе 11 лет, в этом случае предельное нижнее значение составляет 50%.
8.3.6 Обобщенные требования к фотографированию
В таблице 36 сведены требования к фотографированию для изображений лица полного фронтального типа, установленные в 8.3.1 - 8.3.5.
Обобщенные требования к фотографированию для изображений лица полного фронтального типа
<*> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - вместо 8.3.5 указан 8.3.6.
На рисунке 15 представлен пример стандартного изображения для паспорта. Внешний прямоугольник представляет максимальные размеры головы, определенные в соответствии с требованиями 8.3.4 и 8.3.5. Внутренний прямоугольник показывает минимальные размеры головы, рассчитанные исходя из размеров изображения.
Рисунок 15 - Пример изображения с минимальными и максимальными размерами головы, рассчитанными по размерам изображения
8.4 Требования к параметрам цифрового изображения лица полного фронтального типа
8.4.1 Требования к разрешению изображения
Разрешение изображений полного фронтального типа должно быть не менее 180 пикселей на горизонтальный размер головы, что соответствует расстоянию между центрами глаз приблизительно 90 пикселей. Рекомендуемые требования приведены в приложении B.
8.4.2 Требования к постобработке
Для получения полного фронтального типа изображения лица из исходного изображения не могут применяться методы постобработки, за исключением поворота в плоскости, кадрирования, уменьшения разрешения или сжатия.
8.5 Требования к формату записи данных для полного фронтального типа изображения лица
8.5.1 Требования наследования
Требования к формату, наследуемые от основного типа изображения лица, устанавливаются в 6.4 и 8.5.2.
8.5.2 Требования к блоку "Информация об изображении"
Полю "Тип изображения лица" должно быть присвоено значение 1.
9 Условный фронтальный тип изображения лица
9.1 Требования наследования для условного фронтального типа изображения лица
Условный фронтальный тип изображения лица является подтипом фронтального типа изображения лица и должен соответствовать всем требованиям разделов 6 и 7.
9.2. Требования к параметрам цифрового изображения лица условного фронтального типа
9.2.1 Общие положения
Изображение лица условного фронтального типа используется для хранения информации о лице, полученной от любого источника изображения. Условный фронтальный тип изображения лица наследует свойства фронтального типа изображения лица.
Изображение условного фронтального типа может быть создано с любым разрешением с использованием положений точек центров глаз, координаты которых задают относительно левого верхнего угла изображения. Цель использования условного фронтального типа изображения лица состоит в достижении заранее определенного положения глаз на изображении и определении минимальной области изображения вокруг глаз. Использование условного фронтального типа изображения лица позволяет уменьшить объем хранимых данных для изображений лица при сохранении необходимой информации для автоматического распознавания лица.
9.2.2 Требования к положению глаз
Для создания изображения лица условного фронтального типа необходимо определить положения центров глазных впадин (положения глаз), соответствующих контрольным точкам 12.1 и 12.2.
Для определения положений глаз допускается использовать:
1) автоматический анализ изображения;
3) автоматический и визуальный анализ.
9.2.3 Требования к геометрическим параметрам изображения лица условного фронтального типа
Геометрические размеры изображения лица условного фронтального типа и координаты положения глаз должны соответствовать требованиям, указанным в таблице 37. Преобразование значений в целочисленные типы осуществляют согласно 5.2.3.
Геометрические параметры условного фронтального типа изображения лица
Пример геометрических параметров изображения приведен на рисунке 16.
Рисунок 16 - Геометрические параметры условного фронтального типа изображения лица (a) и пример изображения лица условного фронтального типа с минимально допустимым горизонтальным размером W = 240 (b)
9.2.4 Требования к минимальному горизонтальному размеру изображения лица условного фронтального типа
Минимально допустимый горизонтальный размер изображения должен быть равен 240 пикселям. При этом вертикальный размер изображения будет равен 320 пикселям, координата глаз Y - 144 пикселям, координата X первого глаза - 90 пикселям, координата X второго глаза - 149 пикселям. Расстояние между центрами глаз (включая граничные пиксели) должно быть равно 60 пикселям. Пример изображения приведен на рисунке 16.
За начало координат 0,0 принят левый верхний угол изображения, все размеры указаны в пикселях.
9.2.5 Требования к заполнению
Все области пикселей с неопределенными значениями должны быть заполнены каким-либо одним цветом. Рекомендуемые требования приведены в B.4.2.
9.2.6 Требования к постобработке
Для получения условного фронтального типа изображения лица из исходного изображения не могут применяться методы постобработки, за исключением поворота в плоскости, кадрирования, уменьшения разрешения или сжатия.
9.3 Требования к формату записи данных условного фронтального типа изображения лица
9.3.1 Требования наследования
Требования к формату, наследуемые от основного типа изображения лица, установлены в 6.4 и 9.3.2.
9.3.2 Требования к блоку "Информация об изображении"
Полю "Тип изображения лица" в блоке "Информация об изображении" должно быть присвоено значение 0x02.
10 Обработанный фронтальный тип изображения лица
10.1 Общие положения
С использованием цифровой постобработки исходных изображений можно создать изображение, более подходящее для автоматического распознавания лица. Обработанный фронтальный тип изображения лица предназначен для поддержки обмена изображениями, модифицированными для данной цели.
10.2 Требования наследования для обработанного фронтального типа изображения лица
Обработанный фронтальный тип изображения лица является подтипом фронтального типа изображения лица и должен соответствовать всем требованиям разделов 6 и 7.
10.3 Требования к формату записи данных для обработанного фронтального типа изображения лица
10.3.1 Требования наследования
Требования к формату, наследуемые от основного типа изображения лица, должны быть определены в соответствии с 6.4. Кроме того, должны быть определены следующие требования.
10.3.2 Требования к ссылкам на блоки
Подсистемы биометрического сравнения могут быть очень чувствительными к артефактам, возникшим при обработке исходного изображения (например, полного фронтального, условного фронтального или основного типа изображения). Должно быть обеспечено хранение исходного изображения дополнительно к обработанному. Таким образом, если получатель записи обмена, содержащей обработанные данные, имеет более современную технологию постобработки, то он может использовать исходные данные.
Для кодирования взаимосвязи между различными изображениями должно быть использовано поле "Перекрестная ссылка", которое не должно быть нулевым. Допустимо многочисленное перекрестное обращение к одному исходному изображению.
10.3.3 Требования к информации об изображении
Поле "Тип изображения лица" в информации об изображении должно быть определено со значением 0x03.
10.3.4 Постобработка
Значение битового поля "Постобработка" должно быть больше 0.
11 Основной трехмерный тип изображения лица
11.1 Требования наследования для основного трехмерного типа изображения лица
Основной трехмерный тип изображения - это базовый класс всех трехмерных типов изображения лица. Все трехмерные типы изображения лица должны удовлетворять требованиям настоящего раздела.
Основной трехмерный тип изображения наследует все требования основного типа изображения лица.
Все обязательные (не являющиеся дополнительными) поля блока "Информация о трехмерном изображении" должны быть определены. При этом некоторые обязательные поля могут оставаться неопределенными, если было задано соответствующее значение. См. определение отдельных полей для получения более подробной информации.
11.2 Требования к основному трехмерному типу изображения лица с использованием карты точек
11.2.1 Требования к типу системы координат
Значение поля "Тип системы координат" для основного трехмерного типа изображения с использованием карты точек должно равняться 0x00, т.е. должна использоваться прямоугольная система координат.
11.2.2 Требования к масштабированию и смещению
Для основного трехмерного типа изображения с использованием карты точек используются фиксированные значения масштабирования и смещения. Предусмотрено использование следующих значений:
Масштаб X = Масштаб Y = Масштаб Z = 0,02 мм;
Смещение X = Смещение Y = Смещение Z = -655,34 мм.
11.3 Требования к основному трехмерному типу изображения лица с использованием вершин
11.3.1 Требования к типу системы координат
Значение поля "Тип системы координат" для основного трехмерного типа изображения с использованием вершин должно равняться 0x00, т.е. должна использоваться прямоугольная система координат.
11.3.2 Требования к масштабированию и смещению
Для основного трехмерного типа изображения с использованием вершин используются фиксированные значения масштабирования и смещения. Предусмотрено использование следующих значений:
Масштаб X = Масштаб Y = Масштаб Z = 0,02 мм;
Смещение X = Смещение Y = Смещение Z = -655,34 мм.
12 Полный фронтальный трехмерный тип изображения лица
Полный фронтальный трехмерный тип изображения лица должен отвечать следующим требованиям.
12.1 Требования наследования
Полный фронтальный трехмерный тип изображения лица наследует требования основного трехмерного типа изображения, указанные в 11.1. Кроме того, он наследует все требования полного фронтального типа изображения.
12.2 Требования к типу системы координат
Значение поля "Тип системы координат" для полного фронтального трехмерного типа изображения должно равняться 0x00, т.е. должна использоваться прямоугольная система координат. Началом отсчета системы координат является нос, т.е. контрольная точка prn в соответствии с определением в таблице 15.
12.3 Требования к положению головы в трехмерном представлении
Поворот и наклон головы должны быть не более 5° от фронтального положения (см. 5.5.9.1 и 5.5.9.2). Для изображений с отклонением головы в плоскости камеры системами автоматического распознавания лица может проводиться постобработка. Поэтому отклонение головы должно быть не более 8° (см. 5.5.9.3). Указанные ограничения относятся ко всем приложениям, использующим настоящий формат.
12.4 Требования к калибровке точности текстурной проекции
Калибровка точности устройства получения изображения должна быть настолько высокой, чтобы среднее значение рассогласования между текстурой полного фронтального двухмерного изображения и данными трехмерного изображения после проекции с использованием матрицы текстурной проекции составляло менее 1 мм.
Примечание - Данное значение не является показателем точности, полученной при движении устройства или объекта. Показателем наблюдаемого эффекта является синхронность получения двухмерного и трехмерного изображений (см. 5.10.10).
12.5 Требования к полному фронтальному трехмерному типу изображения лица с использованием карты глубины
12.5.1 Требования к масштабированию
Разрешение сохраненных данных глубины в значительной степени зависит от значения Масштаба Z. В целях сохранения качества установлено его максимальное значение, равное 1 мм для полного фронтального трехмерного типа изображения.
По этой же причине установлены максимальные значения Масштаб X и Масштаб Y, равные 1 мм для полного фронтального трехмерного типа изображения в прямоугольной системе координат.
Следует отметить, что Масштаб X и Масштаб Y описывают частоту дискретизации, а не частоту физических измерений датчика.
12.5.2 Требования к охвату лица
Данные трехмерного изображения должны охватывать минимальные прямоугольные размеры [-1,75 w; 1,75 w] [-1,75 w; 2,55 w] ("внешнюю область") в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.5.
На рисунке 17 показан пример двухмерного изображения с выделенной внешней областью.
Рисунок 17 - Пример двухмерного изображения с минимальным охватом лица ("внешняя область")
12.5.3 Требования к недействительным точкам в трехмерном изображении
Не более 50% пикселей на карте глубины в области, определенной в 12.5.2, могут иметь нулевое значение, указывающее на недействительное значение глубины. Во "внутренней области", определенной как [-1,5 w; 1,5 w] [-1,8 w; 1,8 w] в прямоугольной системе координат, не более 20% пикселей могут иметь нулевое значение, указывающее на недействительное значение глубины. Начало отсчета - в контрольной точке prn, w - расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.5.
На рисунке 18 показан пример двухмерного изображения с выделенной внутренней областью.
Рисунок 18 - Пример двухмерного изображения с выделенной внутренней областью
12.6 Требования к полному фронтальному трехмерному типу изображения лица с использованием карты точек
12.6.1 Требования к ширине и высоте карты точек
Разрешение карты точек находится в прямой зависимости от ее ширины и высоты. Чтобы обеспечить обмен данными трехмерного изображения высокого разрешения, минимальные размеры типов полных фронтальных трехмерных изображений с использованием карты точек должны быть равны следующим значениям:
- минимальная ширина карты точек - 140 пикселей;
- минимальная высота карты точек - 170 пикселей.
12.6.2 Требования к охвату лица
Для биометрического сравнения особенно важно, чтобы во внешней области, в соответствии с определением в 12.5.2, было достаточное число точек измерения. Для полного фронтального трехмерного типа изображения с использованием карты точек не менее 70% точек должны иметь X и Y координаты со значениями -1,75 w <= X <= 1,75 w и -1,75 w <= Y <= 2,55 w в прямоугольной системе координат. Начало отсчета - в контрольной точке prn, w - расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.5.
12.7 Требования к полному фронтальному трехмерному типу изображения лица с использованием вершин
12.7.1 Требования к охвату лица
Для биометрического сравнения особенно важно, чтобы во внутренней области, определенной в соответствии с определением в 12.5.3, было достаточное число точек измерения. Для полного фронтального трехмерного типа изображений с использованием вершин не менее 1000 точек должны иметь X и Y координаты со значениями -1,5 w <= X <= 1,5 w и -1,8 w <= Y <= 1,8 w в прямоугольной системе координат. Начало отсчета - в контрольной точке prn, w - расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.5. Наряду с этим должна быть как минимум одна вершина на квадратный сантиметр, спроецированная на плоскость внутренней области с покрытием 80% внутренней области.
13 Условный фронтальный трехмерный тип изображения лица
Условный фронтальный трехмерный тип изображения лица должен отвечать следующим требованиям.
13.1 Требования наследования
Условный фронтальный трехмерный тип изображения лица наследует все требования, установленные для основного типа изображения лица, и требования для полного фронтального трехмерного типа изображения лица в соответствии с 12.2 - 12.4. Кроме того, он наследует все требования условного фронтального типа изображения.
13.2 Требования к условному фронтальному трехмерному типу изображения с использованием карты глубины
Условный фронтальный трехмерный тип изображения лица с использованием карты глубины наследует все требования полного фронтального трехмерного изображения с использованием карты глубины в соответствии с 12.5.
13.3 Требования к условному фронтальному трехмерному типу изображения с использованием карты точек
Условный фронтальный трехмерный тип изображения лица с использованием карты точек наследует все требования полного фронтального трехмерного изображения с использованием карты точек в соответствии с 12.6.
13.4 Требования к условному фронтальному трехмерному типу изображения с использованием вершин
Условный фронтальный трехмерный тип изображения лица с использованием вершин наследует все требования полного фронтального трехмерного изображения с использованием вершин в соответствии с 12.7.
14 Идентификатор типа зарегистрированного формата
Запись в таблице 38 сделана регистрационным органом ЕСФОБД (ИСО/МЭК 19785-2) для идентичности формату записи изображения лица.
Владельцем формата является ИСО/МЭК СТК1/ПК37, зарегистрированный идентификатор владельца формата - 257 (0x0101).
(в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)
(Измененная редакция, Изм. A1:2014).
РЕКОМЕНДАЦИИ ДЛЯ ТИПОВ ИЗОБРАЖЕНИЯ ЛИЦА
B.1 Рекомендации для основного типа изображения лица
B.1.1 Общие положения
В данном разделе приведены требования, не вошедшие в число нормативных требований настоящего стандарта, но рекомендуемые для достижения заявленных целей при создании записи изображения лица. Данный раздел необходимо рассматривать совместно с разделом 6 настоящего стандарта.
B.1.2 Определение контрольной точки
Блок "Контрольная точка", определенный в 5.6, может быть добавлен в формат записи как для основного типа изображения лица, так и для всех его подтипов с целью описания положения контрольных точек, используемых в алгоритмах распознавания лица.
Контрольные точки по возможности должны быть определены на изображениях до применения процедур сжатия.
Контрольные точки могут быть включены в запись, только если их параметры точно определены. В соответствии с этим параметры контрольных точек не должны переопределяться в процессе обработки изображения при распознавании лица.
Обычно автоматический метод или точно определяет положение контрольной точки, или дает абсолютно неверный результат. Это выражается в очевидно ошибочных координатах или в том, что контрольная точка не может быть обнаружена. Поэтому для точного определения параметров контрольной точки необходимо использовать автоматизированный метод, сопровождаемый визуальным контролем, с возможным внесением исправлений в результаты автоматического определения контрольной точки.
B.1.3 Рекомендуемые контрольные точки
Чтобы обеспечить корректное получение изображения лица для различных областей применения, необходимо не менее трех контрольных точек лица. Для повышения точности должно быть определено большее число контрольных точек, которые должны быть распределены по поверхности всего лица. Рекомендуется сохранять в любой записи лица следующие контрольные точки (см. рисунок 7 и рисунок 8): контрольные точки центров глаз (12.1 и 12.2), основные контрольные точки носа (9.4; 9.5 и 9.15) и контрольные точки верхней губы рта (8.4; 8.1 и 8.3).
B.2 Рекомендации для фронтального типа изображения лица
B.2.1 Общие положения
В данном разделе приведены требования, не вошедшие в число нормативных требований настоящего стандарта, но рекомендуемые для достижения заявленных целей при создании записи изображения лица. Данный раздел необходимо рассматривать совместно с разделом 7.
B.2.2 Требования к помощи при позиционировании лица
Кисти рук, руки и другие части тела ассистента, помогающего фиксировать правильное положение головы, не должны быть видны.
B.2.3 Требования к положению головы
Отклонение от фронтального положения головы должно быть не более 5° в направлениях поворота, наклона и отклонения (см. 5.5.9).
B.2.4 Требования к выражению лица
Выражение лица должно быть нейтральным (без улыбки), оба глаза нормально открыты (т.е. не широко), рот закрыт (если расстояние между контрольными точками 2.2 и 2.3 меньше, чем расстояние между контрольными точками 2.3 и 8.2, на рисунке 7). Рекомендуется максимальное соответствие изображений данному требованию.
a) улыбка с закрытым ртом (с сомкнутыми губами);
d) взгляд не в направлении камеры;
B.2.5 Примеры недопустимых выражений лица
a. Закрытые глаза. Глаза считаются открытыми, если радужная оболочка и зрачок отчетливо различимы.
b. Волосы, закрывающие глаза. Волосы не должны закрывать контрольные точки 3.2, 3.8 и 3.12 для правого глаза и контрольные точки 3.1, 3.7 и 3.11 для левого глаза (рисунок 7), а также область выше данных точек, размер которой составляет 5% от расстояния между центрами глаз. Пример недопустимого изображения представлен на рисунке B.1.
Рисунок B.1 - Пример недопустимого изображения (волосы закрывают глаза)
c. Оправа очков, закрывающая часть глаза. Оправа очков не должна закрывать контрольные точки 3.2, 3.4, 3.8 и 3.12 для правого глаза и контрольные точки 3.1, 3.3, 3.7 и 3.11 для левого глаза (рисунок 7), а также область вокруг данных точек, размер которой составляет 5% расстояния между центрами глаз. Если оправа очков не видна или полностью прозрачна, то данная оправа не может закрывать какую-либо часть глаза. Пример недопустимого изображения представлен на рисунке B.2.
Рисунок B.2 - Пример недопустимого изображения (оправа очков закрывает часть глаза)
B.2.6 Требования к очкам
Если человек носит очки, то при фотографировании он должен находиться в очках.
Если очки затемняются автоматически при освещении, то фотографироваться необходимо без затемнения очков, с использованием прямого освещения или фонового света. Если затемнение не может быть устранено, то очки должны быть сняты. Если затемненные очки надеты, то в структуре заголовка должно быть указано, что используются очки с затемнением.
Артефакты освещения могут быть исключены путем увеличения угла между осветителем, субъектом и камерой до 45° (или более).
B.2.7 Требования к головным уборам
На фотографиях должны отсутствовать головные уборы и тени, за исключением случаев, когда человек не может отказаться от головного убора, вуали или шарфа (например, из-за религии). В таких случаях необходимо минимизировать тени и затемнения характерных черт области лица. Для этого можно изменять положение головных уборов.
B.2.8 Требования к отсутствию теней в глазах
Должны отсутствовать тени от бровей на глазах. Радужная оболочка глаза и зрачок должны быть видимыми.
B.2.9 Требования к фону
Поскольку первым шагом в процессе автоматического распознавания лица является обнаружение лица на фоне для дальнейшей расстановки контрольных точек, необходимо установить требования к фону. Рекомендуется соблюдать следующие требования.
B.2.9.1 Требования к контрастности фона
Граница между головой и фоном должна быть четко прослеживаема вокруг всего человека (исключение составляет очень большой объем волос).
B.2.9.2 Требования к теням на фоне
Не должно быть теней, видимых на заднем плане изображения лица.
B.2.9.3 Требования к однородности фона
Фон должен быть однородным и не должен содержать текстуры с прямыми или кривыми линиями, которые могут внести искажения в результаты автоматического обнаружения лица. Фон должен иметь однородную цветовую палитру или быть одноцветным, с последовательным изменением яркости от светлой к темной только в одном направлении.
B.2.9.4 Примеры фона
Типичным фоном, позволяющим улучшить результаты автоматического распознавания лица, является 18%-ный серый фон с однородной гладкой поверхностью. Допускается использование однородных светло окрашенных фонов, например светло-голубого. Допускается использование белого фона, если обеспечивается достаточное различие областей лица, волос и фона.
B.2.10 Требования к фокусировке и глубине резкости
Как принято в фотографической практике, для получения изображения оптимального качества диафрагменное число оптической системы должно быть выбрано не менее чем на два значения ниже, чем максимальное диафрагменное число, обеспечивающее достаточную глубину резкости.
Если отдельные штрихи миллиметровых линеек, приложенных к носу и уху человека и обращенных к камере, могут одновременно различаться на зарегистрированном тестовом изображении, то считается, что обеспечено разрешение деталей лица размером менее 1 мм.
Если у камеры отсутствует автофокусировка, то при съемке субъект должен находиться на определенном расстоянии от камеры.
B.2.11 Требования к плотности градаций серого
Динамический диапазон изображения должен иметь не менее 7 бит изменения интенсивности (диапазон, состоящий минимум из 128 уникальных значений) в области лица на изображении. Область лица определяется как область от макушки до подбородка и от левого уха до правого уха. Для данного требования может потребоваться индивидуальная настройка установок камеры, устройства оцифровки видеоизображения или сканера, если тон кожи слишком светлый или темный по сравнению со средним значением по популяции.
B.2.12 Требования к цветовой насыщенности
Цветовая насыщенность 24-битового цветного изображения должна быть такой же, как и после преобразования к градациям серого, т.е. 7 битов изменения интенсивности в области лица на изображении.
B.2.13 Требования к воспроизведению исходных цветов объекта на изображении
При получении черно-белой фотографии должны использоваться обычные лампы накаливания. При получении цветной фотографии должны использоваться методы установки цветового баланса. Например, могут быть использованы вспышка с высокой цветовой температурой и обычная пленка или сбалансированная для съемки при искусственном освещении пленка и источник освещения, представляющий лампу накаливания.
B.2.14 Требования к цветовой калибровке
Рекомендуется проведение цветовой калибровки с использованием 18%-ного серого фона или другого метода (например, установка баланса белого).
B.2.15 Требования к бочкообразной дисторсии
Данное требование направлено на обеспечение постоянства бочкообразной дисторсии, зависящей от фокусного расстояния. Для типичной фотографической системы, когда субъект находится на расстоянии 1,5 - 2,5 м от камеры, фокусное расстояние объектива камеры должно быть таким, как у среднего фотографического объектива. Для фотографирования на 35-миллиметровой пленке это означает, что фокусное расстояние должно составлять от 90 до 130 мм. Для других форматов негативов/датчиков рекомендованное фокусное расстояние должно составлять от двух до трех диагоналей негатива/датчика.
На рисунке B.3 представлены примеры влияния расстояния до субъекта и выбора объектива камеры на захваченное изображение.
Рисунок B.3 - Примеры правильного (a) и неправильного (b, c) фокусного расстояния до субъекта
B.3 Рекомендации для полного фронтального типа изображения лица
B.3.1 Требования к параметрам цифровых изображений лица полного фронтального типа
B.3.1.1 Требования к разрешению фотографии
Настоящий раздел устанавливает требования к выбору установок для сканера в случае, когда получение изображения лица проводится путем сканирования существующей печатной фотографии.
Разрешение изображений полного фронтального типа должно составлять не менее 240 пикселей на горизонтальный размер головы (что соответствует расстоянию между центрами глаз приблизительно 120 пикселей). Данное требование обеспечивает возможность проведения оптимальной визуальной экспертизы и долговременного хранения изображения. Данное требование соответствует минимальному горизонтальному размеру всего изображения 420 пикселей и вертикальному размеру изображения 525 пикселей.
1) Для фотографии с горизонтальным размером головы 20 мм (примерно 0,78 дюймов) рекомендованное разрешение сканера - 120 точек на сантиметр (примерно 300 dpi).
2) Для фотографии с горизонтальным размером головы 13 мм (примерно 0,5 дюймов) рекомендованное разрешение сканера - 189 точек на сантиметр (примерно 480 dpi).
3) Для фотографии с вертикальным размером головы (от подбородка до макушки) 25 мм (примерно 1 дюйм) средний горизонтальный размер головы составляет примерно 20 мм (примерно 0,8 дюймов) с учетом характерного геометрического отношения 4 к 5. Это соответствует требуемому разрешению сканера 117 точек на сантиметр (примерно 300 dpi).
Таким образом, при проведении цветного сканирования бумажной фотографии соответствующих размеров с использованием сканера разрешение цветного сканера должно составлять 300 dpi.
Если бумажные фотографии были отсканированы при разрешении 120 пикселей на сантиметр (300 dpi), то требование минимального расстояния между центрами глаз 90 пикселей соответствует расстоянию примерно 8 мм между глазами. Аналогично, для фотографий, отсканированных при разрешении 120 пикселей на сантиметр (300 dpi), требование минимального расстояния между центрами глаз 120 пикселей соответствует расстоянию примерно 10 мм между глазами.
B.3.1.2 Требования к постобработке
Не допускается использование многократного (т.е. повторяющегося) сжатия при создании изображений полного фронтального типа.
B.3.2 Требования к использованию изображений лица полного фронтального типа для проездных документов
B.3.2.1 Требования к полю "Рост человека"
Поле "Рост человека" должно быть определено в соответствии с требованиями 5.5.6.
B.3.2.2 Требования к отношению горизонтального и вертикального размеров изображения
Для изображения лица полного фронтального типа отношение горизонтальный размер изображения : вертикальный размер изображения должно составлять от 1:1,25 до 1:1,34.
Данное требование допускает использование отношений: 1:1,25, установленного в рекомендациях Национального института стандартов и технологий США (NIST) для фотоснимков лица; 1:1,28, как правило, используемого для паспортных изображений; 1:1,33, как правило, применяемого для водительских удостоверений.
B.3.2.3 Требования к размеру головы относительно размера изображения
Для изображения лица полного фронтального типа отношение горизонтальный размер изображения : горизонтальный размер головы (A:CC) должно составлять от 7:5 до 2:1. Это удовлетворяет требованиям большого числа агентств по выдаче водительских удостоверений и международных паспортов.
В случаях, когда человек имеет объемную прическу, указанное ограничение более значимо, чем требование включения полной линии контура волос на фотографии.
Для подростков и взрослых на изображении лица во фронтальном положении расстояние от макушки до подбородка должно составлять от 70 до 80% от вертикального размера изображения. Это удовлетворяет требованиям большинства агентств по выдаче водительских удостоверений и международных паспортов.
В электронном документе текст соответствует официальному источнику.
Для детей моложе 11 лет допускается меньший относительный размер головы (до 50% от области изображения), если это необходимо для повышения качества фотографического изображения, например устранения искажений типа бочкообразной дисторсии (см. 7.36) или размытия границ.
B.3.2.4 Обобщенные рекомендации к фотографированию
Для удобства в таблице B.1 перечислены требования к геометрическим параметрам и положению головы, рассмотренные в B.2.3 и B.3.2.2, B.3.2.3.
Обобщенные рекомендации к фотографированию для полных фронтальных типов изображений лица для проездных документов
Примеры изображений и указаний при фотографировании для проездных документов представлены на рисунке B.4.
Примечание - Рисунок B.4 подготовлен при содействии организации, требующей от фотографов руководствоваться стандартизированными процедурами получения изображений. Слово "должны" употребляется на рисунке как руководство подобных организаций и не устанавливает нормативные требования.
Рисунок B.4, лист 1 - Рекомендации для создания проездных документов
Рисунок B.4, лист 2 - Рекомендации для создания проездных документов
Рисунок B.4, лист 3 - Рекомендации для создания проездных документов
B.3.3 Требования к сжатию изображения лица полного фронтального типа
B.3.3.1 Требования к сжатию без выделения области интереса
Результаты распознавания лица для сжатых изображений полного фронтального типа показаны на рисунках B.5 и B.6. Изображения лиц были получены с австралийских паспортов в австралийском Департаменте иностранных дел и торговли. Было рассмотрено 1000 пар сопоставления (оригинал и реконструкция) реальных изображений с паспорта.
Сжатие изображений лица полного фронтального типа
Рисунок B.5 - Технология Identix: зависимость результатов распознавания лица от степени сжатия изображений полного фронтального типа
Сжатие изображений лица полного фронтального типа
Рисунок B.6 - Технология ZN Vision Technologies: зависимость результатов распознавания лица от степени сжатия изображений полного фронтального типа
Данные изображения были первоначально отсканированы с разрешением 300 dpi и имели стандартные геометрические характеристики паспортной фотографии с горизонтальным и вертикальным размерами изображения 416x536 пикселей и размерами головы, соответствующими разделу 9. Средний размер исходных несжатых изображений составлял приблизительно 669 Кб. Изображения, используемые в данном тесте, были сжаты с использованием формата JPEG до среднего размера 71 Кб, затем восстановлены и повторно сжаты с использованием форматов JPEG и JPEG2000 для проведения теста на парное сопоставление.
Первоначальное сжатие могло привести к появлению на используемых изображениях артефактов формата JPEG. Но было показано, что относительно низкое отношение сжатия 10:1 незначительно влияет на выходные данные, используемые для парного сопоставления.
Для данного анализа использовались технологии регистрации лица и распознавания лица Facelt (версия 5.0) компании Identix Corporation и ZN-FaceRacServer (версия 1.1) компании ZN Vision Technologies AG. Изображения были центрированы автоматически (местоположение глаз было определено компьютерной системой).
Набор изображений лица был сжат и попарно сопоставлен с набором несжатых изображений. Вероятность правильного совпадения первого ранга исследовалась как функция степени сжатия. Частота правильного совпадения первого ранга характеризуется числом раз, когда ближайшее найденное изображение соответствует правильному результату при поиске "один ко многим" (при условии, что всегда возможно правильное совпадение). Она является функцией размера базы данных и обычно используется в контексте идентификации по лицу "один ко многим".
На рисунках B.5 и B.6 термин "Вероятность правильного совпадения" обозначает число правильно распознанных пар при соответствующей степени сжатия (размере файла), разделенное на число правильно распознанных пар при нулевом сжатии и затем умноженное на 100. Т.е. 100% означает, что процесс сжатия не оказывает никакого воздействия на показатели технологии распознавания. 50% означает, что только 50% пар при сопоставлении "один ко многим" из 1000 пар правильно распознаны при соответствующей степени сжатия. "Средний размер файла" - это размер сжатого файла.
Основной задачей данного исследования являлась оценка степени возможного сжатия изображения лица без существенного снижения вероятности правильного совпадения (на 1 - 2%) по сравнению с результатами, достигаемыми без сжатия.
Графики на рисунках B.5 и B.6 показывают:
1) вероятность правильного совпадения быстро снижается с уменьшением размера сжатого файла, если он составляет менее 10 Кб;
2) использование формата JPEG2000 обеспечивает лучшие результаты, чем формат JPEG.
B.3.3.2 Рекомендации для максимального сжатия и размеров файла изображений лица форматов JPEG и JPEG2000
При подготовке рекомендаций существенное снижение вероятности правильного совпадения было определено как превышающее 2%. Таким образом, данные рекомендации определяют минимальные размеры файла и соответствующие степени сжатия, обеспечивающие не более чем 2%-ное снижение вероятности правильного совпадения при сжатии изображений по сравнению с результатами, получаемыми без сжатия (или с очень незначительным сжатием). Результаты округлены до 1 Кб.
Для использования двух представленных технологий автоматической идентификации по лицу (поиск "один ко многим") размер сжатого файла изображения должен быть в среднем не менее 11 Кб для изображений лица полного фронтального типа, подобных использованным в эксперименте (изображения для паспорта).
Примечание - Сжатие файлов до размера менее 11 Кб может влиять на процесс автоматического распознавания лица. При визуальном анализе параметры сжатия должны быть сведены к минимуму, особенно при проведении судебной экспертизы.
B.3.4 Требования к сжатию изображения лица полного фронтального типа с выделением области интереса
B.3.4.1 Общие положения
Изображение лица полного фронтального или условного фронтального типа может быть подвергнуто дополнительному сжатию в случаях, когда точно установлено местоположение глаз при помощи надежного алгоритма определения местоположения глаз или с помощью визуального контроля положения глаз.
Формат JPEG2000 может быть использован для осуществления сжатия по "области интереса" (ROI-области), поскольку данная технология определена в стандарте ИСО для формата JPEG2000 и в программных библиотеках для JPEG2000.
Сжатие ROI-области в соответствии со спецификацией формата JPEG2000 может быть использовано для получения файлов меньших размеров. Внутренняя область изображения лица, используемая в процессе сопоставления, может быть сжата в меньшей степени, в то время как внешняя область - в большей степени. Полученный файл имеет меньший размер, области изображения, используемые в процессе сопоставления, сохраняют высокое качество, а другие области изображения остаются полезными для визуального анализа. Стандартный декодер JPEG2000 с поддержкой сжатия по ROI-области декодирует изображение с ROI-областями независимо от их местоположения на изображении.
Не рекомендуется использовать сжатие по области интереса в случае, когда автоматическое центрирование изображения лица выполняется без визуального контроля.
B.3.4.2 Внутренние и внешние области изображения лица полного фронтального типа
Сжатие изображения может быть выполнено с учетом внутренних и внешних областей, определенных относительно области лица.
Пример - При использовании изображения полного фронтального типа с разрешением 300 dpi внутренняя область может быть определена как область, полностью содержащая лицо (от макушки до подбородка и от левого уха до правого уха).
Приведенные выше результаты анализа показывают, что степень сжатия 60:1 с использованием формата JPEG2000 сохраняет высокую вероятность правильного совпадения.
Если для внутренней области использовать отношение сжатия 50:1, то для внешней области может использоваться отношение 200:1, при котором сохраняется качество изображения, достаточное для визуального анализа. Например, цветное изображение на рисунке B.7 (формат JPEG2000, разрешение 300 dpi, размер 35x45 мм, 413x531 пикселей, 658 Кб без сжатия) с внутренней областью 240x320 пикселей (230,4 Кб без сжатия) имеет размеры:
a) внешней области (658 - 230,4 Кб)/200 = 2,14 Кб (степень сжатия 200:1);
b) внутренней области (230,4 Кб)/50 = 4,61 Кб (степень сжатия 50:1).
Полный размер файла составляет 2,14 + 4,61 = 6,75 Кб. Уменьшение размера файла по сравнению с файлом, сжатым со степенью 60:1 без выделения области интереса, составляет примерно 40%.
На рисунке B.7 слева показано несжатое изображение с выделенной границей внутренней области, справа - сжатое с использованием технологии JPEG2000-ROI.
Рисунок B.7 - Пример изображения несжатого (a) и сжатого (b) изображения с использованием области интереса, показанной на (a)
B.4 Рекомендации для условного фронтального типа изображения лица
B.4.1 Требования к размерам изображения лица условного типа
Как указано в разделе 9, горизонтальный размер изображения условного типа определяет геометрические параметры лица с использованием контрольных точек положения глаз. Минимальный горизонтальный размер изображения составляет 240 пикселей, что соответствует расстоянию между центрами глаз 60 пикселей, включая граничные пиксели. Максимальное значение не регламентируется.
Интерполяция, требуемая для выполнения аффинных преобразований, используемых при создании изображения условного типа, может привести к возникновению артефактов, которые могут негативно повлиять на процесс распознавания лица. Например, к этому может привести ситуация, когда одна компания выбрала для использования расстояние между центрами глаз 70 пикселей, а другая - 60 пикселей. Поэтому для обеспечения совместимости изображений условного типа рекомендуется использовать горизонтальный размер изображения, кратный 240. Примеры показаны в таблице B.2.
Рекомендованные значения горизонтальных размеров (в пикселях) изображений лица условного типа
B.4.2 Требования к созданию изображения лица условного типа
На рисунке B.8 представлен пример последовательного преобразования изображения лица к изображению условного типа. В процессе создания изображения условного типа с горизонтальным размером 240 пикселей исходное изображение (a) вращается так, чтобы выровнять положение глаз по горизонтали (b). Далее изображение масштабируется таким образом, чтобы расстояние между центрами глаз составило точно 60 пикселей (c). Наконец, изображение форматируется и кадрируется (d) так, чтобы координаты первого глаза стали равны (89, 144), т.е. 89 пикселей по горизонтали и 144 пикселя по вертикали, при отсчете от верхнего левого угла изображения, имеющего координаты (0,0). Черным пикселям, заполняющим поля изображения, может быть присвоено любое значение цвета, но рекомендуется, чтобы он совпадал с цветом пикселей, лежащих на границе исходного изображения (e).
Рисунок B.8 - Аффинное преобразование и кадрирование
B.4.3 Рекомендации для параметров цифровых изображений лица условного типа
Рекомендуемым методом для определения местоположения глаз является использование автоматического метода с дополнительным визуальным контролем полученных результатов.
Допускается заполнение области пикселей с неопределенными значениями любым цветом.
На этапах аффинных преобразований масштабирования и поворота рекомендуется использовать билинейную или другую интерполяцию более высокого порядка, а также метод дискретных представлений.
B.4.3.1 Требования к постобработке
Не допускается использование многократного (т.е. повторяющегося) сжатия при создании цифровых изображений лица условного фронтального типа.
B.4.4 Требования к сжатию изображения лица условного типа
B.4.4.1 Требования к сжатию без выделения области интереса
Распознавание лица было проведено при помощи двух технологий. Изображения лиц были получены с австралийских паспортов в австралийском Департаменте иностранных дел и торговли. Было рассмотрено 1000 пар сопоставления (оригинал и реконструкция) реальных изображений с паспорта.
Подробное описание экспериментов описано в B.3.3. Для изображений лица условного типа был повторен тот же эксперимент, что и для изображений лица полного фронтального типа. Результаты экспериментов для технологий Identix и ZN Version Technologies представлены на рисунках B.9 и B.10 соответственно.
Сжатие изображений лица условного типа
Рисунок B.9 - Технология Identix: зависимость результатов распознавания лица от степени сжатия изображений условного типа
Сжатие изображений лица условного типа
Рисунок B.10 - Технология ZN Vision Technologies:
зависимость результатов распознавания лица от степени сжатия изображений условного типа
Графики на рисунках B.9 и B.10 показывают:
1) вероятность правильного совпадения быстро снижается с уменьшением размера сжатого файла менее 8 Кб;
2) использование формата JPEG2000 обеспечивает лучшие результаты по сравнению с форматом JPEG.
B.4.4.2 Рекомендации для максимального сжатия и размеров файла изображений лица условного типа форматов JPEG и JPEG2000
При подготовке рекомендаций существенное снижение вероятности правильного совпадения было определено как превышающее 2%. Таким образом, данные рекомендации определяют минимальные размеры файла и соответствующие степени сжатия, обеспечивающие не более чем 2%-ное снижение вероятности правильного совпадения, при сжатии изображений по сравнению с результатами, получаемыми без сжатия (или с очень незначительным сжатием). Результаты округлены до 1 Кб.
Для использования двух представленных технологий автоматической идентификации по лицу (поиск "один ко многим") размер сжатого файла изображения лица условного типа должен быть в среднем не менее 9 Кб в формате JPEG или JPEG2000.
B.4.5 Требования к сжатию изображения лица условного типа с выделением области интереса
B.4.5.1 Общие положения
Изображение лица полного фронтального или условного фронтального типа может быть подвергнуто дополнительному сжатию в случаях, когда точно установлено местоположение глаз при помощи проверенного алгоритма определения местоположения глаз или с помощью визуального контроля положения глаз.
Формат JPEG2000 может быть использован для осуществления сжатия по "области интереса" (ROI-области), поскольку данная технология определена в стандарте ИСО для формата JPEG2000 и в программных библиотеках для JPEG2000.
Сжатие ROI-области в соответствии со спецификацией формата JPEG2000 может быть использовано для получения файлов меньших размеров. Внутренняя область изображения лица, используемая в процессе сопоставления, может быть сжата в меньшей степени, чем внешняя область изображения. Полученный файл имеет меньший размер; области изображения, используемые в процессе сопоставления, сохраняют высокое качество, а другие области изображения остаются полезными для визуального анализа. Стандартный декодер JPEG2000 с поддержкой сжатия по ROI-области декодирует изображение с ROI-областями независимо от их местоположения на изображении.
Не рекомендуется использовать сжатие по области интереса в случае, когда автоматическое центрирование изображения лица выполняется без визуального контроля.
B.4.6 Внутренние и внешние области для сжатия изображения лица условного типа
Для изображения лица условного типа с горизонтальным размером 240 пикселей внутренняя область определяется прямоугольной областью с координатами вершин (24, 24), (215, 24), (24, 263) и (215, 263), включая граничные пиксели, как показано на рисунке B.11. Размер этой области составляет 192x240 пикселей.
Рисунок B.11 - Рекомендуемая область интереса для изображений лица условного типа
На рисунке B.11 показаны размеры внутренней области при горизонтальном размере изображения W = 240. В общем случае координаты вершин, задающие внутреннюю область, равны: (0,1 * W,0,1 * W), (0,9 * W - 1,0,1 * W), (0,1 * W,1,1 * W - 1) и (0,9 * W - 1,1,1 * W - 1).
Внешняя область соответствует всему изображению с исключенной внутренней областью и имеет размер 240 x 320 - 192 x 240 = 30720 пикселей, или (75 - 45) x 3 Кб = 90 Кб в байтах для 3 байтов на пиксель.
Взаимосвязь между степенью сжатия изображений лица условного типа с использованием области интереса и вероятностью правильного сопоставления не определялась.
B.5 Рекомендации для полного фронтального трехмерного типа изображения лица
Помимо требований раздела 12 для полного фронтального трехмерного типа изображения лица рекомендуется выполнять следующие требования.
B.5.1 Рекомендации для двухмерной части изображения лица полного фронтального трехмерного типа
Необходимо следовать рекомендациям для полного фронтального типа изображения лица.
B.5.2 Замечания по совместимости
Существует большое число реализаций, соответствующих основному стандарту. Для областей применения, где важна совместимость, рекомендуется записывать двухмерную часть изображения лица полного фронтального трехмерного типа в качестве полного фронтального изображения в той же записи изображения лица. Это обеспечивает безопасное считывание записи полного фронтального изображения, т.е. функциональную совместимость.
B.5.3 Требования к положению головы для полного фронтального трехмерного изображения
Угол отклонения головы должен быть не более 5° (см. 5.5.9.3).
B.5.4 Требования к синхронности получения двухмерного и трехмерного изображений
Поле "Синхронность получения двухмерного и трехмерного изображений" должно быть определено и не может быть заполнено значением 0xFFFF (не определено).
B.5.5 Требования к продолжительности получения трехмерного изображения
Поле "Продолжительность получения трехмерного изображения" должно быть определено и не может быть заполнено значением 0xFFFF (не определено).
B.5.6 Рекомендации для полного фронтального трехмерного типа изображения с использованием карты глубины
B.5.6.1 Требования к масштабированию
Разрешение записанных данных глубины в значительной степени зависит от Масштаб Z. Для обеспечения качества для полного фронтального трехмерного типа изображения должно быть установлено максимальное значение Масштаб Z, равное 0,8 мм.
По этой же причине установлены максимальные значения Масштаба X и Масштаба Y, равные 0,8 мм, для полного фронтального трехмерного типа изображения с использованием карты глубины в прямоугольной системе координат.
B.5.6.2 Требования к недействительным точкам карты глубины
Не более 20% пикселей карты глубины в области, определенной в 12.5 <*>, могут иметь нулевое значение, определяющее недействительное значение глубины. Кроме того, во "внутренней области", определенной как [-1,5 w; 1,5 w] x [-1,8 w; 1,8 w] в прямоугольной системе координат не более 10% пикселей могут иметь нулевое значение, определяющее недействительное значение глубины. Начало отсчета - в контрольной точке prn, w - расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.5.
<*> В оригинале стандарта ИСО/МЭК 19794-5:2011 допущена ошибка - вместо 12.5 указан 11.5.
B.5.7 Рекомендации для полного фронтального трехмерного типа изображения с использованием карты точек
B.5.7.1 Требования к ширине и высоте карты точек
Минимальные размеры карты точек должны составлять:
- минимальная ширина карты точек - 175 пикселей;
- минимальная высота карты точек - 213 пикселей.
B.5.7.2 Требования к охвату лица
Не менее 90% точек должны иметь X и Y координаты соответственно со значениями -1,75 w <= X <= 1,75 w и -1,75 w <= Y <= 2,55 w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.5.
B.5.8 Рекомендации для полного фронтального трехмерного типа изображения с использованием вершин
B.5.8.1 Требования к охвату лица
Не менее 1500 точек должны иметь X и Y координаты соответственно со значениями -1,5 w <= X <= 1,5 w и -1,8 w <= Y <= 1,8 w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.5.
90% площади внутренней области должно удовлетворять условию: на каждый 1 см2 плоскости внутреннего региона приходится минимум одна спроецированная точка.
B.6 Рекомендации для условного фронтального трехмерного типа изображения лица
Помимо требований раздела 13 для условного фронтального трехмерного типа изображения лица рекомендуется выполнять следующие требования.
B.6.1 Рекомендации для двухмерного изображения лица условного фронтального трехмерного типа
Необходимо следовать рекомендациям для условного фронтального типа изображения лица.
B.6.2 Замечания по совместимости
Существует большое число реализаций, соответствующих основному стандарту. Для областей применения, где важна совместимость, рекомендуется записывать двухмерную часть изображения лица условного фронтального трехмерного типа в качестве условного фронтального изображения в той же записи изображения лица. Это обеспечивает безопасное считывание записи условного фронтального изображения, т.е. функциональную совместимость.
B.6.3 Требования к положению головы в трехмерном представлении
Угол отклонения головы должен быть не более 5° (см. 5.5.9.3).
B.6.4 Требования к синхронности получения двухмерного и трехмерного изображений
Поле "Синхронность получения двухмерного и трехмерного изображений" должно быть определено и не может быть заполнено значением 0xFFFF (не определено).
B.6.5 Требования к продолжительности получения трехмерного изображения
Поле "Продолжительность получения трехмерного изображения" должно быть определено и не может быть заполнено значением 0xFFFF (не определено).
B.6.6 Рекомендации для условного фронтального трехмерного типа изображения с использованием карты глубины
Необходимо следовать рекомендациям, приведенным в B.5.6.
B.6.7 Рекомендации для условного фронтального трехмерного типа изображения с использованием карты точек
Необходимо следовать рекомендациям, приведенным в B.5.7.
B.6.8 Рекомендации для условного фронтального трехмерного типа изображения с использованием вершин
Необходимо следовать рекомендациям, приведенным в B.5.8.
B.7 Краткое изложение обязательных требований и рекомендаций для трехмерных типов изображений
B.7.1 Нормативные система координат и требования к положению головы для основного трехмерного типа изображения
B.7.2 Нормативные система координат и требования к положению головы для полного фронтального трехмерного типа изображения
B.7.3 Нормативные система координат и требования к положению головы для условного фронтального трехмерного типа изображения
B.7.4 Рекомендуемые система координат и требования к положению головы для полного фронтального трехмерного типа изображения
B.7.5 Рекомендуемые система координат и требования к положению головы для условного фронтального трехмерного типа изображения
УСЛОВИЯ РЕГИСТРАЦИИ ИЗОБРАЖЕНИЙ ЛИЦА
C.1 Область применения
Настоящее приложение устанавливает экспертные рекомендации для фотографирования лиц для визуального или автоматического распознавания лица. Эти рекомендации предназначены для использования в фотолабораториях, фотокабинах, в пунктах регистрации и т.д., изготавливающих или использующих отпечатанные или цифровые изображения лиц, соответствующие настоящему стандарту. Настоящее приложение предназначено для конструкторов и операторов фотокабин, разработчиков программного обеспечения, разработчиков стандартов на профили программных приложений, а также для других целей.
На работу систем распознавания лица влияет большое число факторов, включающих характеристики внешнего вида человека (особенности лица, прическа и украшения) и условия получения изображения (поле обзора камеры, фокус, глубина резкости, фон и освещение). Условия регистрации изображения являются контролируемыми параметрами и оказывают большее влияние на точность распознавания лица, чем характеристики внешнего вида.
В данном приложении установлены рекомендации для регистрации двухмерных изображений лица при помощи фото- или видеокамеры - аналоговой или цифровой (далее - камера), цифрового сканирования отпечатанной фотографии. Регистрация трехмерных изображений лица в данном приложении не рассматривается.
C.2 Рекомендации для регистрации изображений лица
В данном разделе установлены рекомендации для регистрации изображений лица в фотолаборатории, фотокабине, пункте регистрации и т.д., по взаиморасположению субъекта и камеры, а также варианты расположения осветительных приборов. Целью использования данного приложения является обеспечение правильного положения субъекта и равномерности освещенности его лица, чтобы получаемые изображения удовлетворяли требованиям настоящего стандарта. На изображениях лица должны отсутствовать тени и блики на коже или на очках.
C.2.1 Рекомендации для фотолаборатории
Фотолаборатория обычно представляет собой профессиональное помещение, оборудованное аналоговой или цифровой камерой, набором регулируемых осветительных приборов, соответствующим задним фоном и посадочным местом. Операторы не должны проводить постобработку изображения лица для предотвращения спорных ситуаций в зоне пограничного или таможенного контроля.
C.2.1.1 Рекомендации для взаиморасположения камеры и субъекта
В данном подпункте приведены рекомендации для взаиморасположения камеры и субъекта:
- расстояние между камерой и субъектом должно составлять от 1,2 до 2,5 м; при меньшем расстоянии возможны трудности в регулировке освещения для устранения теней;
- фокусировка проводится на расстояние до глаз человека, значение диафрагмы должно обеспечить глубину резкости не менее 10 см или равную расстоянию от носа до ушей; глубина резкости объектива зависит от его фокусного расстояния, значения диафрагмы и расстояния фокусировки.
Точечные объекты, находящиеся ближе или дальше расстояния, на котором фокусируется объектив, будут размыты, величина размытости называется "кругом нерезкости". Если максимальный диаметр круга нерезкости ограничен, например, расстоянием между смежными пикселями в датчике изображения CCD, то могут быть определены расстояния спереди Dсп и сзади Dсз от фокусной плоскости, в пределах которых изображение является приемлемо сфокусированным. Сумма этих расстояний составляет глубину резкости Dгр:
где Dсп - расстояние от фокальной плоскости до плоскости, самой ближней к камере резко отображаемой точки:
Dсп = cFs(s - f)/[f2 + cF(s - f)];
Dсз - расстояние от фокальной плоскости до плоскости, самой дальней от камеры резко отображаемой точки:
Dсп = cFs(s - f)/[f2 - cF(s - f)];
s - расстояние от объектива до лица субъекта;
F - диафрагменное число объектива, т.е. отношение фокусного расстояния объектива f к диаметру входного зрачка объектива a: F = f/a.
Перечисленные параметры представлены на рисунке C.1.
Рисунок C.1 - Параметры для вычисления глубины поля
Рекомендации для взаимного расположения камеры и субъекта представлены на рисунке C.2:
- оптимальная высота камеры находится на уровне глаз субъекта; регулировка высоты камеры должна проводиться при помощи регулируемого по высоте посадочного места или регулировки высоты штатива;
- субъект должен смотреть прямо в камеру, держать голову прямо и плечи ровно по отношению к камере; поворот головы должен осуществляться в соответствии с 7.2.2.
Рисунок C.2 - Рекомендации для взаиморасположения камеры и субъекта
C.2.1.2 Пример измерения экспозиции в различных областях лица
На рисунке C.3 показано измерение экспозиционного числа EV в четырех областях лица: на левой и правой щеках, лбу и подбородке. Для измерений экспонометр помещают у одной из указанных областей лица человека и направляют прибор в сторону камеры. Все четыре результата измерения должны отличаться друг от друга не более чем на 1 EV. При большем отличии источники освещения должны быть перемещены для достижения требований освещенности лица.
Рисунок C.3 - Расположение экспонометра при измерении экспозиции
Экспозиционное число определяет значение экспозиции при любом сочетании выдержки и диафрагмы объектива. По определению, экспозиционное число, равное 0, соответствует выдержке 1 с и диафрагменному числу 1,0 при чувствительности пленки или эквивалентного датчика изображений ИСО 100. Экспозиционное число EV определяют по следующей формуле:
EV = log2(F2/T) = 2log2(F) - log2(T),
где F - диафрагменное число объектива;
Изменение значения экспозиционного числа на 1 EV соответствует увеличению/уменьшению значения диафрагменного числа на одну ступень или увеличению/уменьшению времени экспозиции в 2 раза.
C.2.1.3 Примеры конфигурации фотолаборатории
В данном подпункте приведены три примера взаиморасположения источников освещения, субъекта и камеры для фотолабораторий, изготавливающих изображения лица для идентификации. В первом примере используются один источник освещения и отражающая панель для обеспечения равномерной освещенности. Во втором примере используются два источника освещения и отражающая панель для освещения области подбородка субъекта. Третий пример конфигурации отличается от второго наличием осветителя фона, расположенного за субъектом для устранения теней на фоне.
C.2.1.3.1 Пример 1: Правильная организация освещения при помощи одного источника освещения (рисунок C.4)
1 - камера; 2 - штатив; 3 - отражающая панель; 4 - ламповый отражатель; 5 - источник освещения; 6 - боковая отражающая панель
Рисунок C.4 - Организация освещения в фотолаборатории с использованием одного источника освещения
Источник освещения, представленный ламповым отражателем, должен быть расположен под углом около 35° выше линии между камерой и субъектом в вертикальной плоскости и направлен на лицо субъекта под углом не более 45° к линии между камерой и субъектом в горизонтальной плоскости. Боковая отражающая панель должна быть расположена с другой стороны для устранения теней на лице. Дополнительно может быть расположена еще одна отражающая панель напротив субъекта ниже уровня лица для освещения области подбородка.
C.2.1.3.2 Пример 2: Правильная организация освещения при помощи двух источников освещения (рисунок C.5)
1 - камера; 2 - штатив; 3 - отражающая панель; 4 - ламповые отражатели; 5 - основной источник освещения; 6 - фронтальный источник освещения
Рисунок C.5 - Организация освещения в фотолаборатории с использованием двух источников освещения
Источники освещения, представленные ламповыми отражателями, должны быть расположены под углом около 35° выше линии между камерой и субъектом в вертикальной плоскости и под углом не более 45° к линии между камерой и субъектом в горизонтальной плоскости. Подобная организация освещения смягчает края теней и обеспечивает равномерную освещенность лица. Дополнительно может быть расположена еще одна отражающая панель напротив субъекта ниже уровня лица для освещения области подбородка.
C.2.1.3.3 Пример 3: Правильная организация освещения при помощи двух источников освещения и осветителя фона (рисунок C.6)
1 - камера; 2 - штатив; 3 - отражающая панель; 4 - ламповые отражатели; 5 - основной источник освещения; 6 - фронтальный источник освещения; 7 - осветитель фона
Рисунок C.6 - Организация освещения в фотолаборатории с использованием двух источников освещения и осветителя фона
В набор источников освещения, представленный в примере 2, вводится осветитель фона для устранения теней на фоне за субъектом. Данный источник освещения должен быть расположен за субъектом ниже уровня его головы и направлен на фон.
C.2.2 Рекомендации для фотокабин (рисунок C.7)
Фотокабина, как правило, представляет собой устройство для получения автопортрета. В состав фотокабины входят: камера, источники освещения, посадочное место, однородный фон, устройство для печати, дисплей и иногда устройство для голосовых команд. Развитие технологий фотографирования позволило создавать малогабаритные конструкции фотокабин, что привело к их широкому распространению во всем мире. Ниже приведены принципы конструирования и эксплуатации таких фотокабин, включая планировки спереди, сбоку и сверху. В C.2.2.1 - C.2.2.4 даны варианты взаиморасположения камеры и субъекта, описаны методы контроля за положением головы и выражением лица человека.
C.2.2.1 Правильное освещение
Необходимо расположить несколько источников освещения симметрично над камерой за матовой рассеивающей панелью. Такое расположение обеспечивает равномерную освещенность лица субъекта и устраняет большую часть проблем, связанных с бликами и тенями. Осветитель фона должен быть расположен за субъектом ниже уровня его головы и посередине между фоном и субъектом.
Расположение источника фронтального освещения над камерой под углом 35° выше линии между камерой и субъектом предотвращает прямое отражение освещения от очков субъекта.
Стены внутри фотокабины должны быть белого цвета, кроме расположенной за субъектом. Белые стены являются отражателями и обеспечивают равномерную освещенность лица в горизонтальной и вертикальной плоскостях.
При регистрации изображения в фотокабине должно быть включено освещение. Это позволит предотвратить эффект красных глаз, связанный с регистрацией изображения при недостаточном освещении.
Чтобы избежать появления нежелательных теней в области подбородка, необходимо использовать прямое или рассеянное освещение, направленное снизу вверх.
Необходимо использовать непрозрачный занавес для предотвращения эффектов влияния внешнего освещения.
C.2.2.2 Пример конфигурации фотокабины
1 - посадочное место, регулируемое по высоте; 2 - рамка позиционирования лица; 3 - ламповые отражатели; 4 - внешнее освещение; 5 - источники освещения; 6 - освещение фона; 7 - камера
Рисунок C.7 - Рекомендации для взаиморасположения субъекта, камеры и источников освещения в фотокабине
C.2.2.3 Взаиморасположение субъекта и камеры
Для обеспечения правильного положения субъекта и управления его положением может быть использовано зеркало или видеоэкран.
В фотокабине для отображения изображения лица в режиме реального времени на стене напротив субъекта должно быть установлено зеркало или инвертированный слева направо видеоэкран. На зеркале или видеоэкране должна быть изображена рамка позиционирования, при помощи которой можно определить, видна ли голова полностью, необходимо ли проводить выравнивание по линии уровня глаз и по центру поля обзора камеры. Использование рамки позиционирования представлено на рисунке C.8.
Рисунок C.8 - Использование рамки позиционирования Необходимо наличие посадочного места, регулируемого по высоте.
Расстояние от камеры до субъекта должно составлять 0,7 - 1,0 м.
C.2.2.4 Корректирование размеров, выражения лица и т.д. при помощи графического интерфейса пользователя
Функция просмотра изображения дает возможность просмотра изображения лица перед печатью для контроля самим субъектом. Внутри фотокабины должны находиться иллюстрации рекомендуемых положений и выражений лица.
Для корректирования размеров лица субъекта при предварительном просмотре должен иметь возможность указать положение макушки и подбородка. После этого изображение автоматически масштабируется, и края изображения обрезаются соответствующим образом (рисунок C.9).
Рисунок C.9 - Использование перемещающихся горизонтальных линий для установки размера головы
Может использоваться программное обеспечение обнаружения лица, которое автоматически определяет область лица на изображении и проводит центрирование области лица. Необходимо обеспечить возможность ручной корректировки автоматически определенного положения при предварительном просмотре, так как при автоматической обработке существует вероятность ошибки.
C.2.3 Рекомендации для пунктов регистрации
Для удостоверяющих личность документов, особенно машиносчитываемых дорожных документов (МДД) изображения лиц предоставляются заявителями или создаются в пункте регистрации по принципу "быстрой регистрации". В данном подпункте установлены рекомендации для регистрации изображений лица в условиях пункта регистрации, где площадь помещения часто ограничена. Тем не менее качество изображений лица должно быть максимально близким к качеству изображений, получаемых в фотолабораториях и фотокабинах
C.2.3.1 Освещенность
На рисунке C.10 представлен оптимальный вариант планировки пункта регистрации: субъект и фон освещены двумя источниками рассеянного освещения. Источники освещения устанавливаются на консоли с небольшой площадью основания, что приемлемо для типичных условий пункта регистрации. Консоль может быть установлена на дверь или стену. Должно использоваться синхронизированное импульсное освещение для обеспечения высокой скорости работы затвора и избегания размытости из-за случайного движения субъекта. Необходимо устранить попадание в помещение прямых солнечных лучей, например, при помощи штор или жалюзи.
1 - консоль регистрации; 2 - камера; 3 - верхний осветитель; 4 - нижний осветитель
Рисунок C.10 - Рекомендации для взаиморасположения субъекта, камеры и источников освещения в пункте регистрации
C.2.3.2 Взаиморасположение камеры и субъекта
Контроль и управление правильным положением субъекта может проводиться в режиме реального времени при помощи обратной связи в виде дополнительного видеоэкрана, расположенного непосредственно напротив субъекта. Функция просмотра изображения дает возможность повторной регистрации изображения лица перед печатью в случае, если субъект считает, что его/ее положение или выражение лица неприемлемо.
Необходимо наличие регулируемого по высоте посадочного места с подушкой для детей.
Расстояние от камеры до субъекта должно составлять 0,5 - 1,0 м.
C.2.3.3 Контроль оператора за регистрацией изображения лица
Контроль и управление правильным положением субъекта могут осуществляться оператором при помощи видеоэкрана, отображающего лицо субъекта в течение всего процесса регистрации изображения. Функция просмотра изображения дает возможность повторной регистрации изображения лица перед печатью в случае, если оператор считает, что положение или выражение лица субъекта неприемлемо.
Оператор должен оценить качество изображения перед дальнейшей обработкой. Для этого может быть использовано программное обеспечение оценки качества изображения лица, которое автоматически проверяет соответствие изображения лица требованиям пункта регистрации или требованиям и рекомендациям настоящего стандарта. В C.5 представлена информация о таком программном обеспечении, и приведены два примера пользовательских интерфейсов.
C.3 Рекомендации для печати
При передаче изображений системе распознавания лица печать изображений (традиционным фотографическим или с использованием новых цифровых технологий) часто является этапом, ограничивающим качество изображения.
Необходимо выбрать оптимальные характеристики печати, чтобы сохранить максимальный объем информации, содержащийся в изображении.
Системы цифровой печати можно разделить на два типа: 1) изменяющие плотность или размер растровой точки на изображении, 2) изменяющие частоту расположения точек без изменения размера и плотности. Системы первого типа называются системами непрерывного тона, второго типа - полутоновыми. Приемлемы оба способа печати при условии достаточного разрешения изображений.
C.3.1 Проблема выбора между пространственным разрешением и разрешением по интенсивности
При любом способе печати существует проблема выбора между пространственным разрешением и разрешением по интенсивности, т.е. проблема выбора между сохранением четкости деталей на изображении и плавностью переходов между яркостями пикселей. Процесс печати изображения лица не должен снижать пространственное разрешение изображения или разрешение по интенсивности до такой степени, когда снижаются показатели точности и надежности системы распознавания.
Многие страны предъявляют следующие требования к изображениям лица на паспортах и визах: квадрат со стороной 50 мм, расстояние между центрами глаз - около 12 мм, вертикальный размер лица немного больше половины вертикального размера изображения. Чтобы между центрами глаз было 120 пикселей, рекомендованных в B.3, изображение лица необходимо сканировать при пространственном разрешении изображения 12 пикселей на миллиметр (300 пикселей на дюйм).
Для сохранения детализации данных при разрешении по интенсивности, равном 256 уровням, полутоновый принтер должен воспроизводить разрешение изображения 160 точек на миллиметр. Такой уровень точности требует значительных затрат, поэтому при выборе пространственного разрешения и разрешения по интенсивности нужно искать компромиссное решение.
C.3.2 Рекомендации для качества печати
В настоящем приложении не даны рекомендации по методам печати ввиду большого числа доступных способов печати. Более того, выбор типа бумаги может оказывать существенное влияние на качество изображения. В данном подразделе представлены рекомендации не по способам печати, а по внешнему виду отпечатанных изображений лица и минимально допустимому качеству цифровых изображений лица, полученных при сканировании отпечатанных изображений.
C.3.2.1 Разрешение изображения
На распечатанном изображении должны отображаться все мелкие детали лица диаметром до одного миллиметра, такие как морщины и родинки. Все цвета телесного тона, от светлого до смуглого, должны быть отчетливо различимы, не должно быть бликов или теней. Участки плавных переходов областей лица должны передаваться без резких изменений в цвете или плотности печати и подчеркивания контура.
C.3.2.2 Цветовая насыщенность
На небольших областях изображения лица могут возникать блики. Другие элементы распечатанного изображения не должны быть насыщенного белого цвета. Таким образом, участки фона и предметы одежды субъекта должны содержать детали в свете и тенях.
C.3.2.3 Эффект муара, или видимые точечные структуры
В результате оцифровки распечатанных изображений могут образовываться артефакты, например муар. Если в дальнейшем это изображение распечатывается, эффект муара может быть усилен. При сканировании с пространственным разрешением 12 пикселей на миллиметр (300 пикселей на дюйм) или менее в процессе печати не должен появляться заметный эффект муара. Если для распечатывания изображения лица был применен периодический полутоновый процесс, то в результате с высокой вероятностью появится эффект муара.
Таким образом, при печати на струйных и лазерных принтерах в режиме полутоновой печати для имитации непрерывности тона необходимо использовать непериодические (или с размытием) методы полутоновой печати. При печати не должны образовываться точечные структуры, заметные невооруженным глазом.
C.3.3 Использование шаблона изображения лица
Для оценки качества изображений лица оператор может использовать прозрачный шаблон. На шаблоне должны быть очерчены границы размера головы и поворота (наклона). При наложении его на изображение лица определяется, отвечает ли представленное изображение требованиям. Пример такого шаблона компании Citizenship and Immigration Canada с инструкцией по применению представлен в уменьшенном размере на рисунке C.11.
Рисунок C.11 - Пример фотошаблона компании Citizenship and Immigration Canada
C.4 Рекомендации по сканированию
Рекомендации по сканированию предназначены для сохранения максимального объема идентифицирующей информации на изображении лица при аналогово-цифровом преобразовании. Сохранение информации возможно при достаточном пространственном разрешении изображения и разрешении по интенсивности во всех каналах цветового пространства RGB <*>.
<*> RGB (Red, Green, Blue - красный, зеленый, синий) - цветовая модель, описывающая способ цветовоспроизведения
C.4.1 Пространственное разрешение изображения и разрешение по интенсивности
Для обычного паспортного или визового изображения лица пространственное разрешение изображения должно быть равно 12 пикселям на миллиметр (300 пикселей на дюйм) для обеспечения расстояния между центрами глаз, равного 120 пикселям. Разрешение по интенсивности должно составлять минимум 256 уровней на цвет пикселя, три цвета на пиксель.
C.4.2 Разрешающая способность
Разрешающая способность характеризует возможность различать мелкие детали на изображении. Этот показатель отличен от частоты дискретизации, хотя и взаимосвязан с ней. Часто используемым показателем разрешающей способности является функция передачи модуляции (ФПМ). Для сохранности отображения мелких деталей лица ФПМ сканера должна составлять минимум 20% при пространственной частоте 6 периодов на миллиметр. Кроме того, разрешающая способность сканера должна быть одинаковой по обеим осям и не должна увеличиваться с использованием алгоритма усиления резкости изображения или алгоритма высокочастотной фильтрации.
C.4.3 Цветовое пространство
Так как цветовое пространство RGB и его модификации по определению являются зависимыми от устройства, выходные данные сканера должны быть преобразованы в независимое от устройства цветовое пространство sRGB [19]. По стандарту Международного консорциума по цвету (МКЦ), в выходной файл изображения может быть вложен стандартный совместимый профиль цвета собственного пространства сканера.
C.4.4 Цветовая насыщенность
Для сканированного изображения лица недопустимо наличие большого числа пикселей со значениями у границ уровней квантования, т.е. на уровнях 0 или 255, если глубина цвета равна 8 битам.
C.4.5 Сжатие изображения
Для уменьшения размеров файлов сканированных изображений в сканерах (пленочных или для считывания документов) используются форматы сжатия с потерей JPEG и JPEG2000. Некоторые изготовители или разработчики программного обеспечения сканеров предусматривают возможность выбора соотношения качество изображения : степень сжатия изображения.
Выбор наиболее высокой степени сжатия приводит к потере качества изображения лица, что существенно снижает точность и надежность распознавания лица (см. B.3.3). Пользователь должен быть осведомлен обо всех возможных степенях сжатия изображения, представленных в системе сканирования, и о последствиях выбора настроек соотношения качество изображения : степень сжатия изображения.
Если нет существенных ограничений на объем файла изображения, то для обеспечения высокой точности и надежности распознавания предпочтительнее выбирать настройки, сохраняющие высокое качество изображения.
C.5 Программное обеспечение для оценки качества изображения лица
Существует несколько программных продуктов, представляющих собой комплекты разработчиков (комплекты SDK <*>) для определения: удовлетворяет ли представленное изображение лица требованиям настоящего стандарта. Для таких продуктов рассчитываются множество показателей качества изображения лица и один объединенный показатель качества. Автоматически определяется, достаточна ли степень качества представленного изображения лица.
<*> SDK (Software development kit) - комплект разработчика программного обеспечения.
Показатели качества изображения лица включают размер лица, центрирование лица, контраст, фокусировку, текстуру и равномерность фона, равномерность освещенности, вращение головы (поворот и наклон). Программное обеспечение оценки качества изображения лица является эффективным дополнением к визуальной оценке качества, проводимой в фотолабораториях, фотокабинах или пунктах регистрации. Примеры графического интерфейса пользователя (GUI <**>) для двух подобных продуктов представлены на рисунке C.12.
<**> GUI (Graphical user interface) - графический интерфейс пользователя.
Рисунок C.12 - Два примера графического интерфейса пользователя программного обеспечения оценки качества изображения лица
C.6 Таблицы рекомендаций
Основные рекомендации по условиям регистрации изображений лица, обработке полученного изображения и требованиям к качеству изображений представлены в таблицах C.1 - C.4. В данных таблицах графа "Параметр" соответствует пунктам и разделам настоящего стандарта. Аббревиатуры ФЛ (фотолаборатория) и ФК (фотокабина) с числовыми значениями указывают на пример, представленный в C.8 "Примеры фотографирования".
C.6.1 Организация обстановки
Рекомендации по организации обстановки
C.6.2 Фотографирование
Рекомендации по фотографированию
C.6.3 Обработка полученных изображений
Рекомендации по печати и сканированию
C.6.4 Качество фотографирования
Рекомендации по качеству фотографирования
C.7 Экспериментальные данные
C.7.1 Экспериментальные данные по распознаванию лица в фотолаборатории и фотокабине
Тестирование алгоритмов распознавания лица проводилось с изображениями, полученными в различных условиях, в том числе в условиях неадекватного освещения, включая верхнее освещение аэропортов, которое создают глубокие тени на лице. Эксперименты проводили в Японии при поддержке Министерства внутренних дел Японии с участием нескольких разработчиков систем распознавания лица в соответствии с требованиями ИСО/МЭК 19794-5, включая требования к субъекту (положение головы, выражение лица, очки и т.д.), к оборудованию (камера, освещение, фон и т.д.) и к иным аспектам, в четырех условиях освещения: идеальное освещение, плохое освещение аэропорта, улучшенное освещение аэропорта и освещение фотокабины.
Для тестирования было зарегистрировано 160 человек. Регистрация осуществлялась в условиях, описанных в таблице C.5. Для паспортных фотографий соотношение сторон (горизонтальный размер : вертикальный размер) составляло 1:1,29; размеры изображений 420x540 пикселей. Данные требования установлены в Министерстве внутренних дел Японии. Полученные изображения были сжаты в среднем до 80 Кб с использованием формата JPEG. Изображения лица, полученные при различных условиях освещения, сравнивали с изображениями лица, полученными в идеальных условиях освещения, в режиме "один-ко-многим" (т.е. в режиме идентификации) с использованием нескольких алгоритмов распознавания лица. В качестве показателя для сравнения использовали интегральный коэффициент сопоставления (ИКС) с рангом идентификации 1.
При тестировании были получены следующие результаты (таблица C.6):
- по сравнению с идеальными условиями интегральный коэффициент сопоставления при плохом освещении в аэропорту существенно ниже: 40 - 80%;
- улучшение условий освещения для снижения интенсивности теней на лице (т.е. создание улучшенного освещения в аэропорту) эффективно для повышения точности распознавания лица;
- не обнаружено существенного различия при сравнении результатов тестирования при идеальном освещении и в фотокабине.
Результаты тестирования алгоритмов распознавания лица при различных условиях освещения
Примечание - Интегральный коэффициент сопоставления относится к рангу идентификации 1. Статистическая погрешность при измерении точности распознавания лица составила 3% в соответствии с B.1.1 "Правило трех" по ИСО/МЭК 19795-1.
C.8 Примеры фотографирования
В данном пункте представлены изображения лица, зарегистрированные при различных условиях фотографирования в фотолаборатории и фотокабине, для пояснения рекомендаций при выборе условий получения и настроек камеры.
C.8.1 Примеры фотографирования в фотолаборатории
a) Рекомендуемые условия фотографирования в фотолаборатории приведены в таблице C.7.
Рекомендуемые условия фотографирования в фотолаборатории
b) Примеры изображений лица, зарегистрированных в фотолаборатории, приведены в таблице C.8.
Аббревиатура [НР] обозначает "Не рекомендуется" - изображение зарегистрировано при нерекомендуемых условиях.
Примеры изображений лица, зарегистрированных в фотолаборатории
C.8.2 Примеры фотографирования в фотокабине
a) Рекомендуемые условия фотографирования в фотокабине приведены в таблице C.9.
Рекомендуемые условия фотографирования в фотокабине
b) Примеры изображений лица, зарегистрированных в фотокабине, приведены в таблице C.10.
Аббревиатура [НР] обозначает "Не рекомендуется" - изображение зарегистрировано при нерекомендуемых условиях.
Примеры изображений лица, зарегистрированных в фотокабине
ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
D.1 Экспериментальные исследования при регистрации изображений полного фронтального типа для проездных документов. Спецификации и данные, используемые для исследования
В данном приложении представлены исследования, в результате которых обоснованы допустимые отклонения в:
- расстоянии между центрами глаз;
- положении лица по горизонтали;
- положении лица по вертикали;
- отношении горизонтального размера головы к горизонтальному размеру изображения;
- отношении вертикального размера головы к вертикальному размеру изображения.
D.1.1 Спецификации и данные, используемые для исследования
Для исследования использованы параметры и допустимые отклонения, являющиеся либо:
1) строгими допустимыми отклонениями в соответствии с требованиями настоящего стандарта и рекомендаций ИКАО (Международная организация гражданской авиации) [8];
2) увеличенными допустимыми отклонениями в соответствии с требованиями рекомендаций ИКАО [9] для приложений регистрации паспортных изображений.
Данными для исследований послужила выборка паспортных фотографий граждан четырех государств, применяющих электронные паспорта в большом количестве (таблица D.1). Все указанные изображения были использованы в выданных электронных паспортах.
Базы изображений, использованные для анализа
Цель исследования - определение соответствия стандартных паспортных фотографий требованиям настоящего стандарта, в частности требованиям к:
2) числу пикселей между центрами глаз;
3) положению лица по горизонтали;
4) положению лица по вертикали;
5) отношению горизонтального размера головы к горизонтальному размеру изображения;
6) отношению вертикального размера головы к вертикальному размеру изображения.
Полученные данные по базам изображений далее сравнивали друг с другом и с допустимыми значениями, которые определены в настоящем стандарте.
D.1.2 Результаты исследований
D.1.2.1 Расстояние между центрами глаз
В соответствии с требованиями настоящего стандарта размер головы для полного фронтального изображения должен быть не менее 180 пикселей, что соответствует расстоянию между центрами глаз приблизительно 90 пикселей (см. 8.4.1).
На рисунке D.1 представлено распределение расстояний между центрами глаз для четырех исследуемых баз данных.
Рисунок D.1 - Нормированное распределение расстояния между центрами глаз на исследуемых паспортных фотографиях;
красная пунктирная линия указывает значение 90 пикселей, соответствующее минимуму для полного фронтального изображения
Практически во всех случаях выполняется требование к горизонтальному размеру головы. Среднее расстояние между центрами глаз составляет 123,4 пикселя.
D.1.2.2 Положение лица по горизонтали
В соответствии с требованиями настоящего стандарта значение координаты X (точка Mx) точки M центра лица должно находиться между 45 и 55% горизонтального размера изображения (см. 8.3.2).
На рисунке D.2 представлено распределение положения лица по горизонтали (Mx/A) для четырех исследуемых баз данных.
Рисунок D.2 - Нормированное распределение положения лица по горизонтали на исследуемых паспортных фотографиях;
красные пунктирные линии - предельные значения в настоящем стандарте
Среднее значение положения лица по горизонтали для 7 128 изображений составляет 49% горизонтального размера изображения. Требованию к положению лица по горизонтали удовлетворяет 95,4% исследуемых паспортных фотографий.
D.1.2.3 Положение лица по вертикали
В соответствии с требованиями настоящего стандарта значение координаты Y (точка My) точки M центра лица должно находиться между 30 и 50% вертикального размера изображения B (см. 8.3.3), за исключением детей моложе 11 лет. На рисунке D.3 представлено распределение (1 - My/B) для четырех исследуемых баз данных.
Рисунок D.3 - Распределение положения лица по вертикали (1 - My/B) на исследуемых паспортных фотографиях;
красные пунктирные линии - предельные значения в настоящем стандарте
Среднее значение (1 - My/B) положения лица по вертикали (положения глаз по вертикали, т.е. горизонтальной линии, проходящей через центры глаз) для 7 128 изображений составляет 56% вертикального размера изображения. Это соответствует значению координаты Y точки M (My), равному 44% вертикального размера изображения.
D.1.2.4 Отношение горизонтального размера головы к горизонтальному размеру изображения
В соответствии с требованиями настоящего стандарта для отображения лица на изображении целиком горизонтальный размер головы CC должен находиться в диапазоне 50 - 75% горизонтального размера изображения (см. 8.3.4). На рисунке D.4 представлено распределение отношения горизонтального размера головы к горизонтальному размеру изображения для четырех исследуемых баз данных.
Рисунок D.4 - Распределение отношения горизонтального размера головы к горизонтальному размеру изображения на исследуемых паспортных фотографиях;
красные пунктирные линии - предельные значения в настоящем стандарте
Среднее значение отношения горизонтального размера головы к горизонтальному размеру изображения для 7 128 изображений составляет 0,62. Для большей части изображений требование к отношению горизонтального размера головы к горизонтальному размеру изображения выполняется.
D.1.2.5 Отношение вертикального размера головы к вертикальному размеру изображения
В соответствии с требованиями настоящего стандарта для отображения лица на изображении целиком вертикальный размер головы (DD) должен находиться в диапазоне 60 - 90% вертикального размера изображения (B) (см. 8.3.5). На рисунке D.5 представлено распределение отношения вертикального размера головы к вертикальному размеру изображения для четырех исследуемых баз данных.
Рисунок D.5 - Распределение отношения вертикального размера головы к вертикальному размеру изображения на исследуемых паспортных фотографиях;
красные пунктирные линии - предельные значения в настоящем стандарте
Среднее значение отношения вертикального размера головы к вертикальному размеру изображения для 7 128 изображений составляет 0,73. Требованию к этому удовлетворяет 98,2% исследуемых паспортных фотографий.
D.1.3 Обсуждение ошибок исследования
Данное исследование основано исключительно на измерениях с автоматическим программным обеспечением контроля качества изображений (QA-SW). Так называемая проверка экспериментальными данными, т.е. анализ измеренных вручную значений, для всех исследуемых изображений не проводилась. Такая проверка проведена на ранней стадии исследования. Было обнаружено, что используемое программное обеспечение контроля качества является достаточно точным и способно представить надежные статистические данные.
Дополнительное исследование для сравнения программного обеспечения контроля качества, используемого в настоящем исследовании, с другими программными комплексами контроля качества на большом числе паспортных фотографий показало следующие отклонения QA-SW:
- расстояние между центрами глаз: +5%;
- положение лица по горизонтали: +/- 1%;
- положение лица по вертикали: +/- 1%;
- отношение горизонтального размера головы к горизонтальному размеру изображения: +/- 1%;
- отношение вертикального размера головы к вертикальному размеру изображения: +/- 1%.
Таким образом, погрешность определения параметров составляет 1%, за исключением параметра "расстояние между центрами глаз", которое может иметь немного большее значение, чем в действительности.
D.1.4 Выводы
Проведенные исследования касаются геометрических параметров лица на паспортных фотографиях, имеющих большое значение при проведении биометрического сравнения. Результаты исследований основаны на статистической оценке результатов автоматического анализа изображений, выполненного с помощью программного обеспечения контроля качества. Даже при ошибках программного обеспечения на отдельных изображениях выводы, основанные на объединении результатов по приблизительно 7 200 изображениям, являются достоверными.
Вышеприведенный анализ показал достижимость требований, установленных настоящим стандартом, при использовании современных технологий и существующих приложений. Таблица D.2 и рисунок D.6 демонстрируют результаты данного исследования. Так как использованные для исследования изображения были получены от четырех стран, где электронные паспорта выдаются в большом количестве, настоящие результаты можно считать показательными для сферы применения данного анализа.
Сводные сведения о соответствии выборки изображений требованиям настоящего стандарта
Рисунок D.6 - Соответствие исследуемых паспортных фотографий требованиям 8.3 настоящего стандарта
D.2 Экспериментальные исследования влияния расстояния между центрами глаз и положения головы (отклонения) на эффективность биометрического сравнения
D.2.1 Расстояние между центрами глаз
Расстояние между центрами глаз (т.е. пространственное разрешение изображения) является наиболее важным критерием для успешного распознавания лица. Для оценки влияния расстояния между центрами глаз при распознавании лица проведены исследования на изображениях с различным разрешением при использовании современного алгоритма сравнения лиц. На рисунке D.7 показано увеличение вероятности правильной верификации при увеличении расстояния между центрами глаз. Данные результаты применимы для оценки эффективности поиска "один-ко-многим" (ранговая статистика).
Рисунок D.7 - Зависимость вероятности правильной верификации от расстояния между центрами глаз при вероятности ложного допуска 0,1%
D.2.2 Положение головы (отклонение)
В автоматических системах распознавания лица эффективно проводится коррекция угла отклонения головы на изображении. На рисунке D.8 показана зависимость вероятности правильной верификации от угла отклонения головы.
Рисунок D.8 - Зависимость вероятности правильной верификации от угла отклонения головы при вероятности ложного допуска 0,1%
Для тестирования была использована база данных "Color Feret" (994 эталонных изображения, 736 тестовых изображений). На первом этапе все изображения (эталонные и тестовые) были повернуты таким образом, чтобы угол отклонения головы был равен нулю.
При тестировании все тестовые изображения были повернуты на плюс 5°, все эталонные изображения на минус 5°, затем наоборот. Такая же обработка выполнена для плюс 10°, минус 10°; плюс 15° и минус 15°. Таким образом, разница углов отклонения головы на эталонных и тестовых изображениях составила 0, 10, 20 и 30°. На рисунке D.9 представлены примеры изображений с различными значениями угла отклонения головы.
Рисунок D.9 - Примеры изображений с отклонением головы; углы отклонения равны 0°, +5°, -5°, +10°, -10°, +15°, -15° (слева направо)
Оценка снижения эффективности работы алгоритма при повороте изображения в плоскости проводилась относительно значения вероятности правильной верификации при вероятности ложного допуска 0,1% и угле отклонения, равном нулю, т.е. все значения вероятности правильной верификации были нормализованы по этому значению.
Тестирование включает худший сценарий, так как максимальным значением разницы углов отклонения, при котором соблюдается требование настоящего стандарта, является +/- 10°. Таким образом, влияние на эффективность работы алгоритма при углах отклонения в пределах требования настоящего стандарта будет значительно меньше.
Очевидно, что до +/- 8° значимого снижения эффективности не наблюдается. Данные результаты применимы для оценки эффективности поиска "один-ко-многим" (ранговая статистика с рангом, равным 1). Как правило, разработчики программного обеспечения автоматического распознавания лица имеют возможность проводить настройку допустимых значений для поворота изображений на плоскости. Программный продукт, использованный при данном тестировании, был настроен на допуск 10°-ного отклонения для одного изображения, т.е. на максимальную разность угла отклонения 20°. Это явилось причиной снижения эффективности при тестах на +/- 15°.
D.2.3 Положение головы (поворот и наклон)
Компенсация изменения положения лица при наклоне и повороте является более сложной задачей для автоматических систем распознавания лица по сравнению с компенсацией отклонения головы. Исследование на данных, включающих 22 субъекта и 35 различных значений наклона и поворота головы, показало: выход за пределы требований настоящего стандарта приводит к статистически достоверному уменьшению эффективности алгоритма распознавания лица.
ФРАНКФУРТСКАЯ ГОРИЗОНТАЛЬ
Франкфуртская горизонталь введена в качестве стандартной плоскости для ориентации головы. Она определяется линией, проходящей через правую козелковую точку (передняя часть уха) и низшую точку правой глазницы [12, 13].
Следует обратить внимание, что при определении Франкфуртской горизонтали могут возникнуть трудности, поскольку она связана с положением уха, которое может быть скрыто прической.
СВЕДЕНИЯ О СООТВЕТСТВИИ ССЫЛОЧНЫХ МЕЖДУНАРОДНЫХ СТАНДАРТОВ НАЦИОНАЛЬНЫМ И МЕЖГОСУДАРСТВЕННЫМ СТАНДАРТАМ
(в ред. Изменения N 1, утв. Приказом Росстандарта от 08.11.2018 N 947-ст)