Что изучает биометрия как наука. Что такое персональные биометрические данные и где они используются? Евросоюз пытается вернуть приватность

ВВЕДЕНИЕ

Вопросы изучения живых организмов и растительных объектов, а также процессы, происходящие на клеточном, молекулярном и генетическом уровне становятся все более актуальными с каждым днем. С этой целью в научных лабораториях разрабатываются методы по их исследованию и моделируются сложных явлений природы. К наиболее часто используемым методам исследования можно отнести экспериментальные и методы многомерной статистики. Они являются важной и неотъемлемой частью лабораторного эксперимента и позволяют достоверно выявить закономерности происходящих природных процессов, а также найти причинно-следственные связи между ними.

В научных исследованиях для получения достоверных данных эффективно используется метод массовых наблюдений. Данный метод основан на использовании большого количества повторностей в каждой экспериментальной группе. Материал, полученный в ходе лабораторного опыта, обрабатывают и анализируют, далее по полученным данным делают соответствующие выводы и устанавливают те или иные закономерности. Большое значение в достижении наибольшей точности результатов и выводов в ходе эксперимента имеет не только качество экспериментальных методик, но и правильная статистическая обработка, так как полученные результаты могут значительно варьироваться в пределах одной экспериментальной группы. Таким образом, выполнение статистического анализа экспериментально полученных данных расширяет возможности в познании биологических явлений природы, способствует объективной оценке полученных результатов, исключая возможность субъективной точки зрения исследователя, а также методической ошибки, которые возникают при выполнении эксперимента, и дает возможность экспериментатору сделать точные и корректные выводы и заключений в отношении изучаемого явления.

Предмет исследования – компьютерные технологии как способ обработки данных, полученные при лабораторном исследований.

Цель исследования – проанализировать возможности статистических программ при обработке данных, полученных в результате постановки лабораторного эксперимента.

Задачи исследования:

· Оценить методы математической статистики с точки зрения их возможностей и границ применения при планировании и обработки биохимического эксперимента.

· Изучить, имеющиеся статистические пакеты анализа.

· Освоить возможности решения задач прикладной статистики средствами Microsoft Excel (применения стандартных функций и пакета анализа данных) и известных статистических пакетов STATISTICA в области биохимии.

Компьютерные технологии имеют большое значение в статистической обработке данных. Это позволяет не только ускорить данный процесс в несколько раз, но и произвести его на более высоком качественном уровне.


ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ИСПОЛЬЗОВАНИЯ КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ ПРИ ПРОВЕДЕНИИ ЛАБОРАТОРНОГО ИССЛЕДОВАНИЯ

Биометрия как наука и основные ее понятия

В последние годы все чаще для решения и моделирования поставленных задач используются компьютерные технологии. В связи с этим возросла потребность в высококвалифицированных специалистах, имеющих хорошую теоретическую базу и имеющие опыт работы с некоторыми программами. На сегодняшний день в учебных учреждениях появляются дисциплины, которые позволяют сформировать устойчивые умения, необходимые для обработки и представления результатов научной деятельности. Наука, которая занимается изучением методов сбора и токованием числовых данных называется статистика. Данная дисциплина имеет важное практическое значение, так как позволяет прогнозировать развития природных, социальных процессов и явлений. Со временем стали появляться более специализированные отрасли данной науки. Таким образом, на стыке двух самостоятельных наук: биология и статистика, - появляется биологическая статистика (или биометрия) . Биометрия – эмпирическая наука, изучающая данные, полученные при постановке опыта путем выполнения некоторых математических вычислений. Выполнение данных операций без вычислительной техники и компьютерных технологий занимает очень много времени. Насколько это трудоемкий процесс мы можем убедиться, рассмотрев некоторые наиболее используемые понятия биометрии при характеристики исследуемого признака.

Основные понятия биометрии.

Очень часто в практической деятельности человека и при обработке данных, полученных в ходе научных исследований, используется средняя величина. Данная величина характеризует исследуемый признак и показывает, каким было бы значение переменной, если бы у всех объектов из выборки оно было бы одинаковым. Средне арифметическая вычисляется по формуле:

где х 1 х 2 , ..., x k - варианты совокупности; n- общее количество вариант.

Медиана (граница 50%-ного интервала) - значение, которое делит выборку пополам: в обе стороны от медианы в вариационном ряду располагается одинаковое число вариант. Эта величина зависит от накопления частот. Частоты накапливают до тех пор, пока не будет превышена половина суммы частот. Полученное наибольшее значение и есть медиана. Формула, по которой можно вычислить данное значение имеет следующий вид:

,

где x min – минимальное значение предела интервала, где находится срединное значение; i - величина интервала; N-объем совокупности; Σn-суммарная численность до интервала, в котором находится срединное значение; N e -численность интервала, где находится срединное значение.

Еще один статистический показатель это мода. Модой называется такая величина, которая наиболее часто встречается. Моду можно вычислить по формуле Пирсона:

,

где Ме – медиана; М-среднее значение признака.

Среднее квадратичное отклонение, - важнейшая характеристика в биологическом эксперименте. Данная величина является мерой рассеяния ряда распределения и определяется по формуле:

В некоторых экспериментах требуется очень высокая точность опыта. Например, в медико-биологических, токсикометрических и др. Ошибка в данных опытах не должна быть выше 1%, если значение ошибки превышает 1%, то точность результата является неудовлетворительной и нужно увеличивать количество повторностей.

Однако как бы исследователь ни старался точно выполнять все действия методики эксперимента, все равно на практике случаются ошибки, которые необходимо учитывать при обработке данных. Существует несколько типов ошибок.

Ошибка средней (m x) - показатель, на которое отличается среднее значение выборочной (опытной) совокупности от среднего значения генеральной совокупности, если распределение исследуемого параметра будет стремиться к нормальному значению. Основная ошибка среднего рассчитывается по формуле:

Более информативным и приемлемыми для сравнения групп используется коэффициент изменчивости , или вариации . Коэффициент изменчивости – это основное отклонение, выраженное в процентах от среднего значения, которое рассчитывается по формуле:

По полученным результатам делают вывод о характере и степени варьирования признака (таблица 1.1).

Таблица 1.1. Характер изменчивости признаков (по М.Л.Дворецкому)

Если значение t больше четырех, то среднее значение будет достоверным и соответственно можно сформулировать корректные выводы.

Определяют также процент расхождения между выборочной и генеральной средними - точность опыта (р,%), или ошибка наблюдений :

Этот параметр опыта показывает, на сколько процентов можно ошибиться, если утверждать, что генеральная средняя равна полученной выборочной средней.

Встатистике важным является показатель нормирования. Данный показатель используется для оценки вариант относительно к среднему значению данной группы по следующей формуле:

В зависимости от цели исследования значение может колебаться от x: ±0,5σ до х±1σ. Варианты со значением от 0,67σ до 2σ являются субнормальными, если значение равно более х± 2σ, то такие вариантыследует отнести к категории аномалий.

В биометрии существует такое понятие как ошибка репрезентативности . Эта ошибка, которая возникает не в ходе выполнения измерений или вычислений, а из-за случайного отбора при формировании группы.

При подсчете ошибки средней арифметической в небольших группах количество наблюдений (п) является «числом степеней свободы» - используется выражение (n-1), и тогда формула имеет вид:

Существует огромное количество формул вычисления ошибок эксперимента. Некоторые из них приведены ниже в качестве примера. Формула, по которой вычисляется средняя ошибка среднего квадратического отклонения:

Средняя ошибка коэффициента вариации (С):

Средняя ошибка показателя асимметрии:

Или более точно:

Ошибку коэффициента эксцесса:

Сравнительный анализ полученных результатов сводится к оценке степени достоверности наблюдаемых между ними различий по следующей формуле:

где t - критерий достоверности. Его значение оценивается по таблицам вероятности Стъюдента. Если фактическое t больше табличного t st , то существует разница между двумя исследуемыми группами. Различие существенное, достоверное и его нельзя объяснить случайными причинами.

Для сравнения полученных результатов с ожидаемыми используют критерий хи-квадрат (χ 2), который находится по формуле:

где, p – эмпирическая частота, p’ – ожидаемая частота. Значение χ 2 -теста заключается в том, чтобы узнать, подтверждается или опровергается гипотеза экспериментом. Если значений χ 2 , превышает табличное, то можно утверждать, что разница между фактическими и ожидаемыми результатами будет достоверной.

Так как большинство биологических объектов имеют огромное количество, нередко взаимосвязанных признаков, которые их характеризуют, например, вес, рост, возраст и др., то при исследовании комплекса показателей применяют дисперсионного анализа. Зависимость, при которой на каждое значение независимой переменной приходится только одно значение зависимой, называют функциональной . Однако в природе такая связь бывает очень редко. Обычно исследуемые объекты с одинаковыми значениями одного признака имеют разные значения по другим признакам. Такую связь называется корреляцией . Коэффициент корреляции показывает, насколько один исследуемый признак связан с другим (таблица 2). Коэффициент корреляции вычисляется по формуле:

Таблица 1.2. Характеристика тесноты связи между признаками

Так же необходимо найти квадратическую ошибку коэффициента корреляции:

Полученные показатели коэффициента корреляции оценивают с помощью критерия достоверности Стьюдента:

Или с помощью формулы

При оценке взаимосвязи величин очень важно найти аналитическое уравнение, которое будет соответствовать природе изучаемого явления для предсказания поведения независимой характеристики объекта при изменении зависимого параметра. Взаимосвязь между переменными величинами называется регрессией . Коэффициент регрессии, который определяется по следующим аналогичным формулам:

- коэффициент регрессии Y.X;

коэффициент регрессии X.Y,

и .

Для коэффициента регрессии также находят среднюю квадратическую ошибку:

Это основные формулы, применяемые в биометрии, которые используются при обработке данных, полученных в ходе биохимических исследований. Существует еще очень много статистических формул, однако все они, как мы уже убедились, состоят из нескольких математических действий, что осложняет вычисления исследователя и может привести к многочисленным ошибкам в расчетах. Исправление этих ошибок может отнять много времени при обработке большого количества данных. Таким образом, компьютерные технологии упрощают данный рутинный процесс в несколько раз, что позволяет более рационально использовать время, а также уменьшают вероятность ошибки, что дает уверенность в правильности полученных результатов и позволяет сделать корректные выводы.

Планирование и обработка биохимического эксперимента

В настоящее время существует множество информации и довольно сложно ориентироваться в этом бесконечном потоке знаний. Тогда возникает вопрос, каким образом можно получить интересующую информацию и подобрать нужную литературу, затратив при этом минимальное количество времени. Для этого существуют различные поисковые системы, которые значительно сокращают количество потраченного времени на подготовительном этапе. Так как прежде чем приступить к выполнению и планированию исследования, необходимо убедиться, не изучался ли данный вопрос ранее, каковы результаты проведенных исследований и какие критерии уже изучены. Чтобы больше осознать в полной мере необходимость информационных технологий в планировании эксперимента, необходимо понять, что представляет собой данный процесс.

Планированием эксперимента называется комплекс мероприятий, направленных на эффективную постановку опыта, главной целью которого является достижение максимальной точности измерений при проведении минимального количества опытов. При планировании опыта выделяют несколько этапов:

1. Предпланирование – этот этап включает в себя составление плана работы и его утверждение, выбор темы, формулировка рабочей гипотезы, информационная обработка плана и освоение методик.

Этот этап позволяет исключить возможность дублирования исследования, обеспечивает достоверность знаний и оригинальный подход к решению поставленных перед исследователем задач

2. Собственно процесс исследования – на данном этапе производится аналитический обзор литературы по данной проблеме, накопление данных, их систематизация и выработка представлений и проведение эксперимента. Эксперимент – набор действий и наблюдений, выполненных для проверки истинности или ложности выдвинутой гипотезы и установление причинно-следственных связей между изучаемыми феноменами.

Благодаря данному этапу исследователь может осознать насколько новой является данная тема и актуальны полученные результаты, сформулировать научно-практическую значимость.

3. Последний этап заключается в оформление результатов научного поиска – составление отчетов, написание статей.

Любой эксперимент основан на выполнении аналитического метода, Аналитические методы имеют критерии, определяющие пригодность метода:

· Специфичность – способность определить тот компонент, для определения которого данный способ исследования предназначен.

· Точность – качество измерений, отражающих близость полученных результатов, содержащих анализируемое вещество

· Сходимость (воспроизводимость в серии) представление о близости друг к другу результатов исследования выполненных в одних условиях в серии.

· Воспроизводимость – близость результатов, полученных при выполнении лабораторного аналитического исследования пробы в различных условиях. Данный параметр отражает степень разброса данных и позволяет выявить случайные ошибки.

· Правильность и неправильность - отличия от истинного значения

· Чувствительность – способность метода выявлять наименьшее значение анализируемого вещества. Оценивается величина отношения разности между показателями измерений прибора. Чем выше величина отношения, тем выше чувствительность метода.

· Предельная чувствительность – концентрация исследуемого вещества соответствующая минимальному измерению отличному от значения холостой пробы.

Интерпретация полученных результатов исследования производится вручную или с помощью компьютера. Один из способов оценки результатов это построение градуированной (калибровочной) кривой. Калибровочная кривая отображает тесную связь экстинкции, интенсивности излучения света и концентрации вещества в сериях стандартных растворов. Для построения градуированной кривой используются стандартные растворы.

Построение калибровочной кривой:

ü Приготовление стандартных растворов

ü Приготовление разведение стандартного вещества, который охватывает диапазон исследуемых концентраций и выходит за пределы максимального и минимального значения.

ü Из основного готовим маточные растворы

ü Для каждой концентрации стандартного раствора делаем 3-5 измерений

ü По полученным точкам строим график.

Для большей наглядности и точности лучше всего построить график. График показывает зависимость оптической плотности от концентрации раствора. Это будет более удобно при последующем определении концентрации изучаемого вещества в исследуемых пробах, что поможет рассчитать более правильную концентрацию рабочих растворов.


Похожая информация.


Презентацию к данной лекции можно скачать .

Простая идентификация личности. Комбинация параметров лица, голоса и жестов для более точной идентификации. Интеграция возможностей модулей Intel Perceptual Computing SDK для реализации многоуровневой системы информационной безопасности, основанной на биометрической информации.

В данной лекции дается введение в предмет биометрических систем защиты информации, рассматривается принцип действия, методы и применение на практике. Обзор готовых решений и их сравнение. Рассматриваются основные алгоритмы идентификации личности. Возможности SDK по созданию биометрических методов защиты информации.

4.1. Описание предметной области

Существует большое разнообразие методов идентификации и многие из них получили широкое коммерческое применение. На сегодняшний день в основе наиболее распространенных технологий верификации и идентификации лежит использование паролей и персональных идентификаторов ( personal identification number - PIN ) или документов типа паспорта, водительских прав. Однако такие системы слишком уязвимы и могут легко пострадать от подделки, воровства и других факторов. Поэтому все больший интерес вызывают методы биометрической идентификации, позволяющие определить личность человека по его физиологическим характеристикам путем распознания по заранее сохраненным образцам.

Диапазон проблем, решение которых может быть найдено с использованием новых технологий, чрезвычайно широк:

  • предотвратить проникновение злоумышленников на охраняемые территории и в помещения за счет подделки, кражи документов, карт, паролей;
  • ограничить доступ к информации и обеспечить персональную ответственность за ее сохранность;
  • обеспечить допуск к ответственным объектам только сертифицированных специалистов;
  • процесс распознавания, благодаря интуитивности программного и аппаратного интерфейса, понятен и доступен людям любого возраста и не знает языковых барьеров;
  • избежать накладных расходов, связанных с эксплуатацией систем контроля доступа (карты, ключи);
  • исключить неудобства, связанные с утерей, порчей или элементарным забыванием ключей, карт, паролей;
  • организовать учет доступа и посещаемости сотрудников.

Кроме того, важным фактором надежности является то, что она абсолютно никак не зависит от пользователя. При использовании парольной защиты человек может использовать короткое ключевое слово или держать бумажку с подсказкой под клавиатурой компьютера. При использовании аппаратных ключей недобросовестный пользователь будет недостаточно строго следить за своим токеном, в результате чего устройство может попасть в руки злоумышленника. В биометрических же системах от человека не зависит ничего. Еще одним фактором, положительно влияющим на надежность биометрических систем, является простота идентификации для пользователя. Дело в том, что, например, сканирование отпечатка пальца требует от человека меньшего труда, чем ввод пароля. А поэтому проводить эту процедуру можно не только перед началом работы, но и во время ее выполнения, что, естественно, повышает надежность защиты. Особенно актуально в этом случае использование сканеров, совмещенных с компьютерными устройствами. Так, например, есть мыши, при использовании которых большой палец пользователя всегда лежит на сканере. Поэтому система может постоянно проводить идентификацию, причем человек не только не будет приостанавливать работу, но и вообще ничего не заметит. В современном мире, к сожалению, продается практически все, в том числе и доступ к конфиденциальной информации. Тем более что человек, передавший идентификационные данные злоумышленнику, практически ничем не рискует. Про пароль можно сказать, что его подобрали, а про смарт-карту, что ее вытащили из кармана. В случае же использования биометрической защиты подобной ситуации уже не произойдет.

Выбор отраслей, наиболее перспективных для внедрения биометрии, с точки зрения аналитиков, зависит, прежде всего, от сочетания двух параметров: безопасности (или защищенности) и целесообразности использования именно этого средства контроля или защиты. Главное место по соответствию этим параметрам, бесспорно, занимают финансовая и промышленная сфера, правительственные и военные учреждения, медицинская и авиационная отрасли, закрытые стратегические объекты. Данной группе потребителей биометрических систем безопасности в первую очередь важно не допустить неавторизованного пользователя из числа своих сотрудников к неразрешенной для него операции , а также важно постоянно подтверждать авторство каждой операции . Современная система безопасности уже не может обходиться не только без привычных средств, гарантирующих защищенность объекта, но и без биометрии. Также биометрические технологии используются для контроля доступа в компьютерных, сетевых системах, различных информационных хранилищах, банках данных и др.

Биометрические методы защиты информации становятся актуальней с каждым годом. С развитием техники: сканеров, фото и видеокамер спектр задач, решаемых с помощью биометрии, расширяется, а использование методов биометрии становится популярнее. Например, банки, кредитные и другие финансовые организации служат для их клиентов символом надежности и доверия. Чтобы оправдать эти ожидания, финансовые институты все больше внимание уделяют идентификации пользователей и персонала, активно применяя биометрические технологии. Некоторые варианты использования биометрических методов:

  • надежная идентификация пользователей различных финансовых сервисов, в т.ч. онлайновых и мобильных (преобладает идентификация по отпечаткам пальцев, активно развиваются технологии распознавания по рисунку вен на ладони и пальце и идентификация по голосу клиентов, обращающихся в колл-центры);
  • предотвращение мошенничеств и махинаций с кредитными и дебетовыми картами и другими платежными инструментами (замена PIN-кода распознаванием биометрических параметров, которые невозможно похитить, "подсмотреть", клонировать);
  • повышение качества обслуживания и его комфорта (биометрические банкоматы);
  • контроль физического доступа в здания и помещения банков, а также к депозитарным ячейкам, сейфам, хранилищам (с возможностью биометрической идентификации, как сотрудника банка, так и клиента-пользователя ячейки);
  • защита информационных систем и ресурсов банковских и других кредитных организаций.

4.2. Биометрические системы защиты информации

Биометрические системы защиты информации - системы контроля доступа, основанные на идентификации и аутентификации человека по биологическим признакам, таким как структура ДНК, рисунок радужной оболочки глаза, сетчатка глаза, геометрия и температурная карта лица, отпечаток пальца, геометрия ладони. Также эти методы аутентификации человека называют статистическими методами, так как основаны на физиологических характеристиках человека, присутствующих от рождения и до смерти, находящиеся при нем в течение всей его жизни, и которые не могут быть потеряны или украдены. Часто используются еще и уникальные динамические методы биометрической аутентификации - подпись, клавиатурный почерк, голос и походка, которые основаны на поведенческих характеристиках людей.

Понятие " биометрия " появилось в конце девятнадцатого века. Разработкой технологий для распознавания образов по различным биометрическим характеристикам начали заниматься уже достаточно давно, начало было положено в 60-е годы прошлого века. Значительных успехов в разработке теоретических основ этих технологий добились наши соотечественники. Однако практические результаты получены в основном на западе и совсем недавно. В конце двадцатого века интерес к биометрии значительно вырос благодаря тому, что мощность современных компьютеров и усовершенствованные алгоритмы позволили создать продукты, которые по своим характеристикам и соотношению стали доступны и интересны широкому кругу пользователей. Отрасль науки нашла свое применение в разработках новых технологий безопасности. Например, биометрическая система может контролировать доступ к информации и хранилищам в банках, ее можно использовать на предприятиях, занятых обработкой ценной информации, для защиты ЭВМ, средств связи и т. д.

Суть биометрических систем сводится к использованию компьютерных систем распознавания личности по уникальному генетическому коду человека. Биометрические системы безопасности позволяют автоматически распознавать человека по его физиологическим или поведенческим характеристикам.


Рис. 4.1.

Описание работы биометрических систем:

Все биометрические системы работают по одинаковой схеме. Вначале, происходит процесс записи, в результате которого система запоминает образец биометрической характеристики. Некоторые биометрические системы делают несколько образцов для более подробного запечатления биометрической характеристики. Полученная информация обрабатывается и преобразуется в математический код. Биометрические системы информационной безопасности используют биометрические методы идентификации и аутентификации пользователей. Идентификация по биометрической системы проходит в четыре стадии:

  • Регистрация идентификатора - сведение о физиологической или поведенческой характеристике преобразуется в форму, доступную компьютерным технологиям, и вносятся в память биометрической системы;
  • Выделение - из вновь предъявленного идентификатора выделяются уникальные признаки, анализируемые системой;
  • Сравнение - сопоставляются сведения о вновь предъявленном и ранее зарегистрированном идентификаторе;
  • Решение - выносится заключение о том, совпадают или не совпадают вновь предъявленный идентификатор.

Заключение о совпадении/несовпадении идентификаторов может затем транслироваться другим системам (контроля доступа, защиты информации и т. д), которые далее действуют на основе полученной информации.

Одна из самых важных характеристик систем защиты информации, основанных на биометрических технологиях, является высокая надежность , то есть способность системы достоверно различать биометрические характеристики, принадлежащие разным людям, и надежно находить совпадения. В биометрии эти параметры называются ошибкой первого рода ( False Reject Rate , FRR ) и ошибкой второго рода ( False Accept Rate , FAR ). Первое число характеризует вероятность отказа доступа человеку, имеющему доступ , второе - вероятность ложного совпадения биометрических характеристик двух людей. Подделать папиллярный узор пальца человека или радужную оболочку глаза очень сложно. Так что возникновение "ошибок второго рода" (то есть предоставление доступа человеку, не имеющему на это право) практически исключено. Однако, под воздействием некоторых факторов биологические особенности, по которым производится идентификация личности, могут изменяться. Например, человек может простудиться, в результате чего его голос поменяется до неузнаваемости. Поэтому частота появлений "ошибок первого рода" (отказ в доступе человеку, имеющему на это право) в биометрических системах достаточно велика. Система тем лучше, чем меньше значение FRR при одинаковых значениях FAR . Иногда используется и сравнительная характеристика EER ( Equal Error Rate ), определяющая точку, в которой графики FRR и FAR пересекаются. Но она далеко не всегда репрезентативна. При использовании биометрических систем, особенно системы распознавания по лицу, даже при введении корректных биометрических характеристик не всегда решение об аутентификации верно. Это связано с рядом особенностей и, в первую очередь , с тем, что многие биометрические характеристики могут изменяться. Существует определенная степень вероятности ошибки системы. Причем при использовании различных технологий ошибка может существенно различаться. Для систем контроля доступа при использовании биометрических технологий необходимо определить, что важнее не пропустить "чужого" или пропустить всех "своих".


Рис. 4.2.

Не только FAR и FRR определяют качество биометрической системы. Если бы это было только так, то лидирующей технологией было бы распознавание людей по ДНК, для которой FAR и FRR стремятся к нулю. Но ведь очевидно, что эта технология не применима на сегодняшнем этапе развития человечества. Поэтому важной характеристикой является устойчивость к муляжу, скорость работы и стоимость системы. Не стоит забывать и то, что биометрическая характеристика человека может изменяться со временем, так что если она неустойчива - это существенный минус. Также важным фактором для пользователей биометрических технологий в системах безопасности является простота использования. Человек, характеристики которого сканируются, не должен при этом испытывать никаких неудобств. В этом плане наиболее интересным методом является, безусловно, технология распознавания по лицу. Правда, в этом случае возникают иные проблемы, связанные в первую очередь , с точностью работы системы.

Обычно биометрическая система состоит из двух модулей: модуль регистрации и модуль идентификации.

Модуль регистрации "обучает" систему идентифицировать конкретного человека. На этапе регистрации видеокамера или иные датчики сканируют человека для того, чтобы создать цифровое представление его облика. В результате сканирования чего формируются несколько изображений. В идеальном случае, эти изображения будут иметь слегка различные ракурсы и выражения лица, что позволит получить более точные данные. Специальный программный модуль обрабатывает это представление и определяет характерные особенности личности, затем создает шаблон . Существуют некоторые части лица, которые практически не изменяются с течением времени, это, например, верхние очертания глазниц, области окружающие скулы, и края рта. Большинство алгоритмов, разработанных для биометрических технологий, позволяют учитывать возможные изменения в прическе человека, так как они не используют для анализа области лица выше границы роста волос. Шаблон изображения каждого пользователя хранится в базе данных биометрической системы.

Модуль идентификации получает от видеокамеры изображение человека и преобразует его в тот же цифровой формат, в котором хранится шаблон . Полученные данные сравниваются с хранимым в базе данных шаблоном для того, чтобы определить, соответствуют ли эти изображения друг другу. Степень подобия, требуемая для проверки, представляет собой некий порог, который может быть отрегулирован для различного типа персонала, мощности PC , времени суток и ряда иных факторов.

Идентификация может выполняться в виде верификации, аутентификации или распознавания. При верификации подтверждается идентичность полученных данных и шаблона, хранимого в базе данных. Аутентификация - подтверждает соответствие изображения, получаемого от видеокамеры одному из шаблонов, хранящихся в базе данных. При распознавании, если полученные характеристики и один из хранимых шаблонов оказываются одинаковыми, то система идентифицирует человека с соответствующим шаблоном.

4.3. Обзор готовых решений

4.3.1. ИКАР Лаб: комплекс криминалистического исследования фонограмм речи

Аппаратно-программный комплекс ИКАР Лаб предназначен для решения широкого круга задач анализа звуковой информации, востребованного в специализированных подразделениях правоохранительных органов, лабораториях и центрах судебной экспертизы, службах расследования летных происшествий, исследовательских и учебных центрах. Первая версия продукта была выпущена в 1993 году и явилась результатом совместной работы ведущих аудиоэкспертов и разработчиков программного обеспечения. Входящие в состав комплекса специализированные программные средства обеспечивают высокое качество визуального представления фонограмм речи. Современные алгоритмы голосовой биометрии и мощные инструменты автоматизации всех видов исследования фонограмм речи позволяют экспертам существенно повысить надежность и эффективность экспертиз. Входящая в комплекс программа SIS II обладает уникальными инструментами для идентификационного исследования: сравнительное исследование диктора, записи голоса и речи которого предоставлены на экспертизу и образцов голоса и речи подозреваемого. Идентификационная фоноскопическая экспертиза основывается на теории уникальности голоса и речи каждого человека. Анатомическое факторы: строение органов артикуляции, форма речевого тракта и ротовой полости, а также внешние факторы: навыки речи, региональные особенности, дефекты и др.

Биометрические алгоритмы и экспертные модули позволяют автоматизировать и формализовать многие процессы фоноскопического идентификационного исследования, такие как поиск одинаковых слов, поиск одинаковых звуков, отбор сравниваемых звуковых и мелодических фрагментов, сравнение дикторов по формантам и основному тону, аудитивные и лингвистические типы анализа. Результаты по каждому методу исследования представляются в виде численных показателей общего идентификационного решения.

Программа состоит из ряда модулей, с помощью которых производится сравнение в режиме "один-к-одному". Модуль "Сравнения формант" основан на термине фонетики - форманте, обозначающий акустическую характеристику звуков речи (прежде всего гласных), связанную с уровнем частоты голосового тона и образующую тембр звука. Процесс идентификации с использованием модуля "Сравнения формант" может быть разделен на два этапа: cначала эксперт осуществляет поиск и отбор опорных звуковых фрагментов, а после того как опорные фрагменты для известного и неизвестного дикторов набраны, эксперт может начать сравнение. Модуль автоматически рассчитывает внутридикторскую и междикторскую вариативность формантных траекторий для выбранных звуков и принимает решение о положительной/отрицательной идентификации или неопределенном результате. Также модуль позволяет визуально сравнить распределения выбранных звуков на скаттерограмме.

Модуль "Сравнение Основного Тона" позволяет автоматизировать процесс идентификации дикторов с помощью метода анализа мелодического контура. Метод предназначен для сравнения речевых образцов на основе параметров реализации однотипных элементов структуры мелодического контура. Для анализа предусмотрено 18 типов фрагментов контура и 15 параметров их описания, включая значения минимума, среднего, максимума, скорости изменения тона, эксцесса, скоса и др. Модуль возвращает результаты сравнения в виде процентного совпадения для каждого из параметров и принимает решение о положительной/отрицательной идентификации или неопределенном результате. Все данные могут экспортироваться в текстовый отчет.

Модуль автоматической идентификации позволяет производить сравнение в режиме "один-к-одному" с использованием алгоритмов:

  • Спектрально-форматный;
  • Статистика основного тона;
  • Смесь Гауссовых распределений;

Вероятности совпадения и различия дикторов рассчитываются не только для каждого из методов, но и для их совокупности. Все результаты сравнения речевых сигналов двух файлах, получаемые в модуле автоматической идентификации, основаны на выделении в них идентификационно значимых признаков и вычислении меры близости между полученными наборами признаков и вычислений меры близости полученных наборов признаков между собой. Для каждого значения этой меры близости во время периода обучения модуля автоматического сравнения были получены вероятности совпадения и различия дикторов, речь которых содержалась в сравниваемых файлах. Эти вероятности были получены разработчиками на большой обучающей выборке фонограмм: десятки тысяч дикторов, различные каналы звукозаписи, множество сессий звукозаписи, разнообразный тип речевого материала. Применение статистических данных к единичному случаю сравнения файл-файл требует учета возможного разброса получаемых значений меры близости двух файлов и соответствующей ей вероятности совпадения/различия дикторов в зависимости от различных деталей ситуации произнесения речи. Для таких величин в математической статистике предложено использовать понятие доверительного интервала. Модуль автоматического сравнения выводит численные результаты с учетом доверительных интервалов различных уровней, что позволяет пользователю увидеть не только среднюю надежность метода, но и наихудший результат, полученный на обучающей базе. Высокая надежность биометрического движка, разработанного компанией ЦРТ, была подтверждена испытаниями NIST (National Institute of Standards and Technology)

  • Некоторые методы сравнения являются полуавтоматическими (лингвистический и аудитивный анализы)
  • Биоме́три́я - система распознавания людей по одной или более физическим или поведенческим чертам (трёхмерная фотография лица и/или тела, образец голоса, отпечатки пальцев, рисунок вен руки, группа крови, специальное фото роговицы глаза и т.д.). В области информационных технологий биометрические данные используются в качестве формы управления идентификаторами доступа и контроля доступа. Также биометрический анализ используется для выявления людей, которые находятся под наблюдением (широко распространено в США , а также в России - отпечатки пальцев).

    Основные принципы

    Биометрические данные можно разделить на два основных класса:

    • Физиологические - относятся к форме тела. В качестве примера можно привести: отпечатки пальцев , распознавание лица, ДНК , ладонь руки, сетчатка глаза, запах, голос.
    • Поведенческие - связаны с поведением человека. Например, походка и речь. Иногда для этого класса биометрии используется термин англ. behaviometrics .

    Определения

    Основные определения, используемые в сфере биометрических приборов :

    • Универсальность - каждый человек должен обладать измеряемой характеристикой.
    • Уникальность - насколько хорошо человек отделяется от другого с биометрической точки зрения.
    • Постоянство - мера того, в какой степени выбранные биометрические черты остаются неизменными во времени (например, в процессе старения).
    • Взыскания - простота осуществления измерения.
    • Производительность - точность, скорость и надёжность используемых технологий.
    • Приемлемость - степень достоверности технологии.
    • Устранение - простота использования замены.

    Биометрическая система может работать в двух режимах:

    • Верификация - сравнение один к одному с биометрическим шаблоном. Проверяет, что человек тот, за кого он себя выдает. Верификация может быть осуществлена по смарт-карте , имени пользователя или идентификационному номеру.
    • Идентификация - сравнение один ко многим: после «захвата» биометрических данных идет соединение с биометрической базой данных для определения личности. Идентификация личности проходит успешно, если биометрический образец уже есть в базе данных.

    Первое частное и индивидуальное применение биометрической системы называлось регистрацией . В процессе регистрации биометрическая информация от индивида сохранялась. В дальнейшем биометрическая информация регистрировалась и сравнивалась с информацией, полученной ранее. Обратите внимание: если необходимо, чтобы биометрическая система была надежна, очень важно, чтобы хранение и поиск внутри самих систем были безопасными.

    • Коэффициент ложного приема (FAR), или коэффициент ложного совпадения (FMR)
      FAR - коэффициент ложного пропуска, вероятность ложной идентификации, то есть вероятность того, что система биоидентификации по ошибке признает подлинность (например, по отпечатку пальца) пользователя, не зарегистрированного в системе
      FMR - вероятность, что система неверно сравнивает входной образец с несоответствующим шаблоном в базе данных.
    • Коэффициент ложного отклонения (FRR), или коэффициент ложного несовпадения (FNMR)
      FRR - коэффициент ложного отказа доступа - вероятность того, что система биоидентификации не признает подлинность отпечатка пальца зарегистрированного в ней пользователя.
      FNMR - вероятность того, что система ошибётся в определении совпадений между входным образцом и соответствующим шаблоном из базы данных. Система измеряет процент верных входных данных, которые были приняты неправильно.
    • Рабочая характеристика системы, или относительная рабочая характеристика (ROC)
      График ROC - это визуализация компромисса между характеристиками FAR и FRR. В общем случае сравнивающий алгоритм принимает решение на основании порога, который определяет, насколько близко должен быть входной образец к шаблону, чтобы считать это совпадением. Если порог был уменьшен, то будет меньше ложных несовпадений, но больше ложных приёмов. Соответственно, высокий порог уменьшит FAR, но увеличит FRR. Линейный график свидетельствует о различиях для высокой производительности (меньше ошибок - реже возникают ошибки).
    • Равный уровень ошибок (коэффициент EER), или коэффициент переходных ошибок (CER) - это коэффициенты, при которых обе ошибки (ошибка приёма и ошибка отклонения) эквивалентны. Значение EER может быть с лёгкостью получено из кривой ROC. EER - это быстрый способ сравнить точность приборов с различными кривыми ROC. В основном, устройства с низким EER наиболее точны. Чем меньше EER, тем более точной будет система.
    • Коэффициент отказа в регистрации (FTE или FER) - коэффициент, при котором попытки создать шаблон из входных данных безуспешны. Чаще всего это вызвано низким качеством входных данных.
    • Коэффициент ошибочного удержания (FTC) - в автоматизированных системах это вероятность того, что система не способна определить биометрические входные данные, когда они представлены корректно.
    • Ёмкость шаблона - максимальное количество наборов данных, которые могут храниться в системе.

    Так как чувствительность биометрических приборов увеличивается, то FAR уменьшается, а FRR увеличивается.

    Задачи и проблемы

    Конфиденциальность и разграничение

    Данные, полученные во время биометрической регистрации, могут использоваться с целями, на которые зарегистрированный индивид не давал согласия (не был осведомлён).

    Опасность для владельцев защищённых данных

    В случае, когда воры не могут получить доступ к охраняемой собственности, существует возможность выслеживания и покушения на носителя биометрических идентификаторов с целью получения доступа. Если что-либо защищено биометрическим устройством , владельцу может быть нанесен необратимый ущерб, который, возможно, будет стоить больше самой собственности. Например, в 2005 году малайзийские угонщики отрезали палец владельцу Мерседес-Бенц S-класса при попытке угнать его машину .

    Использование биометрических данных потенциально уязвимо к мошенничеству: биометрические данные так или иначе оцифровываются. Мошенник может подключиться к шине , ведущей от сканера к обрабатывающему устройству, и получить полную информацию о сканируемом объекте. Затем мошеннику даже не понадобится живой человек, потому что, точно также подключившись к шине, он сможет проводить все операции от лица отсканированного человека, не задействуя сканер.

    Биометрические данные с возможностью отмены

    Преимуществом паролей над биометрией является возможность их смены. Если пароль был украден или потерян, его можно отменить и заменить новой версией. Это становится невозможным в случае с некоторыми вариантами биометрии. Если параметры чьего-либо лица были украдены из базы данных, то их невозможно отменить либо выдать новые. Биометрические данные с возможностью отмены являются тем самым путём, который должен включить в себя возможность отмены и замены биометрии. Первыми его предложили Ratha и др.

    Было разработано несколько методов отменяемой биометрии. Первая система биометрии с возможностью отмены, основанная на отпечатках пальцев, была спроектирована и создана Туляковым . Главным образом отменяемая биометрия представляет собой искажение биометрического изображения или свойств до их согласования. Вариативность искаженных параметров несёт в себе возможности отмены для данной схемы. Некоторые из предложенных техник работают, используя свои собственные механизмы распознавания, как в работах Тео и Саввида , в то время как другие (Дабба ) используют преимущества продвижения хорошо представленных биометрических исследований для своих интерфейсов распознавания. Хотя увеличиваются ограничения системы защиты, всё же это делает модели с возможностью отмены более доступными для биометрических технологий.

    Одним из частных вариантов решения может быть, например, использование не всех биометрических параметров. Например, для идентификации используется рисунок папиллярных линий только двух пальцев (к примеру, больших пальцев правой и левой руки). В случае необходимости (например, при ожоге подушечек двух «ключевых» пальцев) данные в системе могут быть откорректированы так, что с определённого момента допустимым сочетанием будет указательный палец левой руки и мизинец правой (данные, которые до этого не были записаны в систему - и не могли быть скомпрометированы).

    Международный обмен биометрическими данными

    Чтобы быть уверенными в том, что мы можем пресечь деятельность террористических организаций до того, как они доберутся до США, мы должны занять ведущее место в продвижении международных стандартов по биометрии. Развивая совместимые системы, мы сможем безопасно передавать информацию о террористах между странами, поддерживая нашу защищенность. Так же, как мы улучшаем пути сотрудничества внутри Правительства США по выявлению и устранению террористов и иных опасных личностей, у нас ещё есть обязательства перед нашими партнерами за границей совместно предотвращать любые действия террористов. <...> Что же дальше? Нам нужно усиленно следовать за инновациями. Те, кто хотят причинить нам вред, продолжают искать наши слабости. Поэтому мы не можем позволить себе замедлить развитие. <...> Мы понимаем, что при помощи биометрии и международного сотрудничества мы можем изменить и расширить возможности для путешествий, а также защитить народы разных стран от тех, кто хочет причинить нам вред.

    Согласно статье, опубликованной С. Магнусон в журнале «Национальная Безопасность» (англ. National Defense Magazine ), Департамент национальной безопасности США под давлением вынуждает распространять биометрические данные . В статье говорится:

    Миллер (консультант Ведомства Национальной Безопасности и по делам безопасности в Америке) сообщает, что США имеет двусторонние договоренности по обмену биометрическими данными с 25 странами. Каждый раз, когда какой-либо иностранный лидер посещал Вашингтон за последние несколько лет, Государственный департамент обязательно заключал с ним подобный договор.

    Законодательное регулирование в России

    Статья 11 Федерального закона «О персональных данных» № 152-ФЗ от 27 июля 2006 г. регламентирует основные особенности использования биометрических данных. Также со вступлением в силу 482-ФЗ от 29 декабря 2017 года начат процесс постепенного перехода к биометрическим способам идентификации для оказания банковских, образовательных и иных услуг, а в будущем - и оплаты проезда. В июле 2019 года Комитет Госдумы России одобрил законопроект о биометрической идентификации клиентов банков .

    Биометрия в массовой культуре

    Технологии биометрии были освещены в популярных кинофильмах. Это вызвало интерес потребителей к биометрии как к средству идентификации человека. В фильмах 2003 года «Люди-Х 2 » и «Халк » использовались биометрические технологии распознавания: в виде доступа по отпечатку руки в фильме «Люди-Х 2» и по отпечатку пальца в «Халке».

    Но это не было так показательно, пока в 2004 году не вышел фильм «Я, робот » с Уиллом Смитом в главной роли. Футуристический фильм демонстрировал развитие новейших технологий, которые даже на сегодняшний день ещё недостаточно развиты. Использование технологий распознавания голоса и ладони в фильме зафиксировалось в представлении будущего у людей. Обе эти технологии, которые используются сегодня для охраны зданий или информации - лишь два из возможных применений биометрии.

    В 2005 году вышел в прокат фильм «Остров ». Дважды за фильм клоны используют биометрические данные: чтобы проникнуть в дом и завести машину.

    Фильм «Гаттака » рисует общество, в котором существует два класса людей: продукты генной инженерии, созданные для того, чтобы быть высшими (так называемые «Действительные»), и низшие обычные люди («Инвалиды»). Люди, считавшиеся «Действительными», имели большие привилегии, и доступ к запретным зонам был ограничен для таких людей и контролировался автоматическими биометрическими сканерами, похожими на сканеры отпечатков пальцев, но коловшие палец и получавшие пробу ДНК из взятой крови.

    В фильме «Разрушитель » персонаж Саймон Феникс, которого играл Уэсли Снайпс , вырезает жертве глаз, чтобы открыть дверь со сканером сетчатки.

    В картине «Монстры против пришельцев » студии DreamWorks военный помощник проникает в зону, используя биометрию.

    Критика

    Религиозная критика

    См. также

    Примечания

    1. Jain, A. K.; Ross, Arun & Prabhakar, Salil (January 2004), "An introduction to biometric recognition ", IEEE Transactions on Circuits and Systems for Video Technology Т. 14th (1): 4-20, DOI 10.1109/TCSVT.2003.818349

    Министерство образования и науки Республики Казахстан

    При проведении зоотехнических экспериментов, ветеринарных исследований, научных наблюдений в научно-исследовательских институтах, на опытных станциях, на фермах совхозов и колхозов возникает необходимость в выявлении таких закономерностей, которые обычно скрыты случайной формой своего проявления. Определение надежности научных диагнозов и прогнозов, выдвижение научных рекомендаций о массовом применении новых методов кормления, разведения, лечения и репродуктивного использования сельскохозяйственных животных требует установления достоверности результатов тех исследований, на основе которых делаются соответствующие выводы и даются рекомендации.

    Генетический анализ, как и большинство теоретических и прикладных экспериментальных зоотехнических и ветеринарных работ, включает применение математико-статистических методов. О степени развития любой науки можно судить по тому, насколько она применяет методы математики (по К. Марксу).

    Использование достижения современной биометрии - науки о способах применения принципов и методов теории вероятности и математической статистики в биологии вообще и в зоотехнии и ветеринарии в частности - позволяет выделять новые закономерности явлений жизни и событий животного мира. С помощью методов математического анализа можно установить, насколько точно достоверно данные, полученные на отдельной не большой группе животных (выборке), отражают особенности всех животных (генеральной совокупности).

    Методами биометрического анализа пользуются как научные работники и специалисты животноводства, так и преподаватели, аспиранты и студенты вузов.

    В настоящее время имеется много изданий фундаментальных пособий по биометрии, однако им присуща теоретическая направленность, позиционно - математическое изложение, что создает трудности студентам самостоятельно освоить и применять биометрические методы при обработке своих исследований.

    Ф. Гальтон сформулировал закон регрессии , это положение нашло отражение в современной генетике под названием коэффициента наследственной детерминации аддитивного генотипа-потомка, имеющего предков в свободно скрещивающейся популяции.

    Философские концепции К. Пирсона были откровенно идеалистическими, однако открытие им в области математической статистики среднее квадратичное отклонение, коэффициент вариации, метод хи-квадрат, коэффициенты прямолинейной и криволинейной корреляции нашли широкое применение как генетико-селекционных исследованиях, так и в других областях науки и техники.

    Большую роль в развитии теории вероятности сыграли классические исследования великих русских математиков и.

    Датский ученый изложил методические основы генетического анализа: чистые линии, математическая обработка и искусственное скрещивание.

    Г. Харди (Англия) и А. Вайнберг (Германия) заложили основу для современной популяционной генетики.

    В. Госсет (псевдоним Стьюдент) обосновал теорию малых выборок.

    Агроном, работавший на Ротамстедской опытной станции (Великобритания), предложил метод дисперсионного анализа .

    предложил ряд математических формул, применяемых в генетическом анализе, в частности, формулу выражения закона Менделя.

    Велики заслуги в становлении математических методов генетического анализа.

    В последнее время в нашей стране и за рубежом выпущен ряд пособий и учебников по биометрии: «Биологическая статистика» и «Введение в статистическую генетику», «Статистические методы в применении к исследованиям в сельском хозяйстве и биологии», «Биометрия», «Руководство по биометрии для зоотехников», «Биометрия в животноводстве», «Введение в генетику количественных признаков», «Биометрия» и др.

    1.2 Основные понятия теории вероятности

    Теория вероятности имеет дело с изучением закономерностей случайных событий. Для понимания статистического подхода к изучаемым явлениям нужно ознакомиться с некоторыми понятиями и методами теории вероятности.

    Опыт - процесс, в ходе которого могут осуществляться (или не осуществляться) события, которые можно зафиксировать при наблюдениях. Известные, существующие объективно или созданные экспериментатором явления, влияющие на ход опыта, называются условиями. События, которые могут произойти в данном опыте, называются исходами. Условия данного опыта вместе с множеством исходов составляют испытание.

    Событие, которое в определенных условиях происходит обязательно, называется достоверным; которое не может произойти – невозможным; которое может возникнуть, но может и не возникнуть - случайным.

    Вероятность - это числовая характеристика степени возможности появления какого - либо события, которое может повториться неограниченное число раз.

    Вероятность достоверного события полагается равной единице, невозможного - нулю.

    Если в опыте появление одного события исключает появление другого, то эти события называются несовместимыми, в противном случае такие события называются совместимыми.

    Случайность есть форма проявления необходимости и в то же время дополнение необходимости.

    Диалектико-материалистические представления об объективной случайности как форме необходимости дает возможность правильно оценивать многочисленные факты статистических закономерностей в явлениях природы и в том числе в явлениях изменчивости и наследственности.

    Статистические закономерности не дают возможности предсказать появление отдельных событий, так как отдельное событие имеет только свою вероятность появления. Главная особенность статистических закономерностей заключается в том, что они помогают предвидеть свойства больших совокупностей и предсказать в них частоту определенных событий.

    В основе всех статистических методов, которые широко используются в статистической генетике, лежит теория вероятности. Некоторые специфические для статистической генетики методы, составляющие техническую основу, рассматривается в данной работе.

    1.3 Статистическая совокупность, ее свойства, терминология и символика

    Следует знать, что биометрия - это математическая статистика в приложении к явлениям живой природы. С помощью методов вариационной статистики она изучает их изменчивость и наследственность.

    Объектом исследований биометрии являются животные, у которых изучают закономерности изменения и проявления признаков.

    Закономерности изменчивости и наследственности устанавливаются на массовом материале, полученном на многочисленных экземплярах.

    Любое количество отдельных объектов, отличаются друг от друга и в тоже время сходных по многим признакам, составляет совокупность, которую разделяют на генеральную и выборочную.

    Генеральную совокупность образуют особи, которые интересуют исследования с точки зрения особенностей изменчивости и наследственности их признаков (например, совокупность всех животных какого-то стада, породы в целом или данного региона). Но, как правило, обследовать всех животных, а тем более провести на них какой - либо эксперимент, не всегда представляется возможным, так как это требует больших затрат средств и времени. Поэтому изучают (подвергают эксперименту) только часть особей генеральной совокупности.

    Выборочная совокупность (выборка) – это группа особей, выделенная методом случайного отбора из генеральной совокупности для проведения на ней исследований. Выборка может с определенной степенью достоверности характеризовать всю генеральную совокупность. Чтобы выборочная совокупность более плотно отражала генеральную, необходимо учитывать такие основы положения:

    Выборка должна быть вполне представительной, т. е. иметь определенное количество наиболее типичных особей генеральной совокупности;

    Выборка должна быть объективной, т. е. сформированной по принципу случайного отбора без субъективных влияний на ее состав;

    выборка должна быть качественно однородной (выделенные для опыта группы должны быть аналогами по видовым, возрастным, физиологическим и другим факторам).

    По объему выборки делятся на малочисленные, содержащие до 30 особей, и многочисленные.

    Числовые значения признака отдельных особей называют вариантами (от латинского Varians). Изменение признаков и свойств живых существ называют варьированием. Совокупность вариант, полученных при наблюдении (исследовании) без определенной систематики называют первичным (сырым) рядом. Расстановка вариант в порядке возрастания (или убывания) называется ранжированием (ранжированный ряд). Группа чисел, сгруппированная в классы в зависимости от величины изучаемого признака, называется вариационным рядом.

    Существующие между биологическими признаками связи, при которых определенному значению одного признака соответствует несколько значений другого признака, варьирующей около своей средней величины, называется корреляцией.

    Биологические признаки, если они выражаются при помощи счета или меры, приобретают значение математических величин: средняя арифметическая, средняя квадратическая, коэффициент изменчивости, коэффициент корреляции и ряд других. Результаты измерений признаков, как и их особенностей варьирования, взаимосвязи и наследуемости обозначается в математических работах разными символами (таблица 1).

    Таблица 1

    Символы

    Название символа

    Принятые в данной работе

    В других работах по руководству по биометрии

    Дата, варианта (числовое значение признака)

    Число особей генеральной совокупности

    Число особей выборки

    Продолжение таблицы 1

    Максимальное и минимальное значение признака

    Лимит, размах изменчивости

    Величина классового промежутка

    Частота (число вариант в классе)

    Числовое значение модального класса

    Отклонение классов от модального (условного, среднего)

    Поправка к условной средней

    Средняя арифметическая генеральной совокупности

    Средняя арифметическая выборки

    ∑(V - M)2, S, G, SQ

    Дисперсия (сумма квадратов центральных отклонений)

    Сумма квадратов условных отклонений

    Сигма (среднее квадратичное отклонение)

    Коэффициент вариации

    Дисперсия - общая, факториальная, остаточная

    Статистическая ошибка (ошибка репрезентативности)

    Разность между двумя средними

    Показатель достоверности

    Показатель достоверности разности

    Показатель достоверности Фишера (при дисперсионном анализе)

    Биометрия — процесс сбора, обработки и хранения данных о физических характеристиках человека с целью его идентификации(Большой юридический словарь, 2007).

    Киви Берд

    Принято считать, что современные биометрические методы, вроде идентификации по отпечаткам пальцев или радужной оболочке глаза, обеспечивают беспрецедентный уровень надежности и защиты. На самом деле это весьма далеко от реальности.

    Если заглянуть в четвертьвековой давности «Словарь иностранных слов» (издательство «Русский язык», 1984), то можно узнать, что биометрия — это специальный термин науки биологии для обозначения «совокупности приемов планирования и обработки данных биологического исследования методами математической статистики». Для уха человека современного не столь уж древнее определение звучит странновато.

    Ближе к телу

    Биометрия позволяет решать две основные задачи: аутентификация и идентификация людей. Еще одно активно разрабатываемое сейчас направление — автоматическое выявление угрожающих намерений человека в толпе по биометрическим особенностям его поведения. Для решения всех этих задач предложено и используется множество разных средств биометрического опознания, сильно варьирующихся по своим возможностям, стоимости, эксплуатационным ограничениям и степени надежности. Область биометрии переживает ныне столь бурный подъем, что характеристики многих систем удается улучшать на удивление быстро, но пока ни один из методов не может считаться абсолютно надежным. Для всех реально применяемых биометрических технологий имеются и неоднократно продемонстрированы соответствующие средства обмана.

    Существенные перемены в основном значении слов — это всегда интересный признак эпохи. Ну а сдвиг в восприятии вполне конкретного слова «биометрия» — это, можно сказать, еще и выразительный символ значительных перемен в человеческом обществе, где некогда доминировали идеи научного прогресса во имя всеобщего блага, а теперь все больше говорят о роли науки и технологий в деле укрепления национальной и общественной безопасности.


    В рекламе и на практике

    Технологии опознания людей по их биометрии — по лицу, пальцам или ДНК, по ирису (радужной оболочке) глаза или рисунку вен, по голосу, походке, манере работы с клавиатурой и так далее — сегодня переживают эпоху бурного расцвета. На рынок ежегодно выводится масса новых и старых, но радикально усовершенствованных систем опознания, однако для неспециалиста адекватно оценить их надежность — задача довольно сложная. По свидетельству же независимых экспертов, вследствие общей незрелости технологии, запущенной в дело чересчур поспешно, доля продукции, и близко не дающей того, что сулят недобросовестные изготовители, в этом секторе рынка намного выше, чем в других областях индустрии инфотехнологий.

    Аутентификация — проводимая с согласия человека проверка, что он действительно тот, за кого себя выдает. Обычно применяется для контроля доступа и в удостоверениях личности (биометрические замки, биометрические паспорта). Идентификация — установление личности без сотрудничества проверяемых, обычно через сравнение снятых с человека характеристик с теми, что хранятся в базах данных.

    При этом обманутыми оказываются отнюдь не только рядовые потребители, защищающие, скажем, биометрическими замками свой компьютер или магазинчик, но и вполне серьезные государственные учреждения. Пресса об этом сообщает нечасто, но порой информация все же просачивается.

    Так, в 2005 году британская тюрьма строгого режима Гленочил, где отбывают срок убийцы и другие опасные преступники, была вынуждена в срочном порядке отказаться от недавно установленной хайтек-системы безопасности на основе биометрических замков. В рамках модернизации, стоившей около £3 млн, все внутренние двери тюрьмы были оборудованы замками, отпирающимися без традиционных ключей — по отпечатку пальца надзирателя, наложенному на стеклянную панель и сопровождаемому вводом личного PIN-кода. Внешне все это выглядело замечательно, почти как в рекламе компании-продавца, однако в действительности надежность и безопасность подобных замков оказалась чистой фикцией.


    Один из заключенных по случаю продемонстрировал изумленным надзирателям, что легко может обманывать новые биометрические запоры и беспрепятственно ходить фактически по всему зданию. Тут же начатое расследование показало, что данный метод обмана техники был известен многим из 420 заключенных по меньшей мере месяц, из-за чего в разных зонах тюрьмы стали возможны криминальные разборки и сведения счетов. Единственным способом прекратить это безобразие стало возвращение к прежней системе механических замков, когда у каждого надзирателя имеется к ним связка собственных ключей.

    Из скупых сообщений прессы известно, что с аналогичными проблемами столкнулись и в других тюрьмах Британии, проводивших недешевую хайтек-модернизацию. И хотя администрация заведений не пожелала раскрывать способ, которым заключенные обманывали биометрическую систему, для специалистов по компьютерной безопасности в произошедшем не было абсолютно ничего удивительного или неожиданного. Личный PIN-код надзирателей содержал всего четыре цифры, которые внимательному глазу наблюдателя совсем несложно запомнить, ну а народных средств для обмана дактилоскопических — как и всех прочих биометрических — сенсоров существует великое множество.

    Методы биометрии

    Отпечатки пальцев Древнейший метод опознания, использовался тысячи лет назад в Вавилоне, Египте и Китае, систематически применяется с начала XX века. Миф об «абсолютной надежности» дактилоскопической экспертизы столь прочен, что по сию пору нет четко определенных вероятностей ошибок опознания, а эксперты говорят лишь, есть совпадение или нет. Главный недостаток дактилоскопии — сложности дистанционного снятия отпечатков, хотя новейшие технологии сканирования уже позволяют делать это на расстояниях порядка 5 метров. Лицо Метод опознания по лицу хорошо работает в задачах аутентификации, т. е. при сотрудничестве проверяемого, однако дает неприемлемо высокие проценты ошибок при разном освещении, повороте головы, переменах в мимике лица, не говоря уже об умышленном изменении внешности. Иначе говоря, все проведенные на сегодня попытки по внедрению систем опознания лиц для автоматического выявления разыскиваемых людей в толпе закончились неудачей. Радужка глаза По сравнению с пальцем глаз гораздо лучше защищен от повреждений, и при этом имеет намного более четкую и постоянную форму, нежели лицо. Главные достоинства технологии — быстрая скорость сканирования и низкий, в сравнении с другими методами, уровень ложных положительных опознаний. Основные недостатки — проверяемые обязаны смотреть строго в объектив камеры и опознание можно проводить только на небольшой дистанции, обычно до полуметра.

    Забавные игрушки

    Хотя биометрические средства опознания людей появились на рынке еще в конце XX века, резкий скачок в их повсеместном внедрении произошел после трагедии 11 сентября 2001 года. Власти США и многих других стран почему-то решили, что именно биометрия — одно из главных технических средств для борьбы с терроризмом и сохранения ценностей общества.

    Сетчатка глаза Сканирование кровеносных сосудов, расположенных в глазном дне, используется крайне редко. Среди причин — проверяемые должны идти на сотрудничество, область сканирования труднодоступная и мелкая, оборудование сложно в эксплуатации. Об обмане систем опознания по сетчатке сведений нет, поскольку в настоящее время данная технология не имеет коммерческого применения. ДНК Метод ДНК-идентификации на сегодня считается самым надежным и применяется главным образом в криминалистике. Но широкого коммерческого распространения не получил, так как 1) требует взятия физического образца (волоса, крови) вместо простого снимка или записи биометрической характеристики; 2) тестирование (пока) не может быть сделано в режиме реального времени; 3) каждый раз, когда система опознания должна верифицировать человека, необходимо брать очередной образец клеток с ДНК. Голос Метод основан на индивидуальной манере произносить те или иные звуки речи. Технология имеет много преимуществ: проста в эксплуатации, дешева, не требует специального оборудования, кроме стандартной компьютерной техники с обработкой звука. Главные недостатки: многие могут иметь похожие голоса и манеру речи, а голос конкретного человека меняется в зависимости от здоровья, эмоционального состояния или возраста, на качество опознания влияют характеристики микрофонов и состояние канала связи (при дистанционном опознании по телефону). Кровеносные сосуды Кровеносные сосуды имеют более высокую температуру, чем остальное тело, поэтому четко прорисовываются на инфракрасном снимке. Для опознания делают снимок уникального для каждого человека рисунка вен и других подкожных структур, как правило, в области кисти руки — запястье, ладонь или ее тыльная сторона. Наибольшее распространение данная система получила в Японии.

    Многие из независимых экспертов по защите информации с этой идеей категорически не согласились, поскольку биометрические средства безопасности вовсе не лишены недостатков, а их серьезные слабости отнюдь не являются секретом. Начиная примерно с 2002 года в узкоспециальных, как правило, изданиях, а изредка и в популярной компьютерной прессе регулярно появляются публикации о тотальном обмане и беспроблемном преодолении практически всех имеющихся на рынке средств контроля доступа на основе биометрии.


    Системы распознавания по радужной оболочке ненадежны. Злоумышленники научились обманывать их, поднося к камере фотографию «нужного» глаза в высоком разрешении

    Одно из самых впечатляющих исследований подобного рода появилось летом 2002 года, когда сотрудники германского компьютерного журнала «c"t» с помощью нехитрых подручных средств скомпрометировали сразу 11 систем биометрической верификации, работавших на основе трех базовых технологий — распознавания пальцев, лиц и радужной оболочки глаз пользователей. Выводы экспертов журнала вполне однозначны: все изучавшиеся системы приходится рассматривать скорее как забавные игрушки, а вовсе не «серьезные средства защиты», как позиционируют их фирмы-изготовители.

    Если говорить об обмане систем аутентификации пользователя по отпечатку пальца с помощью емкостного сенсора на «мышке» или клавиатуре компьютера, то здесь простейший способ обмана — повторное «оживление» уже имеющегося отпечатка, оставленного зарегистрированным пользователем. Для такого оживления остаточного отпечатка иногда бывает достаточно просто подышать на сенсор либо приложить к нему тонкостенный полиэтиленовый пакет, наполненный водой. Еще эффективнее срабатывает более тонкая технология, когда оставленный «жертвой» отпечаток на стекле или CD посыпают мелкой графитовой пудрой, лишний порошок сдувают, а сверху накладывают липкую ленту, фиксирующую характерный узор папиллярных линий. Прикладывание такой ленты обманывает не только емкостные, но и нередко более строгие оптические сенсоры. Наконец, «искусственный палец», отлитый в парафиновой форме из силикона, позволил исследователям преодолеть все из шести протестированных систем на основе дактилоскопии.


    Системы опознания по ирису глаза преодолевались ничуть не сложнее — подсовыванием фотографии глаза «жертвы» в хорошем разрешении. Похожими по сути приемами были скомпрометированы и все системы опознания по лицу — подсовыванием фотографии или экрана ноутбука с клипом, где снято лицо зарегистрированного пользователя.

    Изготовители биометрических систем наверняка пытаются работать над улучшением своей продукции, но пока изменить ситуацию не удается. В 2009 году на хакерской конференции Black Hat DC в США был сделан доклад «Ваше лицо — это НЕ ваш пароль», подготовленный сотрудниками Bkis, одной из главных фирм по компьютерной безопасности во Вьетнаме. Суть доклада — анализ конкретных систем опознания по лицу, широко применяемых в современных ноутбуках от известных брендов: VerifaceIII (Lenovo), SmartLogon (Asus) и Face Recognition (Toshiba). Все эти изделия продаются как эффективные методы защиты компьютера от неавторизованного доступа. Однако, как показали исследователи, им удалось без проблем обмануть все три системы — используя вместо предъявления лица либо фотографии зарегистрированных пользователей, либо даже снимки других людей, измененные с помощью графического редактора.


    Исследователи из Университета Пердью разработали методику идентификации с помощью масс-спектрометрического «сканирования» отпечатка. При этом играет роль не только рисунок, но и химический состав следа. Это позволяет отличать отпечатки, оставленные в разное время, поверх других, и предполагать, каких предметов касался подозреваемый до того, как оставил свой отпечаток.

    Риски баз данных

    Помимо систем контроля доступа, другим фундаментальным применением биометрии в безопасности являются системы автоматической идентификации, то есть установление личности человека по его биометрическим характеристикам путем их сличения с уже имеющимися материалами в базах данных. В настоящее время подобные базы во множестве стран стремительно разрастаются, не только массово накапливая информацию об отпечатках пальцев, лицах и ДНК миллионов людей, но и, бывает, объединяясь в гипербазы для тотального поиска. Поскольку всякий рост массивов анализируемых данных неизбежно влечет за собой и возрастание числа ошибочных совпадений, все чаще стали происходить случаи ложных опознаний — с серьезными последствиями для жертв таких ошибок.

    Одна из самых громких, вероятно, историй подобного рода — «дактилоскопическое» дело американца Брэндона Мэйфилда. Эта история началась при расследовании террористических взрывов в Мадриде 11 марта 2004 года, где важнейшей уликой для следствия стал пластиковый пакет с детонаторами к бомбам и с отпечатками пальцев террориста. Данные отпечатки были запущены по базам международной розыскной системы, и для одного из них принадлежащая ФБР США крупнейшая в мире дактилоскопическая база IAFIS («Объединенная автоматизированная система идентификации по отпечаткам пальцев») обнаружила в своих хранилищах нужное соответствие. Три собственных эксперта ФБР и еще один приглашенный со стороны квалифицировали находку как «стопроцентно надежное» и «абсолютно неоспоримое совпадение».


    Сопоставление индивидуальных пространственно-временных зависимостей в движении людей (анализ походки) оказалось бесперспективным. Метод иногда допускает автоматическое опознание людей в условиях плохой видимости, недостаточной, к примеру, для сканирования лица. В то же время анализ походки показал высокую степень ошибок в зависимости от обуви, длины одежды, степени опьянения человека и прочих сопутствующих условий.

    Выявленный в базе IAFIS отпечаток принадлежал орегонскому адвокату Брэндону Мэйфилду, который мало того что был женат на мусульманке-египтянке и ранее защищал в суде человека, подозревавшегося в терроризме, так еще и сам обратился в ислам. Поскольку личность Мэйфилда практически идеально вписывалась в образ исламского экстремиста, адвоката, ясное дело, сразу посадили за решетку. И кто знает, чем это могло для него закончиться, не отлови испанская полиция другого человека, алжирца Унана Дауда, у которого не один, а все отпечатки пальцев совпали со следами на пакете с детонаторами. Арестованного в Америке адвоката-мусульманина пришлось, конечно, с извинениями отпустить, но «безупречная» репутация дактилоскопической идентификации из-за этой истории оказалась сильно подмочена.

    Одновременно с ростом аналогичных централизованных баз с ДНК-данными начали поступать — также из США — известия о выявлении случайных совпадений в ДНК-профилях разных людей. Однако специфика генетической информации таит в себе риски и существенно иного рода: повышенный интерес к содержимому ДНК граждан проявляют те структуры, которым доступ к этой информации по закону не положен. К примеру, это могут быть страховые компании, желающие заранее знать о предрасположенности своих клиентов к определенным заболеваниям. Или же корпорации, при приеме или назначении сотрудника на ответственную должность пытающиеся собрать максимум доступной информации на кандидата. А централизованные ДНК-базы не только систематически накапливают подобную информацию, но и, как показывает практика, вполне могут пускать ее «налево».


    В 2007 году в Великобритании разгорелся скандал вокруг национальной (и одной из крупнейших в мире) базы данных, накапливающей ДНК-образцы граждан. База принадлежит FSS, службе криминалистических наук правительства, а ее постоянно растущий массив данных содержит около пяти миллионов образцов ДНК. В 2005 году проект был приватизирован — с государством в качестве главного владельца, а администрация занялась активным поиском направлений для коммерческого использования накапливаемой информации. Одновременно тем же самым решила подзаработать не только администрация. Последовавший вскоре судебный процесс стал разбираться с пятью сотрудниками FSS, которые занялись похищением программного обеспечения и собственно данных из базы с целью создания собственного коммерческого сервиса, предлагающего те же самые массивы ДНК всем интересующимся…

    Может быть и польза

    Хотя в данном обзоре вполне умышленно собраны негативные — куда реже освещаемые прессой — стороны биометрических технологий, было бы несправедливо ограничиться одними лишь недостатками. Любая технология сама по себе не является ни плохой, ни хорошей, ибо все зависит от того, как именно люди ее применяют. В полной степени это относится и к биометрии.

    Последние годы разработкой собственных приложений для биометрических технологий активно занимаются не только фирмы без-опасности, обслуживающие полицию или службы охраны, но и многие компании, выпускающие совсем другие товары повседневного употребления.

    Методы биометрии, не получившие широкого применения

    Динамический анализ подписи опознает человека по индивидуальной манере письма: переменам в давлении на перо, скорости движения пера между фиксированными позициями и так далее. Термография лица В картине тепла, излучаемого лицом человека, ток крови в сосудах под кожей формирует определенные структуры, которые можно регистрировать инфракрасной камерой. Метод ненадежен, т.к. на вид температурной карты лица влияют условия внешней среды и физическое состояние человека. Анализ походки Метод показал высокую степень ошибок в зависимости от обуви, длины одежды, степени опьянения человека и прочих сопутствующих условий. Исследования свернуты из-за бесперспективности направления. Геометрия руки или пальца Одно время активно разрабатывавшееся направление, не получившее, однако, популярности из-за меньшей надежности опознания по сравнению с отпечатками пальца или сканированием ириса. Форма уха Форма уха и структура хрящевой ткани в ушной раковине вполне индивидуальны и постоянны для каждого человека. Главное возражение против использования технологии — ухо часто бывает скрыто от сканирования головным убором или волосами. Резонанс черепа Через голову человека транслируются звуковые волны для выстраивания уникального сонарного профиля данного индивида. Сугубо экспериментальное направление исследований.

    Например, ныне функции опознания лиц уже довольно широко реализованы в цифровых фотоаппаратах целого ряда фирм вроде Canon, Pentax или Fuji. Встроенные в них программы поиска могут автоматически находить в картинке кадра, выбранного для съемки, человеческие лица по их характерным признакам — глазам, ушам, носу и т. д. Если лицо одно, камера сама может настроить фокус исключительно на него, если же лиц несколько, то может вычислить усредненный фокус для всех. Или, скажем, фирма Sony первой выпустила цифровую фотокамеру, которая может удерживать затвор от срабатывания до тех пор, пока люди в кадре не улыбнутся, поскольку специальная программа анализирует лица на предмет счастливого выражения — положения уголков рта, размыкания губ, мимических морщинок вокруг глаз.


    Другой пример интересного применения биометрии — новые версии программ iPhoto и Picasa для управления цифровыми фотоальбомами, куда их разработчики, Apple и Google соответственно, встроили функции распознавания лиц на снимках для удобного и быстрого поиска нужных фотографий. Отличие программ в том, что iPhoto работает на компьютере владельца и в процедуре настройки просит идентифицировать любым именем лишь тех людей, которых укажет хозяин альбома. Программа Picasa, с другой стороны, работает на серверах Google и при настройке пытается затребовать идентификацию ВСЕХ людей на снимке, причем их полными именами и с уникальными адресами электронной почты — очевидно, для организации перекрестных ссылок между альбомами разных владельцев. Не факт, что подобное «вторжение» в личный архив понравится каждому, но таковы уж, видимо, родовые особенности всех биометрических технологий.