Анализ и поиск информации

Робототехника

Более полный поиск по теме Вашего запроса (наберите его в окне поиска)

Об использовании данных приёмников глобальных спутниковых систем определения координат (систем глобального позиционирования) GPS / ГЛОНАСС, встраиваемых в видеокамеры, ноутбуки, мобильные телефоны, ИК-камеры и другую съёмочную и компьютерную технику, в качестве метаданных для структурирования видео- и аудио информации при её анализе, поиске и архивировании

Система идентификации личности по изображению лица была представлена на VIII Международном форуме “Технологии безопасности”. Разработчик - “Asia Software” (г. Алматы, Казахстан). Система поставляется в виде библиотек и описаний их интерфейсов. Комплект разработчика, реализующий функции биометрической идентификации личности, называется FRS SDK ver 2.1.
Скорость обработки изображений в режиме кодирования - менее 0,26 с, в режиме сравнения - 800 тыс. изображений в секунду. Размер биометрического вектора, используемого для хранения и сравнения - 300 Байт. Используемое количество памяти (RAM) для хранения биометрических векторов - 300 МБайт на 1000000 изображений. То же количество памяти используется на жестком диске для хранения биометрических векторов. Вероятность положительной идентификации при размере базы 1000000 изображений - 75-95%. Технические характеристики системы были получены при следующих условиях:
- значительные возрастные изменения человека (разница в возрасте - от 5 до 27 лет);
- вертикальные и горизонтальные повороты головы (10-25 град.);
- значительно отличающиеся условия съёмки (фон, освещение, контрастность, четкость, цветность и т. д.);
- существенные изменения внешности (усы, борода, бакенбарды, очки и т. д.).
System of identification of the person under the image of the personВ январе 2003 г. было завершено очередное тестирование системы. Тестовая база составила 454764 изображений лиц людей. Тестовая выборка состояла из 1000 случайно выбранных изображений, полученных в процессе реального производства и регистрации водительских удостоверений (первичное получение документа, замена при изменении категории, выдача дубликата). Изображения получены с разницей во времени до нескольких лет, при различных условиях съёмки и на различных типах видеокамер и цифровых фотоаппаратов. В результате тестирования получены следующие основные характеристики:
время кодирования изображения - 0,26 с;
скорость поиска по тестовой базе из 454764 изображений - 0,63 с;
процент автоматически закодированных изображений - 99,15%.
В режиме автоматической идентификации происходит автоматическое извлечение из тестовой базы одного единственного изображения, соответствующего предъявляемому для идентификации. Как видно из результатов тестирования, 84,8% искомых лиц находятся на первой позиции рекомендательного списка. При этом вероятность ложной идентификации FAR, например, для порога распознавания 0,65 (определяется пользователем в зависимости от требований к системе), составит всего 0,000013%, а вероятность неидентификации в автоматическом режиме FRR равна 34,5%. То есть, при пороге распознавания 0,65 автоматически идентифицируется 65,5% вышеуказанных тестов с вероятностью 1,3 ошибки на 10000000 изображений лиц людей (рис. 1).
В режиме экспертной идентификации происходит автоматическое формирование рекомендательного списка, ранжированного по степени идентичности с изображением, предъявляемым для идентификации. Принятие решение об идентификации является прерогативой эксперта:
- 84,8% “истинных кандидатов” попали на 1-е место;
- 89,7% “истинных кандидатов” оказались в числе первых 5-ти кандидатов;
- 92,1% “истинных кандидатов” оказались в первой десятке рекомендательного списка;
- 93,7% “истинных кандидатов” оказались в первой двадцатке рекомендательного списка;
- 95,2% “истинных кандидатов” оказались в числе первых 50-ти кандидатов.
Из результатов тестов видно, что даже в случае анализа экспертом только первых 10 изображений рекомендательного списка, полученного в результате поиска по базам данных порядка 500000, вероятность идентификации составит 92,1% (рис. 2). А. Барсуков, журнал "ТКТ" № 4, 2003 г. (через эту ссылку можно бесплатно скачать справочник)

СИСТЕМА INTEL AIM SUITE ПОЗВОЛЯЕТ ПОКУПАТЕЛЯМ ПОЛУЧАТЬ АДАПТИРОВАННУЮ, ПЕРСОНАЛИЗИРОВАННУЮ РЕКЛАМНУЮ ИНФОРМАЦИЮ
18 января 2012 г. – Современные покупатели получают большой объем различных рекламных сообщений, при этом рекламные кампании требуют оценки их эффективности. Для того чтобы решить эту задачу многие компании розничной торговли и рекламодатели приступили к использованию систем цифровых табло, которые позволяют точнее донести до покупателей суть рекламных сообщений и повысить эффективность данных инициатив. Интеллектуальные системы цифровых табло лежат в основе будущей трансформации рынка розничной торговли. По прогнозам расходы на приобретение подобного рода систем (аппаратное и программное обеспечение) увеличатся с 1,3 млрд. долларов США в 2010 г. до 4,5 млрд. долларов США в 2016 г.1
Intel® Audience Impression Metrics Suite (Intel® AIM Suite) – это интеллектуальная система на основе концепции Software-as-a-Service (SaaS), с помощью которой посетители магазинов смогут получать адаптированную информацию, предлагаемую в соответствии с их конкретными предпочтениями, а магазины смогут точно оценить эффективность своих маркетинговых инициатив. Приложение собирает различную информацию о покупателях, включая пол, возраст и покупательские предпочтения, и анализирует получаемые данные в режиме реального времени.
Intel AIM Suite позволяет магазинам и рекламодателям буквально мгновенно изменять отображаемую на табло информацию для того, чтобы посетители могли получать только интересующие их данные. Транслируемые сообщения точно соответствуют характеристикам целевой аудитории.
■ Принцип работы новой системы
Оптические датчики, установленные на цифровых табло, в режиме реального времени пересылают графические данные. ПО Intel AIM Suite анализирует полученную информацию и сопоставляет ее с образцом человеческого лица.
Алгоритмы обнаружения присутствия людей способны различить отдельные черты лица, включая расположение глаз и носа, для того, чтобы установить пол и возрастную группу проходящих мимо людей.
Программное обеспечение не сохраняет какие-либо личные данные людей и не записывает фото- или видеоизображения для того, чтобы сохранить анонимность посетителей магазинов.

ПРИМЕНЕНИЕ МЕТОДА АНАЛИЗА ГЛАВНЫХ КОМПОНЕНТ В СИСТЕМАХ ОХРАННОГО ВИДЕОНАБЛЮДЕНИЯ ДЛЯ ИДЕНТИФИКАЦИИ ЧЕЛОВЕКА ПО ИЗОБРАЖЕНИЮ ЛИЦА (Я. В. Рыбак, Санкт-Петербургский государственный университет телекоммуникаций им. проф. М. А. Бонч-Бруевича, Санкт-Петербург); APPLICATION OF THE METHOD OF ANALYSIS OF THE MAIN COMPONENTS IN SECURITY VIDEO SURVEILLANCE SYSTEMS FOR HUMAN IDENTIFICATION BY FACE IMAGE (Y. V. Rybak, Bonch-Bruevich Saint-Petersburg State University of Telecommunications, Saint-Petersburg) По докладу на 17-й Международной научно-технической конференции «СОВРЕМЕННОЕ ТЕЛЕВИДЕНИЕ»
На сегодняшний день идентификация личности по изображению лица является одним из приоритетных направлений развития биометрических систем. Такие биометрические показатели, как отпечаток пальца и рисунок радужной оболочки являются конфиденциальной информацией, в то время как изображения лица является общедоступным. Именно технология идентификации на основе изображения лица признана наиболее приемлемой для массового применения, так как она не требует физического контакта с устройством, ненавязчива, естественна и, в потенциале, может обладать высокой надежностью и скоростью. Кроме того, такой подход выгоден и по той причине, что может использоваться незаметно для окружающих в местах массового скопления людей.
Анализируя тенденции развития и применения биометрических технологий, можно заключить, что поиск решений таких мало исследованных задач, как верификация человека по фото с удостоверений личности и идентификация человека по его фотопортрету путём поиска в базе данных, очень актуален в настоящее время.
Наиболее перспективным из разрабатываемых на данный момент методов на мой взгляд является метод распознавания по форме лица. В данном статическом методе идентификации строится двух или трехмерный образ лица человека. С помощью камеры и специализированного программного обеспечения на изображении или наборе изображений лица выделяются контуры бровей, глаз, носа, губ и т. д., вычисляются расстояния между ними и другие параметры, в зависимости от используемого алгоритма. По этим данным строится образ, преобразуемый в цифровую форму для сравнения. Причем количество, качество и разнообразие (разные углы поворота головы, изменения нижней части лица при произношении ключевого слова и т.д.) считываемых образов может варьироваться в зависимости от алгоритмов и функций системы, реализующей данный метод [1].
При всём многообразии различных алгоритмов и методов распознавания изображений, типичный метод распознавания состоит из следующих компонент: преобразования исходного изображения в начальное представление, выделения ключевых характеристик и механизма классификации.
Кроме этого, построение метода распознавания опирается на априорную информацию о предметной области (в данном случае – характеристики лица человека), и корректируется экспериментальной информацией, появляющейся по ходу разработки метода [2].
Простейший вариант представления любого цифрового изображения в виде вектора в пространстве признаков предусматривает учёт значения каждого пикселя как координаты отдельной оси. Так, если изображение описывается матрицей пикселей M×N, то размерность такого пространства будет равна произведению M на N. Однако в связи с тем, что все человеческие лица схожи между собой (овальная форма с носом, ртом, глазами и т.д.), все векторы, описывающие изображения лиц, будут размещаться в узко ограниченной области указанного пространства. Поэтому при решении задачи идентификации человека по фотопортрету описание и хранение всего векторного пространства избыточно.
Таким образом, возникает задача построения пространства меньшей размерности, в котором описываются только изображения человеческих лиц. Одним из вариантов является пространство, базисными векторами которого служат главные компоненты всех содержащихся в нем изображений лиц. Размерность такого оптимального пространства заранее определить невозможно, но она намного меньше размерности исходного пространства всех изображений. Из вышесказанного вытекает, что главной целью метода главных компонент является значительное уменьшение размерности пространства признаков таким образом, чтобы оно как можно лучше описывало «типичные» образы, принадлежащие множеству портретов. В случае применения данного метода для идентификации лиц образами будут служить фотопортреты из обучающей выборки.
Метод главных компонент (Principal Component Analysis, PCA) применяется для сжатия информации без существенных потерь информативности. Он состоит в линейном ортогональном преобразовании входного вектора X размерности N в выходной вектор Y размерности M, N. При этом компоненты вектора Y являются некоррелированными и общая дисперсия после преобразования остаётся неизменной. Матрица X состоит из всех примеров изображений обучающего набора. Решив уравнение, получаем матрицу собственных векторов, где - ковариационная матрица для X, а - диагональная матрица собственных чисел. Выбрав из подматрицу, соответствующую M наибольшим собственным числам, получим, что преобразование, где - нормализованный вектор с нулевым математическим ожиданием, характеризует большую часть общей дисперсии и отражает наиболее существенные изменения X [3].
Example of images of own vectors Рисунок 1. Пример изображений собственных векторов (Principal Component Analysis)
Выбор первых M главных компонент разбивает векторное пространство на главное (собственное) пространство, содержащее главные компоненты, и его ортогональное дополнение.
Применение для задачи распознавания изображений имеет следующий вид. Входные вектора представляют собой отцентрированные и приведённые к единому масштабу изображения. Собственные вектора, вычисленные для всего набора изображений, называются собственными объектами. С помощью вычисленных ранее матриц входное изображение разлагается на набор линейных коэффициентов, называемых главными компонентами. Сумма главных компонент, умноженных на соответствующие собственные вектора, является реконструкцией изображения.
Для каждого изображения лица вычисляются его главные компоненты. Обычно берётся от 5 до 200 главных компонент. Остальные компоненты кодируют мелкие различия между эталоном и шум. Процесс распознавания заключается в сравнении главных компонент неизвестного изображения с компонентами всех остальных изображений. Для этого обычно применяют какую-либо метрику (простейший случай - Евклидово расстояние). При этом предполагается, что изображения, соответствующие одному эталону, сгруппированы в кластеры в собственном пространстве. Из базы данных (или тренировочного набора) выбираются изображения-кандидаты, имеющие наименьшее расстояние от входного (неизвестного) изображения.
Дальнейшее совершенствование заключалось в использовании метрики Махаланобиса и Гауссовского распределения для оценки близости изображений. Для учёта различных ракурсов в этой же работе использовалось многомодальное распределение изображений в собственном пространстве.
Так же метод главных компонент применяется для обнаружения лица на изображении. Для лиц значения компонент в собственном пространстве имеют большие значения, а в дополнении собственного пространства – близки к нулю. По этому факту можно обнаружить, является ли входное изображение лицом. Для этого проверяется величина ошибки реконструкции, чем больше ошибка, тем больше вероятности, что это не лицо.
Исследователями отмечен факт, что при наличии в наборе изображений лиц вариаций, таких как раса, пол, эмоции, освещение, будут появляться компоненты, величина которых в основном определяется этими факторами. Поэтому по значениям соответствующих главных компонент можно определить, например, расу или пол человека.
При изменении ракурса изображения, наступает момент, когда этот метод при распознавании начинает реагировать больше на ракурс изображения, чем на межклассовые отличия. Классы при этом больше не являются кластерами в собственном пространстве. Это решается добавлением в обучающую выборку изображений в различных ракурсах.
При этом собственные вектора теряют лицеподобную форму. В работе, развивающей эту идею, показано, что при изменении угла поворота головы, главные компоненты вычерчивают кривые в собственном пространстве, которые однозначно идентифицируют лицо человека и по которым можно провести распознавание. Эти кривые были названы собственными сигнатурами. Отмечалось, что в сочетании с методами генерации изображений в новых ракурсах по одному примеру изображения, этот метод имеет неплохие перспективы. По максимумам собственных сигнатур было так же отмечено, что наибольшую информативность имеет изображение лица в полупрофиль.
Аналогичные трудности имеют место при изменении условий освещения. Одна из попыток решения этой проблемы описана в следующем параграфе. Вычисление набора собственных векторов отличается высокой трудоёмкостью. Один из способов – это свёртка изображений по строкам и столбцам, и дальнейшая работа с полученными результатами. В такой форме представление изображения имеет на порядок меньший размер, вычисления и распознавание происходит быстрее, но восстановить исходное изображение уже невозможно.
Основное преимущество применения анализа главных компонент - это хранение и поиск изображений в больших базах данных, реконструкция изображений.
Основной недостаток - высокие требования к условиям съёмки изображений. Изображения должны быть получены в близких условиях освещённости, одинаковом ракурсе. Должна быть проведена качественная предварительная обработка, приводящая изображения к стандартным условиям (масштаб, поворот, центрирование, выравнивание яркости, отсечение фона).
При использовании метода анализа главных компонент достигается до 92% точность распознавания лиц в базах с большим количеством лиц [4].
Литература
1. Кухарев Г. А. Биометрические системы: Методы и средства идентификации личности человека. СПб.: Политехника, 2001. - 240 с.
2. Самаль Д. И., Старовойтов В. В. - Подходы и методы распознавания людей по фотопортретам. - Минск, ИТК НАНБ, 1998. - 54с.
3. Головко В. А. Нейроинтеллект: Теория и применения. Книга 1. Организация и обучение нейронных сетей с прямыми и обратными связями - Брест:БПИ, 1999, - 260 с
4. Moghaddam B. and Pentland A. Probabilistic Visual Learning for Object Representation. IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, pp. 696-710

The robot - sniper changes a life for amazement of crowd / Робот-снайпер меняет жизнь на изумление толпыРоботы-полицейские. Важнейшей офисной задачей остаётся безопасность, поскольку, несмотря на наличие охранников, продолжаются вооруженные ограбления, захват заложников и т. п. Соответственно, поднимается вопрос о роботизации оборонительных средств: например, о сопряжении систем распознавания лиц со встроенными в интерьер офиса установками нервно-паралитической нейтрализации точечного действия. Тогда, при возникновении нештатной ситуации, такой комплекс сможет, благодаря картотеке лиц, вычленить преступника из среды служащих и посетителей, после чего автоматически применить по нему парализующее средство. То, насколько применимы для этой цели существующие системы распознавания лиц, обсудим на примере технологии Facelt фирмы Visionics.
Технология в качестве метода кодирования лица использует анализ локальных характеристик - LFA, представляя изображения лица в виде локальных, статистически обоснованных стандартных блоков данных. LFA является математическим методом, основанным на утверждении о том, что все лица могут быть получены из минимального набора конструктивных элементов. Эти конструктивные элементы берутся из репрезентативной выборки лиц с использованием статистических методов, охватывающих являющиеся локальными многочисленные пиксели лица, и универсально представляют лицевые формы - но не лицевые особенности, обычно известные. Фактически, в наличии получается намного больше элементов построения лица, чем количество самих частей лица. Однако, оказывается, что синтезирование данного изображения лица с высокой точностью требует весьма малой толики (12-40 характерных элементов) от полного набора. Идентичность лица определяется не только характерными элементами, но и способом их геометрического объединения (учетом их относительных позиций). Полученный математический код индивидуальной идентичности (шаблон Faceprimt) содержит информацию, отличающую лицо от миллионов других.
Система работает с любым источником визуальной информации, включая фото и видео - живое и в записи (число записей не ограничивается). Фокусируясь на внутренней области лица, алгоритм может использовать встроенные механизмы компенсации естественных изменений лица, его мимики, лицевых волос и прически; разработана и программа сопоставления лиц без очков и с очками - когда глаза невидимы или скрыты бликами. Система не требует специального фона или освещения, хотя оптимальным является рассеянный окружающий свет и лучше, если объект не освещается сзади, хотя задний свет может быть компенсирован регулировкой усиления в видеокамере. Как и от фона, распознавание не зависит от цвета изображения - цветной или серой его палитры.
Технические характеристики. Скорость обнаружения лица - 200 мс, сопоставления “один в один” - менее секунды, сопоставления “один ко многим” - 60 млн/мин из памяти и 15 млн/мин с жесткого диска. Размер Faceprint - 84 Байт. Технология разработана для распознавания фронтальных изображений лиц: лицо может быть найдено, пока оба глаза видимы - до 45 град. в любом направлении от фронтального; при отклонении от 15 до 35 град потеря возможностей минимальна, при отклонении более 35 град. потеря возможностей существенна. Минимум глубины изображения - 8 бит. Система может обнаружить лицо, состоящее всего из 20 х 30 точек или занимающее менее 1% от полной области изображения. Распознавание в незначительной степени зависит от разрешения лица: оптимальное распознавание происходит при размере лица 80 х 120 точек. Порог ложного допуска системы - менее 1%, порог ложного “не допуска” - менее 1%, порог равной ошибки - 0,68%.
Мы получили цифры, которые характеризуют, если можно так выразиться, вероятность “судебной ошибки”. Что это означает на практике? Недавние поправки к законодательству о необходимой обороне общество восприняло с долей иронии - по вине легкомысленных комментаторов. Но теперь, по прочтении данной статьи, дело выглядит иначе: как раз роботизированные системы смогут реализовать нормы более жесткого к преступникам законодательства. И, по существу, только степень погрешности распознавания лиц является препятствием, чтобы заменить точечное нервно-паралитическое оружие на боевое, например, лазерное, точность которого уже исключает “судебную ошибку”. А. Барсуков, журнал "ТКТ" № 4, 2002 г. (через эту ссылку можно бесплатно скачать справочник)

Аппаратно-программный комплекс VOCORD FaceControl предназначен для автоматического некооперативного выделения изображений лиц из панорамного видеопотока и их последующего распознавания. «Некооперативность» распознавания — особенность системы VOCORD FaceControl, работающей c использованием камер высокого разрешения VOCORD NetCam. Системе «некооперативного» распознавания для выделения изображения лица не требуется специального позиционирования человека в поле зрения видеокамеры. Возможности системы: Автоматическое выделение и сопровождение лиц в поле зрения видеокамеры; Автоматическое формирование базы фотографий лиц, попавших в поле зрения камеры; Система выделения изображений лиц может работать в двух режимах: сохранение видеоизображения лица в течение всего времени нахождения в области видимости и сохранение для каждого лица одного наилучшего скриншота; Автоматическое распознавание лиц по результатам сравнения с базой эталонных изображений; Трансляция видеоизображений по сети. Основным качественным преимуществом системы является высокое разрешение регистрируемых изображений лиц за счет использования камер VOCORD NetCam с разрешением от 1,3 до 5,1 мегапиксел. Особенности VOCORD FaceControl: высокое разрешение системы видеозахвата; прогрессивная развёртка (отсутствие эффекта гребенки при движении); видеоанализ на базе некомпрессированного потока видеоданных; компрессия данных производится после видеоанализа. Высокая достоверность распознавания достигается с помощью применения новых технологий: Высокое разрешение полученных изображений лиц; Распознавание не по одному, а по серии изображений; Предварительная цифровая обработка изображений: нормализация яркости, контраста, устранение паразитных бликов и контровой засветки; Использование стереозрения и возможность создания 3Dмоделей лиц; Работа в инфракрасном спектральном диапазоне, в том числе с ИК-подсветкой. В видеокамерах VOCORD NetCam используются сенсоры с разрядностью АЦП 10 и 12 бит. Кроме этого, технологии двойного экспонирования, пространственного и временного накопления сигнала позволяют существенно расширить динамический диапазон исходных видеоданных. VOCORD FaceControl — одна из систем выделения лиц, которая удовлетворяет требованиям стандарта ГОСТ Р ИСО/МЭК 1979452006 «Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Данные изображения лица» на качество цифровых видеоданных, пригодных для проведения автоматической биометрической идентификации личности по изображению лица. Данный биометрический стандарт полностью гармонизирован с аналогичным международным стандартом ISO. Важно отметить, что ГОСТ предъявляет жесткие требования к разрешению изображения, которым, в частности, не удовлетворяют изображения, получаемые с традиционных камер стандарта PAL/NTS. По материалам VOCORD

Технология трёхмерного распознавания лиц A4Vision включает в себя камеру, позволяющую получать цифровые копии (слепки) трёхмерной поверхности объекта, измеренные с субмиллиметровой точностью, а также алгоритмы обработки и анализа трёхмерных данных. Зарегистрированная камерой поверхность лица содержит антропометрические характеристики, которые не меняются с возрастом и уникальны для каждого. Технология работает в различных условиях освещенности, включая темноту, устойчива к поворотам головы, осуществляет распознавание живого лица, производит верификацию в режиме реального времени 10 раз в секунду. Биометрический шаблон основан на твёрдых тканях (строение черепа), компактен (2,5 КБ). Время распознавания - 1/4 c.

Технология адаптивного распознавания лиц SmartID, компонентом которой является алгоритм синтеза выражений лиц (предсказание того, как лица людей будут выглядеть в разных условиях окружающей среды), разработана фирмой XID Technologies. Технология использует ключевые точки лица, присваивая им числовые значения, по которым вычисляется "вектор особенности". К двухмерному изображению лица применяются преобразования, соответствующие различным условиям освещенности, погоды, макияжа и пр. В результате синтезируется множество вариантов одного оригинального изображения лица и каждому из вариантов соответствует свой вектор особенности. По материалам Computerworld

Говоря об электронных вычислительных машинах, принято удивляться прежде всего' скорости, с которой они производят вычисления. 500 тысяч или 1 миллион операций в секунду — это хотя и поражает воображение, но мало что еще говорит непосвященному. Но возможность складывать и перемножать десятки тысяч многозначных чисел в секунду — это понятно каждому.
Действительно, удивительное быстродействие — важнейшее свойство электронных машин, но ведь дело не только в этом: если бы машины могли лишь быстро считать, им суждено было бы остаться помощниками инженера, математика или бухгалтера в вычислительной работе. Однако уже в пятидесятых годах стало ясно, что это не так. Все большее значение приобретали их логические «способности», возможность производить на машине не только арифметические, но и сложные логические операции. Использование машин для перевода с одного языка на другой в информационно-справочной работе, для построения доказательства теорем геометрии и т. д. — это все примеры сложной работы машин, при которой почти не приходится «производить расчеты» в обычном понимании этого слова.
Здесь машина оперирует не с цифрами, а с высказываниями, утверждениями, правилами и т. д. Но в любом случае — производит ли машина арифметические расчеты, или выполняет логические — все строго регламентировано «заложенной» в нее программой. В связи с этим до самого последнего времени принято было считать, что машина может освободить человека от выполнения только такой умственной работы, по поводу которой человек может дать точные указания о порядке и способах ее выполнения; именно такие сведения и содержит программа, закладываемая в машину.
В самые последние годы удалось еще более расширить возможности машин. Ведь человек (учитель) может передать другому человеку (ученик) свое умение не только тогда, когда понимает, как надо выполнять ту или иную работу, и сможет поэтому составить необходимые инструкции; средством передачи умения может быть не объяснение, а показ. В этом случае учитель должен лишь делать, и он передаст последнему свой навык, умение, даже не понимая, в чем их суть. Ведь чтобы научить ребенка различать буквы, от учителя требуется лишь самому различать их. Свое умение он может передать ученику не объяснениями, а просто показывая разные начертания букв и называя их.
Поясним это. Представим себе снова, что учитель умеет различать буквы, но не понимает, как это следует делать, то есть не может написать инструкцию — специальную программу распознавания букв. Однако в его силах показать машине (подобно тому как он это делает с учеником) начертания различных букв и сообщить ей условным кодом, какая это буква. Если же после некоторого числа примеров машина сама сможет правильно различать эти буквы (в том числе новые их начертания, не показывавшиеся ей ранее), то говорят, что ее научили распознавать буквы. Эта, казалось бы, фантастическая задача в самое последнее время и примерно одновременно успешно решена учеными как у нас (Институтом автоматики и телемеханики и другими институтами), так и за рубежом.
Не только теоретически, но и убедительными экспериментами было показано, что машину можно учить, как ребенка, и что человек может передать машине свое умение даже в тех случаях, когда он сам не понимает, как он это делает. Казалось, таким образом достигнут предел расширения возможностей машин. Однако успех обучения машин распознаванию образов лишь подтолкнул ученых к новым опытам. Ведь даже если бы никто не учил ребенка различать буквы, он обнаружил бы все же, что буквы бывают разные, и научился сам различать, классифицировать их, хотя, быть может, и не смог бы их читать (произносить). Можно ли воспроизвести на машинах этот же процесс «обучения без учителя»?
Представим себе, что машине показывают много различных начертаний букв А и О, но не сообщают каким-либо образом ни того, какие это буквы, ни даже того, что в показе есть различные буквы. Машина может выдавать на выходе два символа, например 1 и 2. Каждый раз при показе изображения буквы машина отвечает одним из этих символов. Первое время она выдает их бессистемно, но постепенно ответы машины становятся все более упорядоченными, и она начинает реагировать, выдавая каждый раз, например, 1, когда показывают буквы А, и 2 — при показе буквы О, несмотря на разные начертания показываемых ей букв. В таких случаях можно говорить о «самообучении» машины или об обучении ее «без учителя».
В Институте автоматики и телемеханики (технической кибернетики) проведены успешные опыты обучения машины «без учителя». Сначала заготовили большое число написанных разным почерком цифр (0, 1, 2, 3 и т. д.), Машине показывали случайную выборку из этого. Показываемые изображения можно поделить на классы и подразделения. «Вот буква А», «Это буква О», «А вот это опять буква А» и т. д. Другой пример такого рода — типичное указание мастера подмастерью: «Я тебе ничего говорить не буду, а ты смотри и учись».
Можно ли так же учить машину? Может ли машина заменить человека в какой-либо умственной работе, если он сам не знает, как ее надо делать и поэтому не может написать программу-инструкцию, но все же выполняет ее и поэтому способен учить машину показами? В последние годы' такая проблема живо интересовала ученых и в СССР и за рубежом. В качестве типичного примера рассматривалась задача обучения так, как это сделал бы человек. Таким же образом машина научилась различать картографические знаки — условные изображения поселков, леса, полей и т. д.
Успешное решение задачи обучения машины без учителя позволило посягнуть на исключительное право человека, наблюдая явление, вырабатывать признаки или простейшие понятия.
Вообразим теперь, что учитель хочет объяснить ученику, как надо различать буквы, а не только демонстрировать их ему. Например, он скажет: «Буква «а» всегда имеет кружочек и длинную палочку справа». В этой фразе фигурируют слова «кружочек», «палочка», «длинная» и «справа». Естественно, что объяснение такого рода может быть понято учеником, только если ему ясны эти простейшие понятия, то есть если ранее выработан общий для учителя и ученика язык, на котором можно формулировать признаки.
Вернемся к машине. Чтобы сообщить ей эту же инструкцию, надо, чтобы и машина в какой-либо форме владела такими простейшими понятиями, как «кружочек», «палочка», «справа» и т. д. Под силу ли ей, наблюдая изображения, самой выработать такие понятия?
Иначе говоря, способна ли машина сама выработать язык, на котором она смогла бы формулировать признаки? Если бы это удалось, то остался бы лишь один шаг, и притом не самый трудный, до того, чтобы машина сама, наблюдая букву «а», «поняла» бы, что «буква «а» — это кружочек и длинная палочка справа», то есть выработала бы признак. Интересно отметить, что все понятия, выработанные машиной, оказались подобными тем, которые обнаружил бы и человек, — их легко описать на обычном языке. Такими понятиями оказались, например, «вертикальная палочка», «уголок, обращенный острием влево», «дужка, выгнутая вниз» и т. д.
После того, что говорилось выше об обучении без учителя, эта задача уже не кажется совсем фантастичной. И действительно, в Институте автоматики и телемеханики впервые в мире проведены успешные опыты, в ходе которых машина выработала простейшие понятия. Машине показывают различные изображения, например рукописные буквы. Через специальный фотоэлементный глазок машина «просматривает» не все написание буквы, а ее фрагменты, автоматически выбирая их в местах наибольших световых контрастов. Эти отобранные фрагменты машина классифицирует без учителя. Таким образом, она сама относит, например, к одному классу «уголки», к другому — «горизонтальные черточки», к третьему классу — «перекрестья» и т. д.
Опыты такого рода ставились над разными изображениями — рукописными буквами, цифрами и даже написанными от руки словами (использовались слова «Саша» и «рама»), топографически и знаками. И каждый раз машина выделяла и обозначала специальным кодом именно такие простейшие понятия, которые выделил бы и человек. Из сборника "Эврика", 1967 год

Третье условие состоит в том, чтобы ты был осведомлен о недугах, явных, и тайных, по признакам их. И это обстоит так, что при покупке не будь невнимателен и с первого взгляда не соглашайся, потому что с первого взгляда очень хорошо, то, что окажется безобразным, и очень безобразно то, что окажется хорошим. А затем лицо человеческое не всегда имеет свой естественный вид: то оно клонится к красоте, а то к безобразию. Хорошенько смотри на все части тела, чтобы что-нибудь от тебя не укрылось. Много бывает скрытых недугов, которые собираются появиться, но еще не появились и появятся только через несколько дней. И у них тоже есть признаки.
Если цвет лица немного желтоват, губы бледные, а глаза тусклы, то это доказательство геморроя. Если веки всегда опухшие – признак водянки. Краснота глаз и надутые жилы на лбу – признаки падучей. Медленное движение ресниц и частое подергивание губ – признак меланхолии, Искривление костей носа и неровность его – признак фистулы и носовых кровотечений. Очень черные волосы, и крайне твердые и густые, причем местами они чернее, показывают, что волосы у него крашеные. Если на теле в разных местах, где обычно клейма не ставят, увидишь клеймо или поставленную метку, то гляди, нет ли под ней знаков проказы. Бледность губ и желтизна глаз – признак желтухи.

Кей-Кавус, «Кабус-наме» (Глава XXIII «О покупке рабов и ее правилах»), XI в.

Темы серии справочников «Компоненты и решения для создания роботов и робототехнических систем»

The robot - trainer liked to feel the robot - medalist for field cap between her legs / Робот-тренер любил пощупать робота-медалистку за пилотку между её ногHXTE84 - методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой.  XFRY46 - OpenCV и распознавание дыма на видео. GJTUT46 - робот следующий за объектом, движущемся на микроконтроллере. CGY56 - высокоскоростной робот "приемник-передатчик." SDG64E - настройка видеокамеры с вариообъективом. BF75T - способ обнаружения распознавания и определения координат объекта и устройство для его реализации. NMG5TD - исследование процессов захватывания объектов роботом. FYU55R - наземный мобильный комплекс поисково-спасательных работ. HIOO809 - манипулятор управления камерами наблюдения. XGERY67 - оптико-электронная система поиска и сопровождения цели. FG657D - оптимальный объем памяти системы автоматического сопровождения движущегося объекта. VH68765 - преобразователь наклона с температурной компенсацией для систем контроля и ориентации объектов. GY6U5F - разработка распределенной система управления. CVHRY5RF - CU55ET6 - распознавание национальности по внешности. BVKUI7J - видеосенсор: баланс белого, вычисление. GH7R4Y6 - приборы регистрации и управления: DARPA, инерциальная навигация. VJTR674V - аппаратура обнаружения электронных средств слежения. DUR858R -  программный код для распознавания запаха. HDE4R9 -  биометрическая поисковая система для консулов.

Система распознавания лиц немецкой фирмы ZN Vision Technologies AG позиционируется в сфере видеонаблюдения - но сфера эта сегодня малорезультативна, о чем предупреждал учебник "Советская криминалистика", где сказано, что "буржуазная криминалистика используется полицейскими органами не столько в борьбе с уголовной преступностью, а больше для оказания помощи господствующим классам". А учебнику этому доверие полное, поскольку, будучи изданным в 1962 г., он исчерпывающе комментирует работу современнейшего механизма нейронального распознавания черт лица - изобретения, отмеченного государственной Премией инноваций в немецкой науке. Потому мы и рекомендуем эту систему больше для архивов изображений общего назначения, что в описании её модуля ZN-Phantomas сказано об исключении влияния, в числе внешних факторов, старения лица - а учебник не придаёт существенного значения возрастным изменениям внешности, поскольку "в раскрытии преступлений обычно фигурируют небольшие временные отрезки". Или же, в описании модуля ZN-SmartEye сказано, что вероятность распознавания при хорошем качестве изображения лежит в пределах 80% - а учебник объясняет причину такой недоработки: "Знакомого человека легче узнать в фас или в 3/4 оборота, но если ставится задача по имеющемуся описанию или фотографии опознать человека не виденного ранее, или сравнить внешность на нескольких фотографиях, более важное значение приобретают признаки профиля".
Из описания ZN-SmartEye следует, что он экстрагирует из толпы лица людей, в течение примерно 2 с проводя их сравнительный анализ с базой данных. Относительно реакции системы на изменение внешности очками, бородой и т. п. даётся такой критерий: до тех пор, пока человека узнают знакомые ему люди, система также не ошибается. В процессе сравнения лицо располагается фронтально к объективу, а сравниваемые кадры должны быть выполнены с разрешением не менее 100 х 100 пикселей. На примере модуля ZN-Face III, снабженного системой оптических фильтров (для распознавания имитации внешности) показано, как путём "захвата в сеть" происходит распознавание лица при изменённых мимике, позе и масштабе.
Robot - drop has looked at him with a kind of the Mongolian conqueror / Робот-падаль взглянул на него с видом монгольского завоевателяГермания - страна высоких демократических ценностей, причем апогей демократии там состоялся, как известно, в 1933 г. Этим, видимо, и объясняется, почему даже сфера высоких технологий не обходится без такого неотъемлемого атрибута демократии, как понятие "лицо криминальной национальности" - о чем свидетельствует набор персонажей на рисунке, взятом из буклета фирмы: именно их создатели устройства сочли убедительной иллюстрацией к работе модуля ZN-Phantomas, который "выбирает самозванцев и скрывающихся под чужой фамилией персон"
Вероятно, западноевропейские полицейские, точно так же, как теперь и их восточноевропейские коллеги не видят принципиальной разницы между ассирийцами, папуасами, бедуинами, кроманьольцами и прочими горцами. Учебник и предупреждал, что "теоретические положения буржуазной криминалистики никогда не отличались и не отличаются глубиной разработки", а выбор методов расследования, по мнению одного из авторитетов западной криминалистики, "всецело зависит от интуиции и вдохновения, а результаты следствия от простой удачи". Избыток вдохновения теперь и мешает патрулям проверять документы так же скрупулёзно, как это делал капитан СМЕРШ (и как теперь может сделать только робот-эксперт) в знаменитом сюжете из романа В. Богомолова "Момент истины": при этом капитан рассматривал этнографические особенности исключительно с оперативной точки зрения. Любой другой подход правоохранителей будет означать "обычное житейское узнавание по чертам внешности", а оно "производится по общему впечатлению, которое нередко бывает ошибочным".
Казалось бы, в 1962 г. у нас был тоталитаризм, однако, он не помешал авторам учебника признать, что "научно-технические средства разрабатываются буржуазными криминалистами более обстоятельно и на достаточно высоком уровне". И действительно: зачем повышать квалификацию личного состава, если ZN-Phantomas, используя возможности SQL баз данных, производит, в том числе, и селекцию по признаку национальности. А законна ли селекция именно по этому признаку с точки зрения прав человека? Смотрим ответ в учебнике "Советская криминалистика": "Буржуазные криминалисты считают, что их наука не имеет отношения к юридическим дисциплинам и что рекомендуемые ими методические и технические средства не связаны законом". А. П. Барсуков, журнал "ТКТ" № 9, 2001 г. (через эту ссылку можно бесплатно скачать справочник, авторские материалы которого разрешено использовать для написания таких работ, как эссе, сочинение, доклад, реферат, курсовая работа, дипломная работа, бакалаврская / магистерская работа, диссертация)