Анализ и поиск информации

Робототехника
Техника видео, кино и телевидения

Более полный поиск по теме Вашего запроса (наберите его в окне поиска)

Прогноз от справочника "Компоненты и решения для создания роботов и робототехнических систем". Средства анализа и поиска видеоинформации, конечно, еще нуждаются в совершенствовании, но, в принципе, у них уже наступает "кризис жанра" - если говорить о распознавании лиц или автомобильных номеров, или транспортного трафика. Рост вычислительных мощностей компьютерной техники и рост возможностей хранилищ данных, развитие средств аналитики (всему этому и посвящен портал "Системы Электронной Памяти") уже позволяют делать комплексный анализ ситуации, объединив результаты распознавания всех вышеперечисленных, а также ряда других сцен. Разумеется не ради абстрактной идеи, под которую сложно получить серьёзное финансирование, но ради конкретной проблемы. В частности, данные о ходе подготовки к спортивным событиям в Великобритании позволяют судить, что там будет создана система комплексного анализа ситуации на основе "мелкоячеистой" сети видеокамер. Судя по всему, фундаментом проекта в конечном итоге будет "прецедент Литвиненко" - во всяком случае, в пользу этого говорят обстоятельства расследования знаменитого отравления: тогда были проанализированы все маршруты, встречи, фигуранты, контакты и т. п. Теперь же, с помощью мощных компьютеров, анализирующих видеоинформацию от камер видеонаблюдения, можно будет проследить маршруты и личные встречи всех интересующих (и даже многих пока не представляющих интереса) лиц, с учетом того, как они будут менять средства передвижения, внешность, одежду. Случай с Литвиненко послужит правовым основанием для такого рода действий, а также этот случай говорит в пользу того, что английские (и не только английские) спецслужбы (и не только спецслужбы) считают, что абсолютное большинство выходцев из России, и вообще из СНГ - это агенты либо ФСБ, либо ОПГ, либо Пекина, либо Тегерана, а значит, тотальная слежка за ними даст возможность последующего давления, которое принесёт желаемые результаты, учитывая . что большинству из этих выходцев обратной дороги нет.

Технология анализа и поиска видеоинформации. Компания «Весть-Метатехнология» организовала для нашего журнала встречу с генеральным менеджером по Европе корпорации Excalibur Technologies Й. Флетчером. Он продемонстрировал возможности Excalibur Screening Room — эффективной технологии анализа и поиска видеоинформации. Её эффективность обусловлена применением в ней как традиционной для Excalibur Technologies технологии нечеткого поиска APRP, так и оригинальной технологии анализа видеоинформации VAE.
VAE (Video Analysis Engine) обеспечивает автоматическое построение storyboard (последовательности кадров, наиболее адекватно отражающей суть видеофрагмента) для вводимой видеоинформации, выделяя набор характерных (по тому или иному критерию) кадров. Что касается APRP, то она действительно традиционна, и «ТКТ» о ней уже рассказывал в № 11 за 1996 г. достаточно полно. Причем завершался тот рассказ прогнозом относительно того, что не взявшие на вооружение подобную технику телевизионные и кинематографические «федеральные службы могут исчезнуть окончательно». Совпадение или нет, но ФСТР, управлявшаяся публикой, принципиально игнорировавшей наши выступления, сгинула. Те  же российские организации, которые внедрили у себя поисково-аналитические технологии, прогрессируют — и в этом мы достоверно убедились в ходе данной встречи,
Let's adopt their methods? (the Robot - armoured personnel carrier has shown a finger for a back) - If you have in a kind the West, it in other side. / Будем перенимать их методы? (Робот-бронетранспортёр показал пальцем за спину) - Если ты имеешь в виду Запад, то он в другой стороне.О том, на чем базируется этот прогресс, говорит следующий показатель: обеспечиваемая технологией скорость поиска видеоинформации по индексированному массиву объёмом 5 Тбайт составляет 5-15 с при степени достоверности, соответствующей сертификату, выдаваемому подобным системам. Под «индексированным массивом» в данном случае понимается вышеупомянутый набор характерных кадров, 1 Мбайт которых соответствует примерно 6 Мбайтам исходного видеоматериала (но это соотношение весьма ориентировочно и сильно зависит от выбранного порога индексирования). В итоге образуются как бы два массива: проиндексированный (потому и «как бы», что он может быть не один — в зависимости от числа критериев индексации), которым, например, телекомпания оперирует при подготовке новостийных и иных программ, и другой, состоящий из оригиналов видеоматериала. Важно отметить, что по мере внедрения Excalibur ScreeningRoom мировыми телерадиокомпаниями всё более актуальным становится вопрос: а что делать с оригиналами, представляющими из себя скоропортящиеся киноплёнку и магнитную ленту? Умеренный бюрократический подход возобладал на Би-Би-Си, где решено сохранить большинство оригиналов и по мере необходимости брать их в архиве по индексным ссылкам. Как и в каком виде хранить оригиналы — этот вопрос на Би-Би-Си решается отдельно и достаточно вдумчиво, так что г-н Флетчер даже посетовал на консервативность этой организации. Другое дело, сказал он, PBS: там не выстраивают долгосрочной стратегии по оригиналам, а, рассматривая вопрос о приобретении ScreeningRoom, требуют от неё для себя главного — обеспечить поиск в очень больших объёмах видеоинформации. Кстати, рассказывая в № 8 за 1998 г. о большом проекте PBS по организации интерактивного телевещания, мы упоминали, что удалось добиться существенного снижения производственных издержек, — и теперь понятно, за счет чего. Но, добавил Й. Флетчер, когда речь идет о больших проектах СМИ, являющихся сегодня многофункциональными информационными структурами, особенно в сфере новостного производства, там всё же для начала стремятся организовать текстовый поиск — как на Эй-Би-Си, где приобрели все модули Excalibur, что, конечно, представляет собой очень большое капиталовложение. Но что касается средних размеров российской телекомпании, если она, например, хочет усовершенствовать только подготовку новостных видеоматериалов, это обойдётся ей в 20-40 тыс. долл. (причем стоимость софта здесь невелика относительно стоимости «железа»). Базовую схему мы приводим ниже, а о деталях её работы — в следующем выпуске AVR. А. П. Барсуков, журнал "ТКТ" № 1, 2000 г. (через эту ссылку можно бесплатно скачать справочник)

МЕТОДЫ КОМПЕНСАЦИИ ДВИЖЕНИЯ ОБЪЕКТНЫЙ МЕТОД (А. А. Корябин, ТвГУ, Тверь); METHODS OF MOTION ESTIMATION OBJECT METHOD (A. A. Koryabin, TvGU, Tver) По докладу на 17-й Международной научно-технической конференции «СОВРЕМЕННОЕ ТЕЛЕВИДЕНИЕ»
Изначально понятие компенсация движения в видеоизображениях появилась в алгоритмах сжатия, ибо они основывались на: избыточности информации (плавное изменение кадров) и особенности восприятия глаз (большая часть информации глазом воспринимается через контуры объектов).
Различают следующие типы избыточности информации в видеоизображениях:
1. пространственную – схожесть значений соседних пикселей;
2. временную – попиксельная разность двух соседних кадров в основном равна нулю, за исключением областей, где наблюдается движение.
Но простая попиксельная разность кадров не подходит при резком изменении объекта (фона), поэтому алгоритмы сжатия используют разность текущего кадра и скомпенсированного.
Скомпенсированный кадр – можно получить из соседнего кадра (обычно предыдущий) и информаций о движении, обработанный так, что получается наиболее схожим с текущим кадром.
Тем не менее, проблема компенсации движения присутствует и в других областях, связанных с обработкой видеоизображений, таких как: деинтерлейсинг – восстановление изображения на один момент времени на основании нескольких кадров, алгоритмы шумоподавления.
Классификацию алгоритмов компенсации движения можно провести по следующим критериям:
1. тип анализируемого элемента – кадр, блоки, или объекты;
2. тип движения – операции параллельных сдвигов, поворотов, масштабирования;
3. мера принятия решения.
Как правило, в качестве меры выступает – сумма абсолютных разностей (САР) и сумма квадратов разностей (СКР):

As a measure acts - the sum of absolute differences and the sum of squares of differences

где Obj – множество объектов компенсации, FOrig и FComp - яркость исходного и скомпенсированного кадра, соответственно.
Пиксельный метод [1] – В качестве элемента компенсации выступает пиксель кадра, рассматриваемый класс преобразований – линейные сдвиги. Минимизируется обычно суммарная ошибка компенсации для всего кадра (Displaced Frame Difference, DFD):
Usually total mistake of indemnification for all staff is minimized,
где F(p,n) – яркость кадра номер n в точке p = (x,y)T, d(p)=(dx,dy)T - вектор смещения для точки (x,y)T. Результатом алгоритма для текущего кадра с номером n будет такой набор векторов d0 для каждой точки кадра p = (x,y)T, что DFD(d0,n) = min DFD (d, n) по всевозможным наборам d.
Подход основан на предположении, что яркость можно приблизить линейной функцией от положения точки в кадре. Это предположение оправданно только для сравнительно небольшой окрестности этой точки, что существенно снижает область применимости данного метода и позволяет ему корректно оценивать лишь небольшие сдвиги.
Это ограничение можно преодолеть, оценивая не сам вектор сдвига, а его разность с некоторым вектором предсказания, который с большой вероятностью расположен ближе к искомому вектору, чем нулевой.
Основные недостатки метода – высокая сложность, низкая точность и большой объем метаинформации, описывающей движение. Данный метод принят за эталонный для оценки эффективности разрабатываемых новых методов.
▪ Сопоставление блоков – В качестве элемента компенсации выступает прямоугольный блок кадра, рассматриваемый класс преобразований – линейные сдвиги
Основное предположение метода – за время, проходящее между двумя последовательными кадрами, объекты в сцене и их местоположение изменяются незначительно. Тогда в окрестности любой точки кадра это изменение с достаточно высокой степенью точности можно приблизить параллельным переносом этой окрестности на некоторый вектор. На самом деле, подавляющее большинство обычных видеопоследовательностей удовлетворяют этому ограничению, за исключением участков резкой смены сцены, то есть характер движения объектов можно считать почти всюду непрерывным.
Критерии работы метода:
1. Текущий кадр разбивается на непересекающиеся блоки одного размера.
Для каждого блока текущего кадра в небольшой окрестности ищется наиболее «похожий» на него блок в предыдущем кадре. Наиболее похожий блок определяется с помощью метрики, как правило, с помощью суммы абсолютных разностей (САР) и суммы квадратов разностей (СКР).
2. Вектор, на котором достигается минимум выбранной функции ошибки, считается вектором смещения для данного блока.
Модификации этого подхода отличаются способом нахождения минимума функции ошибки компенсации по окрестности блока, в которой ищется похожий блок из предыдущего кадра, такие как:
a) Полный перебор.
Достигается наилучшее качество приближения, то есть минимальное значение ошибки компенсации за счет перебора всех значений векторов смещения из допустимой области с подсчётом ошибки компенсации для каждого из значения и выбор того вектора, на котором достигается минимум ошибки. Этот подход считается эталонным, однако, практическое его применение нерационально из-за слишком большой вычислительной сложности.
b) Перебор по шаблону.
Предположим, что функция САР(d = (u,v)T ,n), строго монотонно сходится к своему минимуму в рассматриваемой окрестности блока. Тогда проверкой нескольких точек в данной окрестности можно локализовать этот минимум. Алгоритм, по которому эти точки выбираются, называется шаблоном.
Минимальное число проверок обеспечивает ортогональный шаблон, сокращающий за каждый шаг, состоящий из двух проверок, область поиска вдвое. Но целесообразнее использовать прямоугольный и восьмиточечный шаблоны, которые уменьшают вероятность найти локальный минимум вместо глобального, так как функция ошибки компенсации почти никогда не бывает монотонной (обычно имеет множество локальных экстремумов).
Методы, основанные на шаблонах, демонстрируют неплохую скорость работы, однако часто находят локальный минимум вместо глобального. Как преимущество можно отметить то, что поиск вектора движения для каждого отдельного блока не зависит от результатов поиска в соседних блоках и в предыдущем кадре, что делает метод более эффективным при очень интенсивном и сложном движении.
c) Трехмерный рекурсивный поиск.
В этом методе проверяемое подмножество области поиска формируется для каждого блока отдельно на основе результатов поиска для соседних, уже обработанных блоков, и блоков предыдущего кадра. Основная идея состоит в том, чтобы использовать гладкость поля векторов движения для сокращения времени поиска (согласно наблюдениям, поле векторов является достаточно гладким как в пространстве, так и во времени, за исключением разрывов, возникающих на границах объектов, движущихся не одинаково, и ситуации смены общего плана). Поэтому в большинстве случаев для нахождения глобального минимума во всей области поиска бывает достаточно проверить вектора смещения для нескольких соседних блоков и уточнить их в небольшой окрестности.
Данный метод прост и довольно эффективен, хотя качество компенсации не всегда бывает удовлетворительным, особенно при интенсивном и сложном движении.
Рассмотрим в качестве примера самый последний стандарт в области кодирования видео MPEG-4 (часть 10), либо ISO/IEC 14496-10, либо Н.264/AVC (AVC – Advanced Video Coding) [2]. Высокая эффективность стандарта обусловлена, в том числе и улучшением эффективности компенсации движения. От нее зависит энергия разностного кадра. Чем точнее скомпенсировано это движение, тем меньше энергии, а значит, выше будет коэффициент сжатия. Однако, минусы метода «Сопоставление блоков» очевидны: границы объектов обычно не лежат на прямоугольнике, движение также, как правило, не бывает горизонтальным или вертикальным. С увеличением размера блока увеличивается вычислительная эффективность и уменьшается объем бит, отводимый на кодирование векторов движения.
Однако, одновременно ухудшается точность компенсации, а, следовательно, и увеличивается энергия разностного изображения. Таким образом, налицо необходимость оптимизации, и в Н.264 реализован адаптивный выбор размера блока от 4х4 до 16х16 пиксела, а точность указания вектора доведена до ? пиксела (за счет предварительной интерполяции). Если уж кадры совсем не похожи друг на друга, то компенсация движения не используется, а применяется внутрикадровое кодирование.
▪ Объектный подход – При блочном подходе для каждого блока компенсация производится независимо от соседних блоков. Исходя из того, что движение по сцене осуществляют объекты (в общем случае), необходимо, чтобы компенсация по всем блокам одного и того же объекта давала один и тот же результат (т.е. поле векторов движения по одному объекту не должно содержать случайных выбросов). Это возможно, если, к примеру, каждый блок кадра будет соотнесен с тем или иным объектом движения сцены и уже оценивать суммарную ошибку компенсации по всем блокам объекта движения.
Таким образом, возникает задача быстрой и точной идентификации объектов движения на сцене.
Предлагается следующий подход к оценке движения объектов сцены. Разностное изображение кадров с заданным порогом [3] по сути определяет перечень объектов сцены, участвующих в движении плюс небольшой шум, остающийся из-за колебаний освещенности в разных участков сцены и присутствующих в кадре шумов не совсем погашенных заданным порогом. Сегментация выделенных объектов движения и незначительного шума позволит идентифицировать движущиеся объекты, соотнести их с блоками и отсеять непогашенный заданным порогом шум. В результате будут идентифицированы области сцены положение, которых изменилось (объекты сцены) и области, которые не меняются (фон). Поскольку фоновая часть сцены чаще всего меняется незначительно, то по существу можно накапливать информацию о фоновой части сцены продолжительное время, пока она не претерпит существенных изменений, что, например, положительно сказывается на снижении информации подлежащей кодированию (сжатию). По сути получаем из входного видеоряда для отдельного его участка, ограниченного изменением фоновой части сцены: фон с значительным снижением шума, движущиеся объекты и вектора движений данных объектов.
Таким образом, предлагается в рамках предложенного метода следующее:
1. Накапливать информацию о фоне во временной плоскости (условием временных рамок накопления информации служит резкое изменение фоновой части сцены) и аккумуляцией её в виде единого фона для некоторой последовательности кадров. Кроме того, возможно аналогичное накопление также информации об движущихся объектах сцены с учетом характера их движения.
2. Проведение одновременного построения разностного изображения сцены с заданным порогом и сегментации выделяемых объектов движения (для сегментации предлагается использовать информацию о восьмисвязаной окрестности пиксела изображения). Кроме того, на этапе сегментации отфильтровывается оставшийся после разностного сравнения с заданным порогом шум.
Использование предложенного метода позволит повысить качество компенсации движения за счет сглаживания случайных выбросов в поле векторов движения, присущих блочным методам. Накопление информации во временной плоскости позволит снизить уровень зашумленности сцены, а также позволит повысить степень сжатия видеоряда.
Для повышения работоспособности и качества работы предложенного метода необходимо выработать критерий, на основании которого будет происходить ограничение временной плоскости накопления информации по сцене. В зависимости от типа решаемых практических задач данный критерий может отвечать разным требованиям. Так, например, для видеофильмов качество изображения играет весьма важную роль. Соответственно, требования будут предъявляться к качеству изображения всей сцены (контрастность, освещенность). А вот, например, для охранных систем в первую очередь, полезна будет информация, позволяющая идентифицировать объекты движения, в то время как значение фона будет второстепенно.
Кроме того, для повышения быстродействия необходимо разработать алгоритм, позволяющий проводить за один проход сканирования кадра как построение разностного изображения и сегментации на основе восьмисвязанной окрестности пиксела, так и, в придачу к ним, процедуру установления соответствия между объектами движения и блоками, на которые разбивается кадр и из которых, таким образом, объекты движения и состоят.
Также интерес представляет разработка подходов к накоплению информации по объектам движения (аналогично накоплению информации о
фоновой части сцены) во временной плоскости с учетом характера их движения.
Литература
1. G. de Haan "Progress in motion estimation for video format conversion". IEEE Transactions on Consumer Electronics, Vol 46, No 3 ,Aug 2000.
2. Вадим Грибунин, «MPEG-4 vs H.264», журнал "Технологии Защиты" №4, 2008.
3. Виктор Гаганов, Антон Конушин. Сегментация движущихся объектов в видеопотоке.// Компьютерная графика и мультимедиа, Выпуск №3(7), 2004.

To me to hide there is nothing! (thus robot - man's advantage has flung open and the jacket has again begun to smell) / Мне скрывать нечего! (При этом робот-мужское достоинство распахнул и снова запахнул пиджак)Анализ и поиск видеоинформации (начало в разделе «Электронные архивы»). Господдержку в США и Великобритании получило применение технологии Excalibur ScreeningRoom для целей видеонаблюдения (ВН). Как пример — технология осуществляет в реальном времени последовательное сканирование (посредством видеокамеры) толпы в местах, где движение людей упорядочено: эскалаторы, турникеты и т.п. Ключами для анализа снимаемого материала служат хранящиеся в базах данных фотографии разыскиваемых людей, объектов, номера автомобильных знаков и т.д. Достоверность распознавания — вопрос постоянного совершенствования технологии. Г-н Флетчер привел такой пример: на одном из этапов развития технологии проводилось «опознание» футболистов по фотографии их команды. Система опознала 9 из 11 футболистов, плюс лежащий перед ними мяч. То есть террорист, в принципе, мог замаскироваться, неся возле своей головы большой розовый грейпфрут — но и в таком случае среди критериев поиска можно было задать «обнаружение людей с большими грейпфрутами». Позже, уже в России, проводились эксперименты по настройке системы на «похожесть» лиц. На человека надевали шапку, очки, прикрывали лицо шарфом — при этом достоверность распознавания достигала 40-50%. Кроме того, приемлемый процент распознавания достигался при изменении ракурса лица примерно на 20%.
На рисунке показаны особенности поиска по изображению человека. Мленький кадр в левом нижнем углу — изображение-запрос. Верхняя линейка кадров — результат поиска с указанием степени близости результата к запросу: «100%» здесь относятся к кадру, использованному в качестве запроса; рядом с числом процента — названия видеоматериалов, содержащих данные кадры.
It is possible to go mad from a robot - bolero / От робота-болеро можно осатанеть Анализ и поиск видеоинформации (начало в разделе «Электронные архивы»). Для работающего с Excalibur ScreeningRoom журналиста исследуемый массив предстает в виде двух мультимедийных составляющих: картинки и текста. Текст — это фоновый код для поиска видеоизображения, поэтому в ранее рассмотренном процессе редактирования важное значение имеет вычленение текстового материла из видеозаписи (этот же текстовый материал при необходимости ложится в основу субтитров). Поиск проиндексированной видеоинформации, уже хранящейся в VideoAsset Server, осуществляется как по кадрам из storyboard1 при помощи Visual RetrievalWare, так и по тексту (субтитры, название и пр.) при помощи RetrievalWare — профессиональной системы управления знаниями. В частности, в версии 7.0 этой системы, имеющей графические словари (рис. I), мультимедийные запросы могут формироваться по следующим принципам: слова и изображения смешаны в одном запросе; объединение слов и изображений в сложное логическое выражение; при ранжировании результатов поиска учитываются и слова, и изображения. На рис. 2 приведен пример сложного поиска.
The robot - semantic server pulled all doors successively: " Where to go? " / Робот-семантический сервер дёргал все двери подряд: "Куда идти?" / The robot - prostatitis pulled all doors successively: " Where to go? "Дополнением к Excalibur RetrievalWare служит разработанный компанией « Весть-Метатехнология» Русский Семантический Сервер — совокупность программных средств и информационных ресурсов, позволяющих осуществлять полнотекстовый поиск с учетом специфики русского языка. РСС производит морфологический анализ и выстраивает семантическую сеть. Разработка семантической сети (рис. 3) — основная проблема представления языковых знаний, от качества решения которой зависит точность семантического поиска. Использование семантической сети для описания русского языка в совокупности с оригинальными алгоритмами снятия омонимии позволяет оперировать не текстом, а смыслом документов. К настоящему времени семантическая сеть русского языка, поддерживаемая РСС, включает более 40 тыс. смысловых групп.
To the robot - claustrophobia have put in hands a parachute and push out from the helicopter / Роботу-клаустрофобии сунули в руки парашют и вытолкали из вертолёта Анализ и поиск видеоинформации (начало в предыдущем выпуске AVR). Суть технологии Excalibur ScreeningRoom в том, что сканируются только те кадры, в которых возникают изменения, существенные с точки зрения поисковой задачи. На рис.1 — пример автоматически созданной Storyboard, представляющей собой последовательность таких кадров. Если в последовательности кадров состав и характер объектов не меняется, то запоминается лишь один кадр этой последовательности. Как только появляется кадр с чем-то новым и это новое превышает заданный порог, происходит сканирование данного кадра, и он в свою очередь становится индексным для видеоряда. Причем, уменьшив разрешение индексного кадра, можно увеличить скорость поиска по запросу. Запрос может быть не только описательным, но и графическим: по элементу изображения, по кадру, по блоку кадров. Ключом, к примеру, может стать набор фотографий человека, снятого в разных ракурсах и в разном макияже. В этом особенность технологии адаптивного распознавания образов APRP (Adaptive Pattern Recognition Process), позволяющей находить искомое, даже когда задан не полностью адекватный ключевой символ. Сравнение информации в бинарном виде происходит методом «нечеткого поиска», и, как выражаются у нас с некоторых пор, обнаруживается «человек, похожий на...».
The robot - thief has bought once the old book and, having found out about it, everyone began to drag different second-hand articles for work and to suggest her to buy / Робот-воровка купила однажды старую книгу и, узнав об этом, все стали тащить на работу разное старьё и предлагать ей купитьРис.2
Настройка чувствительности на «существенность» изменения в кадре — самая творческая часть работы со ScreeningRoom. Порогом может служить что угодно: появление нового лица или объекта, изменение сюжета, освещенности, масштаба, движение камеры, резкий обрыв либо плавный переход видеофрагмента, жанровая принадлежность видеофрагмента и т.д. (на рис.2 показано, как происходит просмотр построенной по заданным критериям Storyboard в окне стандартного web-броузера; для каждого кадра указано время, прошедшее с начала фильма). Есть и «ручное вмешательство»: когда идет прогон видео и кадр оцифровывается по желанию редактора. При этом, происходит ли отбор кадров автоматически или вручную, подразумевается, что отобранные кадры, даже обладающие пониженным разрешением, можно сами по себе демонстрировать в эфире, если их содержание достаточно исчерпывающе рассказывает о том, о чем рассказали бы и соответствующие им видеофрагменты.
Ahead going robots - characters let off branches, and back they whip on eyes / Впереди идущие роботы-персонажи отпускают ветки, а задним они хлещут по глазам Рис.3
В число основных операций, относящихся к редактированию видеоинформации, входят: разбиение длинного видеофрагмента на несколько коротких, удаление лишних видеофрагментов, добавление и редактирование ассоциированной с видеофрагментом текстовой информации (аннотаций и т.п.), создание списка решений для склеивания видеофрагментов. На рис. 3 показано редактирование метаданных, представляющих собой структурированную информацию обо всем ролике и об отдельных кадрах. (Продолжение — в разделах «Видеонаблюдение» и «Теле- и радиожурналистика») А. П. Барсуков, журнал "ТКТ" № 2, 2000 г. (через эту ссылку можно бесплатно скачать справочник, авторские материалы которого разрешено использовать для написания таких работ, как эссе, сочинение, доклад, реферат, курсовая работа, дипломная работа, бакалаврская / магистерская работа, диссертация)

ВИДЕОДЕТЕКТОРЫ
1. ДЕТЕКТОР ДВИЖЕНИЯ И НАПРАВЛЕНИЯ является фундаментальным детектором. Он срабатывает на появление движения в кадре, обнаруживает движущиеся объекты и определяет направление их движения. Систему можно настроить на регистрацию движения не только во всем кадре, но и лишь в определенной его области, а также применить группу детекторов движения с различными параметрами: чувствительность, размер, контрастность и др.
При настройке системы можно задать еще один параметр – направление движения, по которому детектируется перемещение объекта в кадре. Таких направлений в ВидеоIQ7 восемь: влево, вправо, вверх, вниз и четыре диагональных. Детектор используется там, где в определенные периоды времени люди или автомобили должны двигаться только в одну сторону, либо на участках, где вход или выход посторонним запрещен, и соответственно найти эти фрагменты по данным параметрам.
Например, технология поиска MomentQuest с помощью детектора движения и направления помогает выявить, кто из рабочих на предприятии с повышенными требованиями безопасности, где перемещение людей по территории достаточно жестко контролируется, выйдя в положенное время из цеха, попытался вернуться обратно.
2. ДЕТЕКТОР ЛИЦ оповещает о появлении в кадре лица. В основу работы детектора положен алгоритм каскадного распознавания образов. Он позволяет детектировать лицо среди множества объектов и используется для определения нахождения в охраняемой зоне человека и «захвата» изображения его лица. Например, расположенная на проходной телекамера может фиксировать всех проходящих через турникет людей с занесением изображения их лиц в базу. С помощью FaceQuest – технологии распознавания изображения похожих лиц – можно в короткое время найти определенных людей, проходивших через этот турникет.
3. ДЕТЕКТОР ОСТАВЛЕННЫХ ПРЕДМЕТОВ оповещает о появлении или исчезновении в кадре предмета. В любом офисе система видеонаблюдения может круглосуточно контролировать любые по размеру площади и передавать сигнал тревоги в случае, если подозрительный предмет будет ею обнаружен.
Система интеллектуального поиска MomentQuest, используя возможности детектора оставленных предметов, легко обнаружит, например, ноутбук, который исчез со стола. Другой пример: обнаружение неправильно припаркованного автомобиля – это тоже результат работы детектора оставленных предметов. Несанкционированная парковка – проблема для мегаполисов: благодаря действию детектора оставленных предметов такой автомобиль будет немедленно обнаружен. По материалу Galfort

Видеосенсор движения VMD01 служит для детекции двигающихся объектов в видеосигналах стационарных камер. При этом применяется самоадаптирующийся, многоступенчатый сенсорный алгоритм, который может использоваться во внешней и внутренней области. Видеосигнал контролируется в пределах чувствительной площади, положение, размер и распределение которой свободно может быть настроено. При появлении детектируемого объекта, который целенаправленно движется через изображение, включается сигнал тревоги. Изменения в изображении, создаваемые кустами, деревьями, листьями подвижной травой и воздействиями атмосферных условий, не вызывают сообщений. Детектированные объекты ограниченно представляются в аналоговом исходящем сигнале и движение объекта наносится на карту на основе траектории. К тому же изображение в момент сигнала тревоги, а также изображения до и после сигнала тревоги сохраняются в сенсоре и могут быть вызваны.
Способ детектирования видеосигнализатора движения Как видео сенсор VMD01 адаптируется к контролируемой сцене, так что подавляются возможные нежелательные сообщения, в то время как одновременно действительные ситуации тревоги надежно распознаются. VMD01 детектирует изменения видео сигнала и исследует их причины, так что может быть принято дифференцированное решение о тревоге на объекте. Для повышения надежности детектирования сенсор оценивает не только изменения видео сигнала во времени, но и текстурные признаки и движения.
Детектированные объекты в видеоизображении обозначаются цветом. Обозначения становятся видны в сигнале в реальном времени на видеовыходе, а также в сохраненных тревожных изображениях. При этом желтая кайма сигнализирует о позиции, в которой объект вызвал сигнал тревоги и красная кайма показывает актуальную позицию. Зеленая сопровождающая линия помогает проанализировать ход события. Для нескольких отслеживающих объектов на карту наносятся соответственно отдельные сопровождающиеся линии. При подключении ч/б камер представляются контрастные ч/б линии.
В приборе может быть сохранен ряд сигналов тревоги. В зависимости от режима обслуживания это самый первый сигнал тревоги или самый последний, еще не подтвержденный, сигнал тревоги. Изображения запоминающего устройства при сигнале тревоги выдаются на аналоговом видеовыходе как неподвижные изображения. Прокрутка вперед и назад возможна на приборе или дистанционно. В показе отдельных кадров в запоминающем устройстве изображений при сигнале тревоги перемещенные линии через 5 секунд отфильтровываются. Таким образом изображение представляется совершенно свободно. Указание для изображений до и после сигнала тревоги мерцает, в то время как линии отфильтрованы. При дальнейшей навигации в запоминающем устройстве линии снова показываются. О находящихся в очереди сигналах тревоги сигнализирует реле сигналов тревоги. Таким образом обеспечивается, детекция следующих объектов. Может быть сконфигурировано, сигнализирует ли контакт о детекции объекта весь период детекции или только импульс о начале детекции.
Могут быть настроены три отдельных режима обслуживания. Они различаются по виду подтверждения сигналов тревоги и представления в случае тревоги. В частности это:
1. остановка сигнала тревоги: автоматически
- Нормальная эксплуатация: изображение в реальном времени на видеовыходе
- Детекция объекта: перемещенные маски объекта в реальном времени на видеовыходе (самый первый сигнал тревоги в устройстве для запоминания изображений).
2. остановка сигнала тревоги: вручную
- Нормальная эксплуатация: изображение в реальном времени на видеовыходе
- Детекция объекта: перемещенные маски объекта в изображении в реальном времени на видеовыходе (самый последний не подтвержденный сигнал тревоги в устройстве для запоминания изображений).
3. остановка сигнала тревоги: вручную
- Нормальная эксплуатация: изображение в реальном времени на видеовыходе
- Детекция объекта: автоматическое переключение межу устройством по запоминанию изображений при сигнале тревоги / вызываемым изображением при сигнале тревоги с перемещенным маскированием объекта на видеовыходе (самый последний не подтвержденный сигнал тревоги в устройстве запоминания изображений).
При рассмотрении рядов оператор может в любое время выбирать изображение сенсора в реальном времени и снова возвращаться назад к устройству по запоминанию изображений при сигнале тревоги. Только когда сигнал тревоги подтвержден (на обслуживающем элементе или дистанционно) устройство по запоминанию изображений переписывается. В режиме обслуживания 1 (автоматическая остановка) запоминающее устройство все же переписывается при повторной детекции.
Для конфигурации на сигнале видеовыхода выдается управляемая через меню, многоязычная, графическая поверхность для оператора и может быть представлена на CCTV-мониторе. Обслуживание происходит через мышь, которая подключается через серийный интерфейс. Конфигурация отделена от обслуживания, так как она осуществляется только через обслуживающий элемент или дистанционно. Доступ к меню к тому же защищен паролем. Настройка видеосенсора имеет три ступени:
• Определение чувствительной площади
• Ввод минимального размера объекта (с учетом перспективы)
• Задание разрешенного направления движения, при котором не должен быть подан сигнал тревоги (обратное направление и настройка областей допуска возможны)
Для конфигурации сенсора в распоряжении находятся два комплекта параметров, которые могут переключаться через входящий контакт. Сверх этого без переконфигурации сенсора могут, например, в зависимости от времени применяться иные чувствительные области или разрешенные направления движения. Далее через меню оператора должны быть настроены еще режим обслуживания, язык оператора (английский, французский, немецкий, испанский, голландский, итальянский или португальский) и параметры сигнала исходящего контакта. Через серийный интерфейс данные конфигурации могут быть сохранены на ПК и оттуда снова загружены. На лицевой панели размещены два индикатора. Они обозначают следующие ситуации: Указатель эксплуатации (зеленая лампа включена / выключена); Сенсор изменения резкости; Стоящий в очереди сигнал тревоги (красная лампа мигает); Системная ошибка (зеленая лампа мигает); Помеха видеосигнала (мигающая зеленая и красная лампочка); дополнительно соответственно зажигаются символы отсутствующего видеосигнала, слишком темной сцены, и соотношение сигнал/шум.
На обратной стороне корпуса выведены следующие контакты и гнезда: Вход контакта l для переключения в положение «резко»  и «нерезко»; Вход контакта II для переключения комплектов параметров; Выход открытого коллектора l для сигнализации детекции объекта (конфигурируется: импульс 1 секунды или периодические импульсы или пока имеется детекция объекта); Выход открытого коллектора II для сигнализирования помехи видеосигнала; Реле l для сигнализирования помехи прибора (контакт покоя); Реле II для сигнализирования стоящего в очереди сигнала тревоги (при автоматическом подтверждении не менее 1 сек.); Контакты для дистанционного обслуживания обслуживающего элемента (отдельные контакты для поворота влево, поворота вправо и нажатия клавиши) для обслуживания устройства для запоминания изображения при сигнале тревоги и для подтверждения сигнала тревоги (время включения подтверждения: не менее 3 сек.)
Рабочие характеристики: Автоматическое приспособление видеосенсора к контролируемой сцене (самоадаптирующийся); Включение сигнала тревоги только при значимых, направленных движениях в изображении; Автоматическое подавление сигнала тревоги при движении травы, деревьев, веток, дождя, снега, облаков и т.д.; Автоматическое подавление сигнала тревоги при изменении освещения всего изображения; Автоматическое подавление сигнала тревоги при небольших движениях камеры, например движении опоры; Перспективное распознавание объектов; Распознавание и подавление сигнала тревоги при движении / мелких животных; Рамки объекта в изображениях до, во время, а также после сигнала тревоги с точностью до точки изображения вокруг изображения (маскирование); Движение объекта обозначено зеленой сопровождающей линией; Цветные маски объекта (желтый первая детекция, красный актуальная позиция); при подключенном ч/б сигнале соответственно контрастные ч/б линии.; Подключение черно/белых, инфракрасных или цветных камер стандарт: PAL/CCIR или NTSC/EIA, подключение: BNC (BAS/ FBAS:0,7-1Vss, 75 Ом); Показ изображения в реальном времени на видеовыходе с перемещенными масками объектов при детекции объекта; Показ изображения при сигнале тревоги на видеовыходе с перемещенными масками объектов и нумерацией изображений во время сигнала тревоги (1 изображение при сигнале тревоги, 5 изображений до и 10 изображений после сигнала тревоги); Контроль:
- отсутствия видеосигнала
- закрывания камеры
- ослепления камеры
- слишком слабого освещения сцены
- соотношение сигнал/шум
Автоматический контроль функционирования сенсора; 2 комплекта параметров, внешне переключаемые; 2 индикатора (зеленая и красная)
Помехи. Происходит автоматическое приспособление к следующим помехам: воздействия погоды дождь, лужи, снег, ветер; глобальные изменения освещения вследствие движений облаков, теней, молний, бликов; движений деревьев, веток, листьев, движущейся травы, мелких животных, насекомых, пауков и т.д.; небольшие колебания камеры; связанные с временем года изменения положение солнца, изменения растительного покрова
Настройка видеосенсора движения в зависимости от сцены. Области изображения, подверженные непрерывным изменениям изобразительного сигнала, как напр. двигающиеся деревья, лужи или тени, адаптируют свою чувствительность в пределах времени 1 мин. после первого включения и не вызывают нежелательных сообщений. Области, которые ни в какое время не должны контролироваться, должны быть отделены через настройку чувствительных площадей. Таким образом дается повышенная устойчивость к помехам и детекционная чувствительность к помехам. Отражающие площади, такие как окна или металлические поверхности, должны быть исключены из чувствительной площади. Детекция объектов должна быть получена с помощью теста. Размер на переднем/заднем плане должен быть настроен так, что определяемый прямоугольник занимает половину площади объекта, чтобы предотвратить подползание (смотрите минимальный/максимальный размер). Для подавления сигналов тревоги, вызываемых мелкими животными, минимальный размер детектируемый объектов должен быть настроен с помощью настройки перспективы через указание минимального размера на переднем/заднем плане. Подключаемые типы камер: высокоразрешающие цветные камеры; высокоразрешающие ч/б камеры с более высокой контрастной, световой, инфракрасной чувствительностью; аккумулирующие изображение камеры с более высокой светочувствительностью (1 люкс на объекте); инфракрасные камеры в сценах, которые освещаются искусственно, без белого света. Ч/Б камеры имеют более высокий объем контраста, чем цветные и благоприятствуют детекции объектов в предельных областях. При тумане радиус действия сенсора уменьшается. Камера для применения детектирования движения должна выполнять следующие требования: высокоразрешающая (560 строк при ч/б, 450 строк при цвете); стандартный сигнал PAL/CCIR (или NTSC/EIA);  минимальное расстояние сигнал/шум (S/N - 46) дБ (изображение без звука); контрастное изображение объектив камеры:
- для удаленного контроля: большое фокусное расстояние (теле) с 15° углом открытия
- для объекта и контроля изгороди: нормальное фокусное расстояние с 30° углом открытия
- для объема и контроля площадей: короткое фокусное расстояние (широкий угол) с 60° углом открытия
Позиционирование камеры. Местонахождение камеры должно быть выбрано так, чтобы близкая к объективу область была защищена от снега, дождя и падающих листьев. Прямое ослепление камеры должно быть подавлено с помощью соответствующего наклона и соответствующей высоты монтажа. Насекомых, пауков, птиц и т.д. необходимо держать на расстоянии от объектива, как например с помощью механической/электрической защиты. Отбрасывание теней объектами (например, транспортными средствами) из прилегающих площадей уличного движения в чувствительную площадь должно быть подавлено. Это особенно касается отбрасывания теней при восходе и закате солнца (особенно длинная тень). Фары вызывают в конвенциональной технике камеры нежелательные эффекты. Если фары светят непосредственно в камеру, это приводит к смазывающим эффектам по всему изображению камеры, которые как направленное движение детектируются также в пределах чувствительной площади. Если объект ослепляется со стороны, это может привести к расстраиванию сенсора через отражение объекта. Большие тангенциальные движения объекта достигаются подходящим (высоким) позиционированием камеры. Так контроль всегда должен быть смещен не фронтально, а по бокам. Монтаж камеры на большей высоте должен быть рекомендован. Въезд всегда должен контролироваться поперек. Необходимо избегать ночного контроля зон вблизи улиц с напряженным дорожным движением или необходимо обеспечивать, чтобы фары не светили в камеру. Источники света в поле зрения камеры (восход, закат солнца, лампы, отражающие объекты большой площади, как окна и т.д.) уменьшают контрастный объем контролируемой сцены и оказывают отрицательное воздействие на детекцию малоконтрастных объектов. Так как детекция объектов видеосенсором происходит предпочтительно в тангенциальном направлении, камера должна быть позиционирована таким образом, чтобы она указывала поперек к направлению движения. Если нельзя исключить объекты, которые двигаются на камеру, то должна быть выбрана высокая позиция камеры.
Освещение сцены. Искусственные источники освещения в общем не должны быть установлены вблизи камеры. Необходимо выдерживать минимальное расстояние в 2 метра. Источники освещения привлекают насекомых и отражаются от капель дождя или снежинок. При освещении прожекторами необходимо обеспечить равномерное освещение сцены, чтобы избежать темных полей. Объект в тени потенциально хуже детектируется. Здесь необходимо равномерное освещение. Во избежание дополнительного освещения могут использоваться более чувствительные к свету камеры. Если необходим дополнительный источник света, но освещение белым светом невозможно, могут использоваться инфракрасные прожекторы, чувствительные к инфракрасному цвету ч/б камеры или инфракрасные камеры. При этом решении сигнал изображения имеет меньшее соотношение сигнал/шум и необходимо больше прожекторов.
Контроль изгороди. Типичное расположение камеры при контроле изгороди можно увидеть на следующих изображениях. При установке камеры обращать внимание на то, что детектируемые объекты двигаются в изображении преимущественно горизонтально(высокое тангенциальное движение). Т. е. контроль должен быть смещен не фронтально, а по бокам.
Если через камеру на видеоизображении высвечиваются дата и/или время, то эти опции должны быть деактивированы, чтобы избежать включения сигнала тревоги (детекция объекта в области указания даты/ времени).
После переключения камеры адаптация видеосенсора движения к новой сцене составляет 1мин. При ручном перемещении камеры в мобильных системах сенсор должен быть деактивирован и с новой сценой после 1 мин адаптации активировать.
Одноканальный видео-датчик движения LTC 2210/50. Цифровые датчики движения LTC 2210 работают с распознаванием контура и цифровым прослеживанием движения. Патентованное включение обладает высокой надежностью и безопасностью. Эти приемлемые по цене, полностью оборудованные одноканальные датчики движения многосторонни и надежны в распознавании. Ошибочные сигналы тревоги практически полностью исключаются. С помощью 8 свободно настраиваемых зон распознавания эти приборы можно очень гибко адаптировать к практически любой ситуации. Благодаря микропроцессорному управлению настройка зон распознавания особенно проста. Для многократной установки в меню можно выбирать шесть языков: английский, французский, немецкий, испанский, голландский или итальянский. Дальнейшими обслуживающими элементами являются кнопки для ручного или автоматического выключения, указание движения вкл/выкл и подавление сигнала тревоги. Готовность к сигналу тревоги; сигнал тревоги и эксплуатационное напряжение указываются лампами. Когда приборы LTC 2210 распознали движение, тревога сообщается оператору через звук сигнала и мигающую лампу. В связи с последовательным включателем включается соответствующая камера. Через контакт могут управляться дополнительные датчики тревоги или видеомагнитофон. Направление движения указывается на экране. Для оптимального функционирования при соответствующих условиях чувствительность может быть настроена. Через подходящую адаптацию чувствительности и скоростей объекта LTC 2210 может очень эффективно различать между самыми различными фонами и объектом. На 15-пиновом штекере на обратной стороне прибора лежат тревожные выходы и вход для активации с помощью дистанционного управления. Прибор подлежит поставке как настольный прибор или для монтажа на стойке. Все версии имеют видеовход с возможностью прошлифовки. Приборы по дизайну подходят оставшимся компонентам. По материалу "АСПО"

С помощью интеллектуального поиска в архиве, TRASSIR открывает возможность мгновенного путешествия во времени с целью получения нужной вам информации. Основанный на «интеллектуальном» объектном детекторе SIMT (Simple Intelligent Motion TRASSIR ) и интерактивном инструменте визуального поиска, ActiveSearch открывает новое измерение для доступа к данным. Везде, где обеспечение безопасности, охранное телевидение и качественный контроль — не пустые звуки - ActiveSearch принесет ощутимую пользу, давая новый уровень возможностей вашей системе видеонаблюдения TRASSIR. ActiveSearch обеспечивает:
* Сбор всех характеристик всех объектов в поле зрения видеокамер (скорость, направление, размер) и запись их в базу данных.
* Поиск движения в определённой зоне с заданными параметрами.
* Возможность просмотра архива в окне поиска.
* Удобный интерактивный поиск. Возможность поиска по типовым шаблонам или по конкретному временному интервалу.
В современных цифровых системах видеонаблюдения уже достаточно много разнообразных «интеллектуальных» детекторов, однако, назвать это видеоаналитикой нельзя. В системе цифровой видеорегистрации TRASSIR детекторы движения типа SIMT выполняют двойную работу. Во-первых, по заданным параметрам объектов и зонам детектирования вызывает тревогу в реальном времени (то есть в момент наблюдения сцены). Во-вторых, поставляет так называемую «мета-информацию» для сохранения в базу данных, по которой в любой момент времени вы можете осуществлять поиск. В базу данных, как и в архив, записывается любое движение и параметры всех объектов, которые детектор движения зафиксировал в поле зрения видеокамер.
Основной инструмент поиска - ActiveSearch — дает возможность создать новые параметры тревог для объектов с характеристиками, которые так же задаете вы, исходя из вашей текущей задачи. Просто выделите область на экране в поле зрения видеокамеры и задайте параметры объектов, которые вы хотите «поймать» - результат будет получен за секунды.
1.SIMT выделяет объект и измеряет его параметры.
2.Трассируется путь и вектор.
3.Каждый объект уникален и имеет собственный ID.
При выборе размеров и других параметров объекта система выдает подсказку на экран — виртуальный объект, который имеет указанные для поиска характеристики.
Интерфейс:
* Область поиска — выбор места, где будет производиться поиск по архиву и БД.
* Фильтрация по времени — время, по которому будет производиться поиск.
* Размер объекта — размер, который учитывается при поиске.
* Скорость объекта — скорость, которая учитывается при поиске.
* Найдено — список фрагментов, которые нашёл ActiveSearch, подходящие по заданным параметрам.
TRASSIR позволяет выбрать 4 способа обращения к архиву, один из них — ActiveSearch. Для упрощения восприятия на экране отображается виртуальный объект, который дает наглядное представление о скорости и границах размеров объектов, которые мы ищем. По материалу TRASSIR

Исследование метода обработки видеоизображений и идентификации объектов, инвариантного к пространственным изменениям анализируемой сцены (По сборнику докладов на VI Международной конференции «Цифровая обработка сигналов и её применение»). Авторы - Ляпин А. И., Суворов Е. Ю., Сидоров С. Б. (Научно-исследовательский институт измерительных систем им. Ю. Е. Седакова)
Современные достижения в области распознавания видеоизображений сводятся к стремлению автоматизировать процесс и исключить человеческий фактор на этапе принятия решения. До настоящего времени остается актуальной задача идентификации объектов на некотором двумерном изображении. Решение данной задачи позволит повысить надежность функционирования систем контроля, управления, охраны и т. п. При общей постановке такой задачи требуется идентифицировать объект в реальном времени при пространственных изменениях анализируемой сцены, т.е. при различных ракурсах наблюдения и масштабах приближения к ней. В данной работе предлагается метод обработки видеоизображений и распознавания объектов и приводятся некоторые результаты технической реализации данного метода.
Обобщенная функциональная организация классической методики обработки изображений и идентификации объектов представляет следующую последовательность этапов [1]:
- сегментация изображения;
- построение аналитического описания полученных образов;
- классификация.
Рассмотрим конкретное содержание этапов предлагаемой авторами методики.
На этапе сегментации изображения реализуется его предварительная обработка и бинаризация относительно рассчитываемого порога. В качестве операций предварительной обработки используется следующий набор фильтров: медианный, линейный НЧ-фильтр, соляризация. Операцию медианной фильтрации изображения окном 3 х 3 можно представить следующим выражением:
I’i,j = med(I1, I2, …, I9) = I*5, где I1 = Ii-1,j-1, I2 = Ii, j-1, I3 = Ii+1,j-1, I4 = Ii-1,j, I5 = Ii,j, I6 = Ii+1,j-1, I7 = Ii-1,j+1, I8 = Ii,j+1, I9 = Ii+1,j+1; med(I1, I2, …, I9) - функция, осуществляющая сортировку по возрастанию значений яркостей {I1, I2, …, I9} и сохранение 5-го элемента I*5 отсортированной выборки, Ii,j - интенсивность точки (i, j) изображения до фильтрации, I’i,j - интенсивность после фильтрации.
Низкочастотная фильтрация изображения представляет собой свертку элементов изображения с маской М:
I’i,j = å5k=1å5n=1 Ii+k-3,j+n-3Mk,n, где Mk,n - элемент единичной матрицы М. Операция соляризации изображения сводится к вычислению I’i,j = k * I’i,j * (rmax - Ii,j), где k - коэффициент управления динамическим диапазоном изображения по квадратичному закону с внутренним параметром rmax.
Результатом сегментации изображения является получение последовательности образов. На этапе построения аналитического описания для каждого образа рассчитывается набор классификационных признаков. Выбор соответствующей базы признаков описания объектов поиска определяет инвариантность процедуры идентификации относительно пространственных изменений анализируемой сцены. В качестве признаков классификации использовались пространственные и спектральные характеристики объектов. В предлагаемой методике к пространственным признакам относятся значения коэффициентов формы объекта, его характеристики внутренней конфигурации, характеристики контура. Расчет пространственных признаков проводится относительно центра тяжести соответствующего образа. К спектральным признакам классификации относятся значения средней яркости объекта распознавания и его гистограммные спектральные характеристики.
На этапе классификации в условиях априорной неопределенности осуществляется принятие решения о степени сходства входного представления значений признаков с множеством эталонов. В силу значительной нелинейности поставленной задачи (инвариантность относительно пространственных изменений) этап классификации реализован на основе нейросетевого подхода. Разработка архитектуры нейронной сети проводилась для полносвязной НС типа многослойный персептрон [2]. Оптимальной сетью считалась сеть с максимальным качеством и минимальной ошибкой классификации. Под ошибкой (Еr) на k-м подмножестве понималась квадратичная ошибка, равная сумме квадратов разностей между ожидаемыми целевыми и фактическими значениями функций активации каждого выходного нейрона, при подаче на вход наблюдения из данного подмножества:
Еr = åNkj=1[ (Zo1i - Z1i)2 + (Zo2i - Z2i)2 + (Zo3i - Z3i)2], где Zom - ожидаемое целевое значение функции активации n-го выходного нейрона, Zni - реальное значение функции активации n-го выходного нейрона, Nk - число наблюдений на k-м подмножестве, i - номер наблюдения.
Под качеством (Pr) сети на k-м подмножестве понималась доля правильно классифицированных наблюдений из этого подмножества: Pr = Nrk/ Nk, где Nk - общее число наблюдений в k-м подмножестве; Nrk - число правильно класcифицированных наблюдений.
Для определения оптимальной сети использовался критерий соотношения показателей ошибки и качества на контрольном подмножестве БД и сложности архитектуры НС. Обучение нейронной сети происходило на массиве наблюдений, включающих в себя параметры классификации, подающихся на вход этой сети, и ожидающихся выходных значений нейронной сети - классов объектов распознавания. В качестве оптимальной была признана архитектура трехслойного персептрона (рис. 1). Ошибка этой сети при классификации предложенных объектов составила 0,0473, а качество - 0,9955.
Architecture three-layer perceptron / Архитектура трехслойного перцептронаРис. 1
Для отработки алгоритмов предложенной методики был подготовлен каталог тестовых видеоизображений. В качестве объектов поиска и идентификации использовались объекты городской застройки на фоне неоднородного антропогенного пейзажа. Создание каталога тестовых видеоизображений выбранных объектов проводилось под различными ракурсами наблюдения в диапазоне углов ~30° и на удалении от объектов поиска 200 - 2000 м.
Техническая реализация методики выполнена в виде экспериментального макета системы идентификации, структурная схема которого приведена на рис. 2. Этапы сегментации изображения и построения аналитического описания выполнены на нейропроцессоре Л1879ВМ1.
Breadboard model of system of identificationРис. 2
Исследования работы системы идентификации проводились па 500 тестовых видеоизображениях сцены из каталога (не совпадающими с подмножеством БД обучения НС). Проверка работоспособности предложенного метода обработки изображений и идентификации объектов показала, что система идентификации уверенно определяет местоположение искомого объекта в 80% случаях, не находит объект в 5% предъявлений и примерно в 15% случаев наряду с правильным происходит ложное обнаружение. Общее время работы системы идентификации, затрачиваемое на обработку одного цифрового изображения форматом 128 х 64. составляет 0.3 с.
ЛИТЕРАТУРА
1. Прэтт У. Цифровая обработка изображений. В 2-х кн. - М.: Мир, 1982.
2. Ляпин А. И., Хрусталев А. А., Суворов Е. Ю. Методы обработки изображений и распознавания объектов на меняющемся фоне/В кн.: Труды международной специализированной конференции военных и двойных технологий. - Н. Новгород, 2002 г.

Об использовании данных приёмников глобальных спутниковых систем определения координат (систем глобального позиционирования) GPS / ГЛОНАСС, встраиваемых в видеокамеры, ноутбуки, мобильные телефоны, ИК-камеры и другую съёмочную и компьютерную технику, в качестве метаданных для структурирования видео- и аудио информации при её анализе, поиске и архивировании

Прогноз от справочника "Кто есть кто в робототехнике" (перевод осуществлён компьютерной программой) The forecast from the directory "Who is who in a robotics" (translation is carried out by the computer program)

О перспективности разработок в области определения направления взгляда. Если человек, не имеющий денег смотрит на банк или инкассаторскую машину, то велика вероятность, что он грабитель. Если человек, не имеющий отношения к детям, пристально смотрит на детей или на детские учреждения, то велика вероятность, что он педофил. Если мужчина или женщина пристально вглядываются в лица людей своего пола, велика вероятность, что они гомосексуалисты. Если человек смотрит на лицо противоположного пола, то по количеству взглядов на это лицо можно определять рейтинг его привлекательности. Если кто-то смотрит на предметы одежды, то по количеству взглядов можно определить насколько модная эта одежда.

About perspectivity of development in a range of definition of a direction of a sight. If the person who is not having money looks at bank or the collector machine the probability is great, that he the robber. If the person who is not having the relations to children, steadfastly looks at children or on children's establishments the probability is great, that he the pedophile. If the man or the woman steadfastly peer into persons of people of the floor, the probability, that they homosexuals is great. If the person looks at the person of an opposite floor by quantity of sights at this person it is possible to define a rating of its appeal. If someone looks for clothes by amount of sights it is possible to define as far as fashionable these clothes.

«Признаки раба, годного для военного дела – с жесткими волосами, хорошего роста, стройный, крепкого сложения, с крепким мясом, и твердыми пальцами, и твердыми костями, кожа и члены тела у него грубые и сочленения прочные, с протянутыми сосудами, все жилы на теле видные и выпуклые, с широкими ладонями, широкогрудый, широкоплечий, с крепкой шеей. Если голова у него лысая, это лучше. И нужно, чтобы у него был впалый живот, и подтянутый зад, и крепкие связки, а когда он ходит, икры должки подниматься вверх. Лицо должно быть хмурое. Нужно, чтобы он был черноглазый. И всякий раб таких свойств – воин смелый и удачливый.»

Кей-Кавус, «Кабус-наме» (Глава XXIII «О покупке рабов и ее правилах»), XI в.

Темы серии справочников «Компоненты и решения для создания роботов и робототехнических систем»

UR4T3R - пространственная и спектральная селекция в оптико-электронных системах наведения. JERY45X - мимика и ее распознавание. J564HY - структурные схемы подключения видеонаблюдения. I456E56 - программы распознавания лиц. YUIR67R5Y - замаскированные средства видеоконтроля. TUTY6U5 - контроль железнодорожных переездов: видеонаблюдение, распознавание. GTYU68 - алгоритмы автосопровождения по видеоизображению: телевизионные автоматы. TYU68ER - методы распознавания черт лица человека. NTU6867 - способы селекции движущихся объектов по ИК излучению. GYUU68R - самодельная схема управления вращением видеокамеры.