Анализ и поиск информации

Робототехника
 

Более полный поиск по теме Вашего запроса (наберите его в окне поиска)

Вне конкуренции находятся на мировом рынке некоторые российские системы видеоконтроля. Такой вывод мы сделали из выступления на пресс-конференции к выставке «Интерсигналдортранс'2000» генерал-майора милиции, зам. начальника ГУ ГИБДД МВД РФ, начальника НИЦ ГУ ГИБДД МВД РФ А. Ю. Якимова. В частности, он привел такой пример: будучи на аналогичной выставке в Голландии, он обратил внимание на то, что зарубежные видеосистемы контроля дорожной обстановки не поддерживают режим поиска по базе данных автомобильных номеров, который поддерживают российские видеосистемы, предназначенные для распознавания государственных регистрационных номеров. Объясняется это, правда, не технической отсталостью Запада, а иной спецификой криминальной обстановки, но, тем не менее, в конечном счете ситуация оборачивается в пользу наших разработчиков: как нам затем прокомментировали на стенде «Росси» (одной из фирм, специализирующихся на подобных системах), на их аппаратуру поступают заказы не только из СНГ и Балтии, но и из той же Голландии и других стран дальнего зарубежья. Очевидно, это объясняется тем, что российский преступный мир всё увереннее насаждает на Западе свои понятия, для борьбы с которыми не обойтись без российских же противоядий. Что касается нашей страны, то и у нас внедрение подобных систем будет расширяться, поскольку разрабатываются многоцелевые федеральные программы профилактики ДТП и других правоохранительных мероприятий.
«ТКТ» уже неоднократно описывал разнообразные видеосистемы контроля дорожной обстановки, и теперь нашим читателям будет легче сделать необходимые выводы, ориентируясь на результаты, которых достигли фирмы-разработчики к моменту выставки. Так, аппаратно-программый комплекс «Поток» фирмы «Росси», имея стандартный жесткий диск 2,5 Гбайт, при помощи сжатия обеспечивает (при равном делении ресурсов) сохранение 20 млн записей распознанных номеров на 1 Гбайте и сохранение 10 тыс. записей изображений автомобилей на 1 Гбайте. Такой объем памяти позволяет осуществлять распознавание передних и задних номеров всех видов, включая устаревшие, дипломатические, национальные, объединенные и т. д. Вероятность обнаружения и распознавания — не менее 0,9, ограничение скорости автомобиля для одного канала — около 150 км/ч. Особый интерес для нас представляет интерфейс: в № 2 «ТКТ» мы описывали интерфейс системы распознавания и поиска видеоизображений для видеоархивов, а теперь сопоставим это с организацией интерфейса в комплексе «Поток» (рис. 1).
Have suspected a robot - capsule that he has opened the lock, have hung up new, but he has told, as though by the way, that new to open even easier / Заподозрили робота-капсулу что он открыл замок, повесили новый, но он сказал, как бы между прочим, что новый открыть еще прощеРис. 1. Внешний вид главного окна программы:
1 — окно отображения реального транспортного потока в зоне контроля камеры; 2 — изображение автомобиля с распознанным номером; 3 — прочитанный системой номерной знак; 4 — журнал регистрации всех автомобилей, проехавших зону контроля; 5 — базы данных слежения (для примера на экране отображены 2 базы с разной конфигурацией)
Возник и процесс конкуренции. Создатели АПК «Поток» приложили к своим материалам результаты сравнительного анализа возможностей их системы с возможностями АПК «Сова-2» пермских разработчиков (о тактико-технических данных последнего рассказано в том же № 2 «ТКТ»). Из этого анализа следует, что «Поток» во многом превосходит «Сову», за исключением, правда, таких функций, как, например, оценка цвета автомобиля: на «Потоке», где стоит ч/б камера 500 твл, такой функции нет — из-за требования, как они объясняют, повышения чувствительности в ночное время; на «Сове» же, мол, хотя такая функция и есть, но серьезно хромает — оценка ведется только по центральной точке капота, в светлое время суток и только по 15 колорам (из 3000 оттенков цвета а/м, известных отечественным производителям). Однако создатели «Совы-2» привели в свою пользу не менее веский аргумент — данные о результативности системы (рис. 2; здесь «ФБР» — федеральная база розыска, «РБР» — региональная, «ОБР» — оперативная).
Do not make the robot - term of it, problems would not be. - Yes, problems would not be. But only at him. / Не сделай робот-термин этого, проблем бы не было. - Да, проблем бы не было. Но только у него.Рис. 2. Результаты работы АПК «Сова-2» на стационарном посту ДПС с. Лобаново с начала эксплуатации (с 10.08.1998 г.)
После того как нарушитель с помощью той или иной системы будет задержан, его необходимо сразу уличить — и здесь придет на помощь телевизионная лупа «Видеомыщь», созданная в НИИ ПТ «Растр» (Великий Новгород) — рис. 3. Она обеспечивает пофрагментный анализ плоских объектов (документов) в красной (655 нм) и зеленой (567 нм) областях видимого и косопадающего света с 40-кратным увеличением. Разрешающая способность — 375 твл, размер контролируемого поля — 3 х 4 мм. А. П. Барсуков, журнал "ТКТ", № 10, 2000 г. (через эту ссылку можно бесплатно скачать справочник)

«Диасофт» и ABBYY объявляют о начале партнерского сотрудничества. Партнеры предлагают финансовым организациям новое, совместное решение, которое заметно сократит время первичного ввода данных о клиенте в используемые системы.
18 октября 2011 года – Компания ABBYY, разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, совместно с «Диасофт», крупнейшим российским поставщиком современных ИТ-решений для всех направлений банковского бизнеса, создали новое решение, которое позволит оптимизировать работу кредитно-финансовых организаций.
Специалисты «Диасофт» встроили в операционный фронт-офис FLEXTERA сервисы ABBYY, которые позволяют распознавать различные типы документов, удостоверяющих личность (паспорта, водительские удостоверения и пр.), а также создавать пользовательские шаблоны для распознавания различных видов банковских документов (анкеты, заявления, расчетные документы и т.п.). Операционный фронт-офис FLEXTERA представляет собой полный комплекс решений по продаже банковских продуктов, принятию управленческих решений, дальнейшему обслуживанию клиентов и партнеров банка.
Совместное решение позволяет в автоматическом режиме производить сканирование и распознавание документов. Оператору остается лишь проверить результаты распознавания и при необходимости подкорректировать их. Благодаря этому, заметно сокращается время первичной идентификации клиента на различных этапах бизнес-процессов банка, минимизируются затраты на первичный ввод информации, необходимой для принятия решений о выдаче автокредитов, ипотечном и потребительском кредитовании, при обслуживании вкладов и т.д.
Главная ценность решения, предлагаемого рынку, состоит в сокращении стартового времени операций по идентификации клиента и вводу данных с банковских документов. В результате, это позволит заметно ускорить и оптимизировать бизнес-процессы финансовой организации.
Российская компания ABBYY – ведущий мировой разработчик программного обеспечения и поставщик услуг в области распознавания и ввода документов, лингвистики и перевода. Более 30 миллионов пользователей и десятки тысяч организаций по всему миру используют решения ABBYY для автоматизации трудоемких процессов, экономя время и превращая информацию в полезные знания. На российском рынке ABBYY является уникальной компанией, лидирующей одновременно в области лингвистических технологий и услуг. Штаб-квартира и два офиса продаж ABBYY находятся в Москве, другие представительства компании расположены в Австралии, Великобритании, Германии, Канаде, на Кипре, в США, Тайване, Украине и Японии. В 12 международных офисах компании работают свыше 1000 человек. Продукты и решения ABBYY доступны пользователям более чем в 130 странах мира благодаря собственной сети партнёров и представителей. ABBYY, логотип ABBYY, FlexiCapture, Lingvo, FineReader и DOCFLOW являются зарегистрированными товарными знаками либо товарными знаками ABBYY Software Ltd. Иные упомянутые названия могут являться товарными знаками и/либо зарегистрированными товарными знаками своих законных владельцев.
Компания «Диасофт» работает на рынке автоматизации финансовых институтов с 1991 года. Сегодня компания является крупнейшим российским поставщиком современных ИТ-решений для всех направлений бизнеса кредитно-финансовых организаций и предоставляет своим клиентам комплексные системы автоматизации корпоративного и розничного обслуживания, работы на финансовых рынках, ведения учета и формирования отчетности, управления хозяйственной деятельностью и персоналом. Компания создает и внедряет интеграционные решения, информационно-аналитические системы управления бизнесом крупных финансовых структур, разрабатывает ИТ-решения для страховых компаний, негосударственных пенсионных фондов, казначейств корпораций. В настоящее время решения «Диасофт» используют более 340 финансовых организаций, среди которых – 49 банков из списка TOP-100, ведущие инвестиционные и страховые компании. Семейство фронт-офисных продуктов FLEXTERA стало первым и пока единственным в России и Восточной Европе ИТ-решением, успешно прошедшим проверку на соответствие требованиям IBM Banking Industry Framework. В 2010 году компания стала лауреатом журнала «Финанс.» в номинации «За выдающийся вклад в развитие банковского бизнеса» и получила награду RETAIL FINANCE AWARDS за «Лучшее ИТ-решение».

Xerox создал уникальные технологии для поиска, сортировки и анализа графических изображений
31 января 2012 г. – Исследователи корпорации Xerox разработали технологии, позволяющие легко найти изображения для иллюстрации сообщений. Среди них приложение для Facebook, способное определить, что говорят о пользователе его фотографии, а также программа для классификации изображений в соответствии с их контентом. Демо-версии программных продуктов выложены на онлайн-портале Open Xerox, где их могут тестировать и рецензировать интернет-пользователи.
Представьте, что вы графический дизайнер, работающий на международную здравоохранительную организацию, и вам срочно надо найти фотографию, иллюстрирующую важность качества медицинского обслуживания для жизни детей. Даже с использованием современных технологий работы с изображениями поиск подходящего снимка в фотобанке займет несколько часов. Новые технологии Xerox способны справиться с этой задачей всего за несколько секунд.
Четыре новых инструмента, разработанные в Европейском Исследовательском центре Xerox, предназначены для анализа, классифицирования и поиска изображений. Например, одна из программ может сортировать коллекции фотографий с точки зрения определенного художественного стиля, а не просто по базовым критериям запроса пользователя.
Новые инструменты от Xerox облегчают управление массивными архивами информации, документов и изображений. «Доступные на сайте Open Xerox демо-версии программ показывают, как можно использовать наши технологии обработки изображений для решения повседневных бизнес-задач, - комментирует Крейг Сандерс, менеджер исследовательской группы European computer vision компании Xerox. - Мы сделали эти инструменты доступными для всех пользователей, будь то профессионал в области маркетинга или просто обыватель, обладающий большими коллекциями фотографий. Эти инновационные продукты демонстрируют глубокую экспертизу Xerox в области анализа графической информации и способности компании создавать новые решения для обработки контента».
Новые продукты Xerox – это:
Поиск похожих изображений (Similar Image Search) - технология, способная менее чем за секунду провести поиск среди 5 миллионов изображений на обычном ПК, позволяет любому пользователю находить нужные файлы в цифровых фондах - больших коллекциях фотографий высокого разрешения или элементов графического дизайна. Xerox работает над созданием облачной версии этой программы, которая сможет проводить поиск по сотням миллионов изображений в режиме реального времени.
Технология поможет пользователям находить похожие изображения во всех типах электронных хранилищ от больших фотобанков и крупных корпоративных архивов цифровых документов до личных коллекций фотографий на домашнем компьютере.
Категоризатор изображений (Image Categorizer) – недавний победитель международного конкурса Imagenet в области классифицирования изображений. Эта технология обеспечивает автоматическую категоризацию графических материалов в соответствии с их содержанием. Созданная для рекламистов, маркетологов и фотографов, работающих с крупными цифровыми архивами, программа использует технику машинного самообучения и алгоритмы обработки изображений для анализа и сортировки изображений по категориям. Благодаря программе текстовые запросы будут обрабатываться без предварительного проставления тегов на каждом изображении.
Художественный поиск изображений (Aesthetic Image Search). Многие современные методы классификации изображений основаны на распознавании его частей: если программы находят шины и дорогу, то, скорее всего это будет машина, а не что-то другое. Чтобы определить художественную ценность фотографии и найти нужные стилистические элементы, необходим новый подход. Используя категоризатор изображений, новый инструмент Xerox учится распознавать черты, которые делают изображение уникальным и ценным с точки зрения эстетики. Так, зная, что хорошие пляжные фотографии обычно характеризуются эффектом «шелковых» волн благодаря длинной выдержке, алгоритм будет отбирать именно такие – «шелковые» - изображения. Приложения предоставляют возможность анализировать крупные базы фотографий, отбирая лучшие фото для печати или изображения, выполненные в одном стиле.
Catepix – в этом приложении используется сложная технология анализа изображений из профилей Facebook, на основе которой выносится оценка того, что говорит о вас профайл в популярной социальной сети!
Все новые инструменты опубликованы на портале Open Xerox, на котором Xerox приглашает ознакомиться с инновационными разработками компании, ее партнеров, экспертов в области высоких технологий и пользователей из числа «ранних последователей» (early adopters)1. «Нам важно знать мнение пользователей о новых продуктах Xerox, и мы готовы совершенствовать наши технологии, чтобы они были лучше применимы на практике и упрощали рабочие процессы компаний», - добавил Сандерс.
1 Категория пользователей согласно теории «диффузии инноваций», которая составляет 13,5% всех пользователей и включает в себя социальных лидеров, популярных людей, с хорошим образованием, которые с готовностью принимают и пробуют нововведения, но при этом более осторожны, чем инноваторы.

По железнодорожному мосту промчался поезд, в воздух поднялся самолет, океан бороздит корабль, в человеческом мозгу с быстротой молнии пробегают биотоки — все эти и другие сложные динамические процессы человек научился записывать с помощью точнейших приборов. Получаются осциллограммы, кардиограммы, графики и другие кривые. Их расшифровка требует огромного времени у специалистов. Были бы это математические уравнения, дело обстояло бы проще. Но их нет. Ученые Института технической кибернетики Академии наук БССР задались целью: нельзя ли автоматизировать анализ динамических процессов в сложных системах? Нельзя ли кропотливый трудоемкий процесс расшифровки кривых переложить на «плечи» машины?
Три года длились поиски. И вот впервые в мире создан многоканальный автомат «МАСК», который считывает кривые. Успешно закончились его испытания. «МАСК» может одновременно читать графики шести различных процессов. Известно, что при пересечении нескольких кривых человек не всегда может распознать, где какая линия продолжается. А новый прибор делает это безошибочно. Сведения он передает электронно-вычислительной машине, которая производит окончательные расчеты.
Первая серия автоматов «МАСК» запущена в производство. Из сборника "Эврика", 1967 год

Анатомия поиска и распознавания образов. На конференции «Momentum Russia-2003» представитель компании, предлагающей систему поиска видеоизображений в архивах, рассказал о парадоксальной, на его взгляд, ситуации. Телестудии, которым его компания предлагала средства поиска видеоизображений, соглашались с необходимостью её приобретения, поскольку поиск нужного сюжета в залежах видеокассет традиционным способом приводил к чрезмерному износу видеоголовок. Тем не менее, приобретать отказывались, поскольку оцифровка своих видеофондов представлялась им чрезмерно хлопотной задачей. Что ж: остаётся позавидовать выдержке наших телевизионщиков, благодаря которой им удалось дождаться появления студийной аппаратуры на оптических носителях и теперь проблема износа головок, а заодно и оцифровки новых видеозаписей как бы снята сама собой. То есть, экономический стимул для приобретения роботизированной системы поиска видеоизображений (по ключевым кадрам, например) исчез окончательно и теперь найти какой-нибудь забытый сюжет в залежах еще более разноформатных носителей станет почти совсем невозможно.
Но, как говорится, покупатель всегда прав: если телекомпании и видеостудии отказываются покупать систему поиска видеоизображений, значит, её поставщик либо не умеет её продавать, либо предлагает не то, что нужно — например, устаревший вариант. В самом деле: система той компании, с представителем которой мы говорили на «Momentum Russia-2003», на нашем рынке предлагается уже лет 5 и «ТКТ» её описывал в числе прочих. Но за 5 лет изменилось очень многое и прежде всего — задачи, решение которых сегодня требуется от видеотехнологий.
Ровно та же ситуация с полицейскими технологиями распознавания лиц. На одной из недавних выставок правоохранительной тематики нам встретилось лишь одно предложение такой технологии и оно также предлагается на нашем рынке уже несколько лет. Видимо, поэтому продавец постеснялся в рекламном буклете указать системные требования к аппаратной платформе для этой технологии. Но мы у себя в редакции нашли эти требования и основное из них — Pentium 75 МГц. И это сегодня, когда величины тактовых частот измеряются уже в гигагерцах, нам предлагается приложение, которое неизвестно как реализуется на новейших моделях компьютеров (во всяком случае, игры для прежних «Пентиумов» на новых уже работают не все). Вероятность же распознавания осталась на уровне многолетней давности: «достигает 80%». Налицо классический случай единства формы и содержания: столь скромная вероятность распознавания прямо связана с названием — «система распознавания по изображению лица».
Description - an identikit: invisible laughter in a hall - a parameter of transition of quantity in quality / Словесный портрет - фоторобот: невидимый смех в зале - показатель перехода количества в качествоВсё без обмана: согласно «Толковому словарю» С. И. Ожегова и Н. Ю. Шведовой, лицо — это передняя часть головы человека. То есть, из технического задания на систему распознавания был априори исключен вид головы сбоку — а ведь информативность профиля такова, что порой кардинально изменяет имидж человека. Например, очень яркая телеведущая избегает показываться в профиль из-за т. н. «большого» выступания носа (оно еще бывает «малым» и «средним», поскольку контур спинки её носа относится к разряду «выпуклых» (рис. 1). И наоборот: средних способностей киноактриса, также с «большим» выступанием носа, очень любит сниматься (и действительно много снимается) в профиль, поскольку контур спинки её носа скорее «вогнутый», что придаёт её ролям подчеркнутую характерность — сексуального оттенка. А еще одна экранная звезда перед объективами принципиально делает головой пол-оборота вправо, полагая, что так она смотрится выигрышнее — а между тем, в таком ракурсе вероятность распознавания еще больше уменьшается. Почему и звезда и система распознавания ведут себя именно так, видно из рис. 1 и 2: разные конфигурации лба могут сделать ракурсы одного и того же человека и привлекательными, и непривлекательными и неузнаваемыми
Впрочем, подобные классификаторы судебная криминалистика вывела для многих других деталей и пропорций человеческого лица. И если системы распознавания пользовались лишь несколькими деталями и пропорциями, это было понятно несколько лет назад, когда компьютеры медленно обсчитывали изображения. Но сегодня, когда скорости обсчета многократно выросли, предлагать на нашем рынке устаревшие программы с вероятностью распознавания далёкой от 100%, наверное, не совсем правильно.
Поэтому на современном этапе развития систем распознавания изображений человека уместнее, на наш взгляд, говорить не о «распознавании лиц», а о «распознавании образов», имея в виду, что, согласно тому же толковому словарю, образ — это «результат и идеальная форма отражения предметов и явлений материального мира в сознании человека». Применительно к технологиям распознавания, принципиальная разница между «лицом» и «образом» состоит в алгоритме составления библиотеки визуальных шаблонов.
В случае «лиц» эту библиотеку чисто механически составляет фотокамера, рисуя, по сути, фотоальбом передних частей множества голов — операция сколь примитивная, столь же и малоэффективная. В случае же «образов», библиотека визуальных шаблонов составляется высокообразованными специалистами и в основе её должны быть изображения тех самых «явлений». Например, мимики, программы распознавания которой сегодня интенсивно развиваются, поскольку мимика — это «движения лица, выражающие внутреннее душевное состояние». В приведённом же примере со звездой, которая снимается, полуобернув голову вправо, визуальным шаблоном будет и этот ракурс, в котором барышня позиционирует себя именно как «явление», отразившееся в её же сознании.
Имеет ли всё это практическое значение? На сегодняшний день уже можно привести несколько применений, наиболее известное из которых — мобильная телефония. Фирмы-производители мобильных телефонов работают над приданием своим изделиям функции распознавания движений губ, чтобы телефон сохранял работоспособность в условиях сильных шумовых помех. Фирмы-производители роботов-игрушек начали обучать своих киберсобачонок распознавать гримасы хозяина. Для обоих этих примеров характерно то, что распознаются образы не какого-то индивидуума (как при распознавании лиц — физиономия шулера, которого не следует пускать в казино), а свойства, присущие целым народам: движения губ при разговоре и гримаса, выражающая эмоцию.
Что же касается телевидения, то здесь ситуация проясняется, когда применяется терминологический подход: система распознавания и поиска образов (звуковых, визуальных, семантических и пр.) — это, прежде всего, инструментарий для аналитиков. И когда на телевидении понадобятся аналитики, понадобится и этот инструментарий А. П. Барсуков, журнал "ТКТ", № 12, 2003 г. (через эту ссылку можно бесплатно скачать справочник)

Специалисты в области распознавания образов
Аверьянов Т. А.
: "Применение генетического алгоритма при анализе двумерного изображения"
Аксенов О. Ю.: "Описание наблюдаемой сцены"
Андреев С. Е.: "Выделение сегментов на изображении", "Распознавание узлов прямоугольной решетки на изображении её проекции"
Анисимов В. Ю.: "Устройство для распознавания объектов"
Апальков И. В.: "Многослойный персептрон в задаче восстановления изображений по фазовому спектру"
Арзуманян Э. П.: "Адаптивный селектор телевизионных образов"
Барсуков А. П.: "Excalibur: технология распознавания видеоизображений" (см. справочник "Кто есть кто в робототехнике", выпуск № 1)
Бачило С. А.: "Применение методов представления изображений с помощью криволинейных гранул"
Богданов Ю. Е.: "Модель использования технических средств при распознавании объектов противника", "Игровая модель распределения ресурсов системы распознавания при воздействии противника на защищаемые объекты"
Богуславский А. А.: "Распознавание символьной информации в сложных условиях наблюдения"
Борисов Э. В.: "Устройство для распознавания объектов"
Булдакова Т. И.: "Синергетические основы алгоритмов идентификации систем естественного происхождения"
Бутенков С. А.: "Применение методов представления изображений с помощью криволинейных гранул"
Васильев К. К.: "Оценивание параметров деформаций многомерных изображений, наблюдаемых на фоне помех"
Волков А. В.: "Способ автоматизированного распознавания изображений топографических объектов с использованием элементов экспертной системы, построенной на основе нейросети", "Метод автоматического распознавания изображений площадных объектов растительного покрова и грунтов с использованием нейросети"
Волчихин В. И.: "Использование тайных биометрических образов человека"
Галушкин А. И.: "Синтез многослойных систем распознавания образов"
Горелик А. Л.: "Методы распознавания"
Гостев И. М.: "Применение алгоритма ISODATA для вторичной классификации в системе распознавания образов"
Гусева Анна: "Невербальные факторы. (Язык тела)"
Даценко Лев Юрьевич: "Система автоматического распознавания лица ZN-Face"
Жирков В. Ф.: "Повышение эффективности алгоритмов распознавания путём оптимизации их параметров, основанной на имитационном статистическом эксперименте"
Зарубин Юрий Леонидович: "Дистанционный контроль за транспортом. АПК "Поток": новые решения"
Зеленский В. В.: "От задачи выделения контуров на изображении к вопросу классификации объекта"
Зинченко Е. Ю.: "Телевизионный комплекс для считывания и распознавания цифровых кодов"
Иванов А. И.: "Использование тайных биометрических образов человека", "Анализ траектории ключевого слова в задаче биометрической аутентификации"
Ильин С. В.: "Лазерно-телевизионная система мгновенного контурного анализа шероховатых объектов"
Итенберг И. И.: "Применение методов представления изображений с помощью криволинейных гранул"
Карачинов В. А.: "Лазерно-телевизионная система мгновенного контурного анализа шероховатых объектов"
Карачинов Д. В.: "Лазерно-телевизионная система мгновенного контурного анализа шероховатых объектов"
Каркищенко А. Н.: "Применение методов представления изображений с помощью криволинейных гранул"
Кипке М. В.: "Распознавание локальных аномалий на основе модели слоистой среды"
Киселёв В. В.: "Нечеткая логика для управления роботом с монокулярным зрением"
Колентьев С. В.: "Альтернативный способ обучения многослойных нейросетей прямого распространения в задаче распознавания образов"
Колючкин Василий Яковлевич: "Разработка трёхмерных сканеров лица человека, панорамных систем кругового обзора в полусферу и сферу, других биометрических и робототехнических систем для регистрации, распознавания, идентификации предметов любой формы"
Кораблёв Дмитрий: "Позы и жесты в фотографии"
Королёва С.: "Идентификация личности в различных странах"
Кравченко В. С.: "Обработка тепловизионных изображений для визуального распознавания"
Краснобаев А. А.: "Выделение трёхмерных объектов на сцене методом их моделирования"
Кривша В. В.: "Применение методов представления изображений с помощью криволинейных гранул"
Крылов Виктор Михайлович: "Особенности применения и возможности систем распознавания лиц в составе комплексных систем безопасности"
Кувшинов Б. М.: "Использование адаптивных методов распознавания образов в задачах принятия решений"
Кулагин Ю. В.: "Телевизионный комплекс для считывания и распознавания цифровых кодов"
Кулик С. Д.: "Нейросетевые алгоритмы распознавания образов в АФИПС (автоматизированные фактографические информационно-поисковые системы)"
Курбатов С. П.: "От задачи выделения контуров на изображении к вопросу классификации объекта", "Формирование баз данных классификационных признаков объектов поиска по данным телевизионных систем"
Кутепов В. Е.: "Методика и алгоритмы распознавания типа наблюдаемого радиолокатором объекта"
Левин М. Л.: "Распознавание узлов прямоугольной решетки на изображении её проекции"
Ложников П. С.: "Алгоритм определения ключевых точек динамической подписи"
Ляпин А. И.: "Исследование метода обработки видеоизображений и идентификации объектов, инвариантного к пространственным изменениям анализируемой сцены", "Методы обработки изображений и распознавания объектов на меняющемся фоне"
Манохин Олег: "Система, основанная на распознавании уникальных черт человеческого лица"
Мартынов А. Н.: "Оценка природного контраста неизлучающих объектов"
Мартынов В. Л.: "От задачи выделения контуров на изображении к вопросу классификации объекта"
Мастеров Валерий Евгеньевич: "Методы распознавания биометрических параметров лица на базе продукта ZN-Face", "Распознавание образов в телевизионных системах охранного наблюдения, построенных на базе оборудования фирмы Geutebrueck"
Матюшенко В. Г.: "Телевизионный комплекс для считывания и распознавания цифровых кодов"
Митюшин Д. А.: "Методика расчета вероятности распознавания кадровой телевизионной аппаратурой на ПЗС, выполняющей плановую видеосъёмку с борта БЛА"
Новиков К. В.: "Повышение эффективности алгоритмов распознавания путём оптимизации их параметров, основанной на имитационном статистическом эксперименте"
Попенко И. В.: "Применение алгоритма ISODATA для вторичной классификации в системе распознавания образов"
Приоров А. Л.: "Многослойный персептрон в задаче восстановления изображений по фазовому спектру"
Рожков К. Ю.: "Распознавание рукописных цифр в системах технического зрения"
Савин В. Д.: "Распознавание рукописных цифр в системах технического зрения"
Сдобнов В.: "Графология в Западной Германии"
Серова Е. Н.: "Решение задачи выделения контуров на изображении"
Сидоров С. Б.: "Исследование метода обработки видеоизображений и идентификации объектов, инвариантного к пространственным изменениям анализируемой сцены"
Скрипкин В. А.: "Методы распознавания"
Соколенко Е. А.: "Многослойный персептрон в задаче восстановления изображений по фазовому спектру"
Соколов С. М.: "Распознавание символьной информации в сложных условиях наблюдения"
Сорокин И. А.: "Анализ траектории ключевого слова в задаче биометрической аутентификации"
Сосулин Ю. Г.:  "Сравнительный анализ эффективности распознавания изображений (РИ) обучающимся векторным квантователем (ОВК) и многослойным персептроном (МСП)", "Нейросетевое распознавание двумерных изображений"
Стефанов В. А.: "Обработка тепловизионных изображений для визуального распознавания"
Стрижов Е. А.: "Методика и алгоритмы распознавания типа наблюдаемого радиолокатором объекта"
Суворов Е. Ю.: "Исследование метода обработки видеоизображений и идентификации объектов, инвариантного к пространственным изменениям анализируемой сцены", "Методы обработки изображений и распознавания объектов на меняющемся фоне"
Суслов Андрей: "Oracle interMedia. Управление мультимедийными данными"
Сушкова Л. Т.: "Повышение эффективности алгоритмов распознавания путём оптимизации их параметров, основанной на имитационном статистическом эксперименте"
Суятинов С. И.: "Синергетические основы алгоритмов идентификации систем естественного происхождения"
Табачков Владимир: "Серверный продукт для распознавания и конвертации документов и PDF-файлов"
Ташлинский А. Г.: "Оценивание параметров деформаций многомерных изображений, наблюдаемых на фоне помех"
Тисенко Э. В.: "Использование распознавания при исследовании татарских текстов редкого фонда, напечатанных арабским шрифтом"
Ткачев В. И.: "Использование распознавания при исследовании татарских текстов редкого фонда, напечатанных арабским шрифтом"
Торицин С. Б.: "Лазерно-телевизионная система мгновенного контурного анализа шероховатых объектов"
Усова Н. Г.: "Адаптивный селектор телевизионных образов"
Фатеев Сергей Владимирович: "Комплекс "Face-Инспектор: распознавание образов на основе нейросетевых подходов"
Хебайши М. А.: "Повышение эффективности алгоритмов распознавания путём оптимизации их параметров, основанной на имитационном статистическом эксперименте"
Хрусталёв А. А.: "Методы обработки изображений и распознавания объектов на меняющемся фоне"
Хрящев В. В.: "Многослойный персептрон в задаче восстановления изображений по фазовому спектру"
Червоненкис А. Я.: "Применение методов распознавания образов в задачах молекулярной биологии"
Ширяев В. И.: "Использование адаптивных методов распознавания образов в задачах принятия решений"
Югай А. А.: "Цифровые технологии: система распознавания лица Visionics"
ЗАРУБЕЖНЫЕ ИСТОЧНИКИ
Ванс Эшли: "Трёхмерная система распознавания лиц Canesta"
Гонсалес Р.: "Принципы распознавания образов"
Ильин С. А. (Киев): "Комбинация визуальной и локационной идентификации целевого объекта при автономном функционировании мобильного робота"
Куленов Даулет Нилович (Казахстан): "Инструментальный пакет FRS (Faces Recognition System) SDK v2.1"
Пиз Алан: "Язык телодвижений"
Прогонный Н. В. (Киев): "Комбинация визуальной и локационной идентификации целевого объекта при автономном функционировании мобильного робота"
Сухоручкина О. Н. (Киев): "Комбинация визуальной и локационной идентификации целевого объекта при автономном функционировании мобильного робота"
Тан И Цзе (Сингапур): "Технология адаптивного распознавания лиц XID Smart-ID"
Фам Чунг Зунг: "Сравнительный анализ эффективности распознавания изображений (РИ) обучающимся векторным квантователем (ОВК) и многослойным персептроном (МСП)", "Нейросетевое распознавание двумерных изображений"
Фукунага К.: "Введение в статистическую теорию распознавания образов"
Харвиайнен Т. (Финляндия): "Использование распознавания при исследовании татарских текстов редкого фонда, напечатанных арабским шрифтом"
Хернандез Альфредо Херрера: "Ускорение процедуры распознавания лиц"
ЛИТЕРАТУРНО-ХУДОЖЕСТВЕННЫЕ ПРОТОТИПЫ
Богомолов Владимир: "Момент истины"

Визуальный анализ биологических объектов (Институт теоретической и экспериментальной биофизики РАН). Изображение объекта (имидж) — это основа биологического мировоззрения: любое биологического исследование оперирует с такими изображениями. Для целых разделов биологии создание и анализ изображений — основной технологический компонент исследовательского процесса. Благодаря компьютерной революции, в биологии во многом решена центральная проблема морфологии: появились технические средства создания точных образов биообъектов. И узловая проблема теперь — методологические подходы к анализу изображений. Один из отцов современной морфологии — И. В. Гёте — продемонстрировал, как здесь пересекаются интересы естественных наук и гуманитарных: в течение всей истории науки и культуры разработки подходов к исследуемому объекту в искусстве и науке шли параллельно.
Морфология растений задумана Гёте как наука о строении тела растения, оперирующая его собственными морфологическими элементами. Принципы гётевской морфологии растений — это принципы морфологического анализа слов, перенесённые из лингвистики в ботанику Для носителя языка морфологический анализ не представляет особых трудностей. Проблема возникает в том случае, если требуется провести морфологический анализ слов незнакомого языка — а именно в этом положении, по мысли Гёте, находится ботаник, читающий «книгу природы». Растения для него — слова незнакомого языка, в которых требуется выделить составляющие их части, то есть, морфологические элементы.
Границы частей слов определяются операционально с помощью флексий — операций преобразования ("сгибания") слов. Морфологические элементы, следовательно, это не априорно существующие единицы, из которых можно сложить изучаемую систему, а части или фрагменты, на которые её можно расчленить заранее оговоренным способом. Если неизвестен способ членения системы, то ничего нельзя сказать и о составляющих её элементах. Правила членения являются одновременно и правилами порождения элементов объекта.
А как возможно выделение морфологических элементов в теле растения? Очевидно, что визуально различаемые его части (корень, стебель, лист, цветок) — это еще не морфологические элементы в понимании Гёте. Задача состоит даже не в том, чтобы формализовать те приёмы распознавания образов, которыми мы бессознательно пользуемся, отличая лист от цветка, а в том, чтобы перейти на точку зрения растения и указать систему операций преобразования, отвечающих его природе.
В поисках «естественных» признаков флексии Гёте опирался на признак метаморфозы — сложного преобразования структуры некоего первичного прарастения, которое он называл листом. По его мнению, морфологические преобразования, создающие новые формы, возможны на базе такого прарастения путём соответствующего морфогенеза. Переводя на современный язык, можно сказать, что Гёте предлагал выделять инвариантную структуру объекта исследования, вариантами воплощения которой служат те или иные части растительного организма.
Другим вариантом структурного анализа была морфологическая концепция К. Линнея, отбросившего все признаки, которые невозможно выявить с достаточной точностью. По сути, он предложил выявлять перцептивную (визуально воспринимаемую) структуру объекта. Перцептивная структура — это набор признаков, по которым мы отличаем один объект от другого. Психологи называют эти признаки «гештальт-качествами». Гештальт-качества не существуют сами по себе как отдельные части предмета, а определяются свойствами целого. Они, следовательно, передаются не всеми имеющимися признаками объекта, а только некоторыми, но какими именно — остаётся неизвестным. Современная теория распознавания образов только еще приближается к их выделению, и на практике эта задача решается эмпирически.
В каждом природном объекте можно выделить бесконечное число разнообразных признаков, но неизвестно, какие из них наиболее значимы для его распознавания. Проблему выбора наиболее значимых для распознавания признаков и пытался решить Линней, разрабатывая свою методику описания внешнего строения растений, с помощью которой надеялся, выражаясь современным языком, выделить морфологические признаки, наиболее близкие к гештальт-качествам (признакам перцептивной структуры).
Решение задачи достигалось в два этапа. На первом этапе объект очищался от «лишних» признаков. В их число вошли цвет, вкус, запах растения и все исторические, этимологические и т. п. сведения о нём. В результате оставался один только черно-белый зрительный образ, напоминающий геометрическую схему. Затем, на втором этапе, в полученной схеме предлагалось выделить наиболее существенную часть и описать её в системе четырёх переменных согласно «числу, фигуре, положению и пропорции». Применение данного способа описания позволяло представить образ объекта классификации в виде набора однозначно понимаемых признаков, но проблема соответствия этих признаков элементам перцептивной структуры осталась нерешенной.
Гёте и Линней шли к пониманию структуры растения разными путями: первый «от растения», второй «от человека». На этом примере видно, почему сегодня теория распознавания образов зачастую бессильна: в отсутствии средств объективной оценки каждый исследователь опирается на свои представления, которые, как правило, невозможно сопоставить, поскольку они являются предметом их внутреннего мира — очень часто под одним названием оказывались совершенно разные объекты. Новые технологии обработки изображений породили принципиально иное положение: есть возможность совместно анализировать одно и то же изображение, когда различия в анализе уже будут целиком зависеть от имеющегося у каждого из исследователей программного обеспечения. (По материалам конференции «ЕУА 2002 Москва») А. Барсуков, журнал "ТКТ", № 3, 2003 г. (через эту ссылку можно бесплатно скачать справочник)

Обзор докладов на 5-й научно-технической конференции "Современное телевидение"
СВВКИУ РВ (Серпухов).
«Алгоритм распознавания динамических объектов переменной конфигурации на сложном телевизионном изображении». Разработан алгоритм распознавания объектов, включающий построение разностного изображения и определение его статистических параметров.
ИНПРИС. «Роль понятия сходства (похожести) изображений в телевизионной иконике». Демонстрируемые по телевидению изображения постоянно пополняют банк эталонов, хранящийся в мозгу человека в виде пространственных спектров. Эти эталоны заносятся с весом «приятности» их человеку. С помощью численного показателя понятия сходства изображений — коэффициента сходства — можно проектировать весь тракт передачи ТВ-изображений. А. Барсуков, журнал "ТКТ", № 5, 1997 г. (через эту ссылку можно бесплатно скачать справочник)

МКБ "Электрон".  (Обзор докладов на 6-й научно-технической конференции "Современное телевидение") "Полезностный классификатор изображений в задаче опознавания природных явлений". Одна из задач, решение которой формулируется на основе анализа изображений определенного района земной или водной поверхностей, — классификация изображений по признаку наличия или отсутствия природных явлений конкретных типов. Здесь актуален вопрос синтеза алгоритма (классификатора изображений), учитывающего субъективные мнения экспертов по устанавливаемому факту. Предлагаемый подход к построению этого алгоритма основан на синтезе функции полезности, определяемой множеством многофакторных представлений изображений и реализующей гомоморфизм предпочтений эксперта на изображениях в смысле наличия устанавливаемого явления в отношение "больше-равно" на значениях функции полезности.
"Методика синтеза многофакторной модели изображений в задаче установления природных явлений". Ряд задач анализа изображений не может быть решен при определенном качестве последних с достаточной достоверностью традиционными формальными методами. Эти задачи решаются специалистами-экспертами путем субъективного анализа изображений. Недостаток субъективного подхода — большие временные затраты на выработку решений. Отсюда актуальность формализации субъективных рассуждений экспертов при анализе изображений применительно к решению конкретной задачи. Предлагается методика синтеза многофакторной модели изображений, основанная на процедурах многомерного неметрического шкалирования и на реализации ряда алгоритмов, которые описаны в докладе.  А. Барсуков, журнал "ТКТ", 1998 г., № 6 (через эту ссылку можно бесплатно скачать справочник)

Выделение трёхмерных объектов на сцене методом их моделирования (По материалам Научной школы-конференции «Мобильные роботы и мехатронные системы-2003»). Автор - Краснобаев А. А., МГТУ им. Н. Э. Баумана
Описывается алгоритм поиска известных объектов на сцене и определения их пространственной ориентации. Для этого выполняется моделирование возможных пространственных положений этих объектов и сопоставление результатов моделирования с изображением сцены. Алгоритм состоит из трёх частей: алгоритм предварительной обработки изображения, алгоритм работы с моделью объекта и алгоритм сопоставления модели с изображением. В алгоритме делается упор на возможность использования параллельной обработки информации.
Введение
Предложенный алгоритм реализует концепцию гештальт-психологии - «вижу то, что хочу видеть». Предполагается, что на входе алгоритма имеется часть сцены, содержащая искомый объект. Выделение этой части сцены (по сути «центра внимания») может быть выполнено с использованием информации о текстуре изображения, предполагаемого расположения объекта в кадре, на основании априорной информации и т. п. В случае выделения большей величины части сцены алгоритм выполняется за более длительное время.
Разработка алгоритма основана на данных психологии зрения, которая утверждает, что любое распознавание на уровне подсознания начинается с выделения элементарных символов. Если говорить о контурном рисунке, то большую часть информации мозг извлекает из острых углов и резких искривлений [I]. Поэтому решено было попробовать распознавание сцен на основании информации о выделенных в изображении прямых отрезков и углов между ними. В этом случае элементарным информационным символом является отрезок с углами на двух его концах, как показано на рис. 1.
Type of a required information symbolРис. 1. Тип искомого информационного символа
Расположение точки в пространстве задаётся тремя независимыми параметрами, жёсткого тела - шестью. В описываемом алгоритме используется система координат, связанная с наблюдаемым объектом и использующая азимут, угол возвышения и расстояние до «точки наблюдения» в качестве параметров (см. рис. 2). Вращение камеры вокруг точки наблюдения определяется через расположение и поворот объекта наблюдения в картинной плоскости. Если предположить, что все объекты находятся в одинаковом вертикальном положении и .камера не может вращаться вокруг своей оптической оси, то можно избавиться от одной неопределённой координаты - угла вращения в картинной плоскости. Это предположение существенно упростит алгоритм, но в данной работе не учитывается.
Spatial model of supervision of objectРис. 2. Пространственная модель наблюдения объекта
В алгоритме используется информация о положении каждого информационного символа относительно других символов. Это позволяет реализовать психологическое свойство «инвариантности восприятия» применительно к расстоянию до объекта, поворота и расположения объекта в картинной плоскости. Остаются лишь неопределённости в азимуте и угле возвышении. Итак, необходимо варьировать всего два угла и попытаться идентифицировать объект.
Алгоритм реализован в среде МаtLаb 6.5.
Предварительная обработка изображения
Обработка изображения состоит из трёх этапов:
1. Выделение контрастных перепадов на исходном монохромном изображении.
2. Выделение прямых линий из контрастных перепадов.
3. Создание разностной матрицы углов.
Выделение контрастных перепадов
Выделение контрастных перепадов на изображении включает в себя [2], [3]:
- Фильтрацию изображения низкочастотным фильтром для избавления от шумовых точек. В данной работе использовался Гауссов фильтр.
- Нахождение векторов градиента яркости.
- Выделение локальных максимумов градиента вдоль направлений градиента.
Результатом такой обработки значений яркости выбранного участка сцены является бинарный рисунок, на котором значение яркости точек с повышенным локальным контрастом равно единице, а остальных - нулю. Важно отметить, что выходной рисунок содержит кривые контрастных перепадов шириной в одну точку.
Выделение прямых линий
Алгоритм заключается в следующем:
1. В бинарном рисунке, полученном после выполнения предыдущего алгоритма, находим какую-либо точку с единичным значением яркости, записываем в значение яркости нуль и переходим к пункту 2. Если таких точек нет - выходим из алгоритма.
2. В окрестности этой точки ищем другую единичную точку. Если не находим, то переходим к пункту 1. Если находим, то записываем нуль в значение её яркости и вычисляем коэффициенты параметрического уравнения прямой, проходящей через эти точки:
ХN = КX*N + ХO, YN = КY*N + YO,
здесь ХO, YO, КX и КY - коэффициенты параметрического уравнения; N - порядковый номер точки; ХN, YN - её координаты.
3. На основании уравнения прямой экстраполируем расположение следующей точки.
ХN + 1 = КX*(N + 1) + ХO, YN + 1 = КY*(N + 1) + YO,
Если на расстоянии, не большем заданного, от экстраполированной точки находится единичная точка, то записываем нуль в значение её яркости и переходим к пункту 4, иначе - к пункту 5.
4. Вносим вклад очередной найденной точки в коэффициенты параметрического уравнения прямой.
KX = (SumX – N*ХO)/SumN, KY = (SumY – N*YO)/SumN*,
здесь
SumХ = Х1 + Х2 +...+ХN;
SumY = Y1 + Y2 +...+YN;
SumN = 1 + 2 + … + N;
*)Суммируется по всем точкам отрезка левая и правая части параметрических уравнений. Вычисляется средний коэффициент наклона для всех точек, принадлежащих отрезку.
Переходим к пункту 3.
5. На этом нахождение очередного отрезка заканчивается. В случае, если его длинна больше заданной, он заносится в список отрезков, содержащих координаты концов, углы с горизонталью и длины отрезков. Переход к пункту 1.
Пример результата работы алгоритмов, выделение контрастных перепадов и прямых линий представлен на рис. 3.
Создание матрицы разностей углов и матрицы относительных длин
Разностная матрица углов строится на основании списка отрезков, полученных при выполнении алгоритма, выделения прямых линий. Для каждого отрезка существует столбец и строка. На пересечении строк и столбцов стоит разность углов, составляемых отрезком строки и отрезком столбца с горизонталью в картинной плоскости.

№ отрезка

1

2

n

1

0

а1-а2

...

а1-аn

2

а2-а1

0

...

а2-аn

...

n

аn-а1

аn-а2

0

The top part - the initial image, average - contrast differences, bottom - the pieces allocated on the imageРис. 3. Верхняя часть - исходное изображение, средняя - контрастные перепады, нижняя - отрезки, выделенные на изображении
Аналогичным образом строится матрица относительных длин. Элементами матрицы являются отношения длин отрезков строки к длинам отрезков столбцов (по диагонали будут стоять "1").
Эти матрицы и список отрезков, найденных на сцене, являются результатом работы алгоритма предварительной обработки изображения.
Работа с моделью объекта
В качестве объекта поиска предполагаются предметы, содержащие на их контурном изображении большее количество прямых линий, нежели кривых. В памяти машины модель объекта представлена списком вершин граней и их координатами. Работа с моделью состоит из следующих этапов:
- вращение модели при помощи матрицы поворота в углах азимута и возвышения.
- выделение информационных символов в модели.
В данном алгоритме происходит умножение координат вершин на матрицу поворота, проецирование результата на картинную плоскость и определение видимых отрезков. Из них составляется список отрезков модели, содержащий координаты концов, углы с горизонталью и длины отрезков.
Выделение информационных символов в модели
На входе алгоритма существует параметр, определяющий количество информационных символов, использующихся для распознавания. Для нахождения информационных символов выбираем в качестве «основных отрезков» (см. рис. 1) отрезки с большей длиной. Для каждого символа по списку отрезков модели определяются отрезки, являющиеся дополнительными. Считаются углы между «основным» и «дополнительными» отрезками. Находятся относительные длины «дополнительных» отрезков. С учётом принадлежности к вершинам формируем список для каждого информационного символа.
Полученные таким образом списки информационных символов характеризуют искомый объект при наблюдении под заданным азимутом и углом возвышения.
Сопоставления модели с изображением
Алгоритм ищет информационные символы, полученные из алгоритма работы с моделью, на сцене. Сцена характеризуется списком отрезков, разностной матрицей углов и матрицей относительных длин.
Алгоритм работает следующим образом:
1. Берется информационный символ.
2. В разностной матрице углов изображения ищется с предопределённым допуском значение первого в списке информационного символа вершинного угла (см. рис. 1). Если такие углы найдутся, то по их координатам в матрице составляется список пар отрезков их образующих, и алгоритм перейдёт на пункт 3. Если углов, удовлетворяющих условиям поиска нет, то выбирается следующий вершинный угол, и процедура поиска повторяется.
3. Для каждой пары отрезков проверяется условие близкого (не более заданного) расположения их концов. Если условие выполняется, то эта пара отрезков передаётся вместе с другими, удовлетворившими условиям, отрезками на пункт 4 алгоритма.
4. Данная часть алгоритма занимается подсчётом баллов статистики в пользу того, что определённый отрезок на изображении является «основным отрезком» для очередного информационного символа модели. Подсчёт ведётся по таким правилам: Если угол находится с правильного (с учётом бита направления нумерации) конца отрезка, или порядок нумерации не определён, то к статистике прибавляется +1 и, если нужно, определяется порядок нумерации. Если угол на неправильном конце, то значение баллов статистики не меняется +0, а направление нумерации меняется на противоположное. Если отношение длин этого отрезка с «дополнительным» на изображении соответствует отношению в информационном символе модели, то к статистике баллов прибавляется +1.
5. Если ещё остались непроверенные «вершинные углы», то выбираем очередной и ищем его в разностной матрице углов с предопределенным допуском и переходим к пункту 3. Если же все углы проверенны, переходим к пункту 6.
6. Для информационного символа модели известен максимальный балл, он равен количеству дополнительных отрезков, умноженному на 2. На основании этой информации и информации о баллах статистики определяется вероятность того, что отрезок - «основной» в информационном символе. Максимальное значение вероятности записывается в качестве вероятности идентификации информационного символа.
7. Пункты 2-6 повторяются для всех информационных символов. Суммируются вероятности идентификации символов, и сумма делится на количество информационных символов. Значение интерпретируется как вероятность идентификации объекта на изображении при данных углах обзора (углы азимута и возвышения).
8. Пункты 1-7 выполняются для всех значений азимута и углов возвышения от 0° до 360° с заданным шагом. Сравниваются вероятности идентификации объекта. В окрестности значений углов с максимальным значением вероятности методом половинного деления с уменьшением допуска угла при поиске находится предположительное расположение модели объекта в углах азимута и возвышения. На изображении выделяется подмножество отрезков предположительно принадлежащих объекту. По данным их координат вычисляется расстояние и расположение в картинной плоскости.
Возможность параллельной обработки
В рассматриваемом алгоритме обработки изображения каждый из этапов, за исключением этапа выделения прямых линий, может выполняться параллельно, так как все изменения пикселов, заносятся в отдельный массив. Новые значения не заносятся в обрабатываемый в данный момент массив. Алгоритм выделения прямых линий имеет линейную зависимость скорости от количества точек в изображении контрастных перепадов.
Алгоритм работы с моделью может работать параллельно с алгоритмом сопоставления модели с изображением, поскольку он должен предоставлять данные для разных углов наблюдения тела в моменты, когда алгоритм сопоставления модели и изображения закончит сравнение на очередном угле обзора. Его реализация возможна на прикладном программном интерфейсе ОреnGL, который может использовать аппаратную часть видеоадаптера для генерации видов распознаваемого объекта [4].
Скорость работы алгоритма сопоставления модели с изображением имеет квадратичную зависимость от числа отрезков на изображении, так как мы имеем дело с поиском чисел в матрице, имеющей количество значений равное квадрату количества отрезков. Так же скорость работы алгоритма линейно зависит от количества отрезков на модели.
ЛИТЕРАТУРА
1. Дуда Р., Хорт П. Распознавание образов и анализ сцен. М.: Мир, 1976.
2. Пратт У. Цифровая обработка изображений. М.: Мир, 1982. Т. 1, 2.
3. Павлидис Т. Алгоритмы машинной графики и обработки изображений. М.: Радио и связь, 1986.
4. Эйнджел Э. Интерактивная компьютерная графика. Вводный курс на базу ОреnGL 2-е изд. Пер. с англ. М.: Вильяме. 2001.

Тема наблюдения за объектами на VI конференции «Цифровая обработка сигналов и её применение» (по материалам РНТОРЭС им. А. С. Попова). Доклад НИИ измерительных систем им. Ю. Е. Седакова.
Исследование метода обработки видеоизображений и идентификации объектов, инвариантного к пространственным изменениям анализируемой сцены. Решение задачи идентификации объектов на некотором двумерном изображении позволит повысить надёжность систем контроля и управления. При общей постановке такой задачи требуется идентифицировать объект в реальном времени при пространственных изменениях анализируемой сцены, то есть, при различных ракурсах наблюдения и масштабах приближения к ней. Обобщенная функциональная организация классической методики обработки изображений и идентификации объектов представляет последовательность этапов:
- сегментация изображения;
- построение аналитического описания полученных образов;
- классификация.
На этапе сегментации изображения реализуются его предварительная обработка и бинаризация относительно рассчитываемого порога. Для предварительной обработки используется набор фильтров: медианный, линейный НЧ-фильтр, соляризация.
Операцию медианной фильтрации изображения окном 3 х 3 можно представить через функцию, осуществляющую сортировку по возрастанию значений яркостей и сохранение 5-го элемента отсортированной выборки, через интенсивность точки (i, j) изображения до фильтрации, через интенсивность после фильтрации. Низкочастотная фильтрация изображения представляет собой свёртку элементов изображения с маской. Операция срляризации изображения сводится к вычислению через коэффициент управления динамическим диапазоном изображения по квадратичному закону.
Результатом сегментации изображения является получение последовательности образов. На этапе построения аналитического описания для каждого образа рассчитывается набор классификационных признаков. Выбор соответствующей базы признаков описания объектов поиска определяет инвариантность процедуры идентификации относительно пространственных изменений анализируемой сцены. В качестве признаков классификации использовались пространственные и спектральные характеристики объектов. В предлагаемой методике к пространственным признакам относятся значения коэффициентов формы объекта, его характеристики внутренней конфигурации, характеристики контура. Расчет пространственных признаков проводится относительно центра тяжести соответствующего образа. К спектральным признакам классификации относятся значения средней яркости объекта распознавания и его гистограммные спектральные характеристики.
На этапе классификации в условиях априорной неопределённости осуществляется принятие решения о степени сходства входного представления значений признаков с множеством эталонов. В силу значительной нелинейности поставленной задачи (инвариантность относительно пространственных изменений) этап классификации реализован на основе нейросетевого подхода. Разработка архитектуры нейронной сети (НС) проводилась для полносвязной НС типа многослойный персептрон. Оптимальной считалась сеть с максимальным качеством и минимальной ошибкой классификации. Под ошибкой на подмножестве понималась квадратичная ошибка, равная сумме квадратов разностей между ожидаемыми целевыми и фактическими значениями функций активации каждого выходного нейрона при подаче на вход наблюдения из данного подмножества. Под качеством сети на подмножестве понималась доля правильно классифицированных наблюдений из этого подмножества. Обучение НС происходило на массиве наблюдений, включающих в себя параметры классификации, подающихся на вход этой сети и ожидающихся выходных значений НС – классов объектов распознавания. В качестве оптимальной была признана архитектура трёхслойного персептрона: ошибка этой сети при классификации предложенных объектов составила 0,0473, а качество – 0,9955.
Для отработки алгоритмов методики был подготовлен каталог тестовых видеоизображений. Объектами поиска и идентификации служили объекты городской застройки на фоне неоднородного антропогенного пейзажа. Создание каталога тестовых видеоизображений проводилось под различными ракурсами наблюдения в диапазоне углов 30 град. и на удалении от объектов поиска 200-2000 м. Техническая реализация методики выполнена в виде экспериментального макета. Этапы сегментации изображения и построения аналитического описания выполнены на нейропроцессоре Л1879ВМ1. Исследования работы системы идентификации проводились на 500 тестовых видеоизображениях сцены из каталога (не совпадающих с подмножеством БД обучения НС). Проверка работоспособности метода обработки изображений и идентификации объектов показала, что система уверенно определяет местоположение искомого объекта в 80% случаев, не находит объект в 5% предъявлений и примерно в 15% случаев наряду с правильным происходит ложное обнаружение. Общее время работы системы идентификации, затрачиваемое на обработку одного цифрового изображения форматом 128 х 64 – около 0,3 с. А. П. Барсуков, журнал "ТКТ", № 8, 2004 г. (через эту ссылку можно бесплатно скачать справочник)

Тема распознавания изображений на VI Международной конференции «Цифровая обработка сигналов и её применение» (По материалам РНТОРЭС им. А. С. Попова; Авторы - Сосулин Ю. Г., Фам Чунг Зунг). Сравнительный анализ эффективности распознавания изображений (РИ) обучающимся векторным квантователем (ОВК) и многослойным персептроном (МСП) (Московский авиационный институт – технический университет).
Показано, что при распознавании двумерных изображений классификатор на основе МСП, обученного алгоритмом обратного распознавания ошибки, имеет большое преимущество по сравнению с традиционными классификаторами: значительно повышаются вероятность правильного распознавания и способность работы в условиях шума, уменьшается время распознавания. Нейросетевые классификаторы могут быть построены и по другим парадигмам. Самоорганизующиеся нейронные сети Кохонена, в том числе ОВК, также могут использоваться для классификации образов. В работе проведён сравнительный анализ эффективности системы РИ, в которой классификатор построен на основе ОВК, а также на основе МСП. ОВК, предложенный Кохоненом, представляет собой двухслойную нейронную сеть с прямым распространением: первый – конкурентный слой, второй – линейный слой. В конкурентном слое нейрон-победитель показывает подкласс, к которому относится входной вектор. Линейный слой комбинирует подклассы и заданные классы. Обучение ОВК – сочетание конкурентного обучения (самообучения) и обучения с учителем. Кохонен предложил три правила обучения ОВК (ОВК1, ОВК2, ОВК3).
В качестве исходных использовались изображения 5 типов самолётов (B-1, F-117A, VF-22A, MIG-29, RAFAL) при разных отношениях сигнал/шум. Структурная схема системы РИ состоит последовательно из блока предварительной обработки, вычислителя моментов Зернике, классификатора.
Блок предварительной обработки служит для нормализации размера, фильтрации, квантования и обеспечения инвариантности изображения к сдвигу и масштабу. Вычисляемые в следующем блоке моменты Зернике используются как признаки распознавания, инвариантные к повороту. Для сравнительного анализа использовались два типа классификатора МСП и ОВК. Для обеспечения качества распознавания максимальный порядок моментов Зернике выбран 12 (соответственно, 47 значений моментов Зернике для одного изображения). Число нейронов входного слоя МСП равно 47, число нейронов скрытого слоя – 10, число нейронов выходного слоя – 5. Другой классификатор построен на основе ОВК и обучен правилам ОВК1, ОВК2 по очереди – для повышения точности классификации. Конкурентный слой имеет 10 нейронов, а линейный слой – 5 нейронов. Число нейронов линейного слоя равно числу классов (в рассматриваемом случае – числу типов самолётов), а число нейронов конкурентного слоя определяет число подклассов и выбирается больше числа нейронов линейного слоя.
Для исследований системы распознавания были созданы обучающие выборки В1-В8, состоящие из эталонных изображений без шума, и тестирующие выборки Т1-Т7. Угол поворота изображения изменялся в диапазоне 0-180 град.
Первая выборка (В1) состояла из 95 изображений: по 19 изображений каждого самолёта с изменением угла поворота на 10 град.
Вторая выборка (В2) состояла из 65 изображений: по 13 изображений каждого самолёта с изменением угла поворота на 15 град.
Третья выборка (В3) состояла из 50 изображений: по 10 изображений каждого самолёта с изменением угла поворота на 20 град.
Четвёртая выборка (В4) состояла из 35 изображений: по 7 изображений каждого самолёта с изменением угла поворота на 30 град.
Пятая выборка (В5) состояла из 20 изображений: по четыре изображения каждого самолёта с изменением угла поворота на 60 град.
Шестая выборка (В6) состояла из 15 изображений: по три изображения каждого самолёта с изменением угла поворота на 90 град.
Седьмая выборка (В7) состояла из 10 изображений: по два изображения каждого самолёта с изменением угла поворота на 180 град.
Восьмая выборка (В8) состояла из 5 изображений: по одному изображению каждого из 5 распознаваемых самолётов в начальном угловом положении.
Тестирующая выборка Т1 состояла из 185 изображений 5 самолётов без шума. Т2 – из 185 изображений, зашумлённых при отношении сигнал/шум q=50 дБ. Т3 – при q=40 дБ. Т4 – при q=30 дБ. Т5 – при q=20 дБ. Т6 – при q=10 дБ. Т7 – при q=5 дБ.
Местоположение и размер изображения в тестирующих выборках выбирались произвольно. При исследовании влияния шума на качество РИ для обучения классификаторов использовалась выборка В2, а для тестирования – выборки Т1-Т7. Эксперименты показали, что по сравнению с классификатором МСП вероятность правильного распознавания в том случае, когда в качестве классификатора используется ОВК, меньше на 2-4%. Время обучения ОВК превышает время обучения МСН примерно на 1-5 с, а время распознавания практически одинаково.
При исследовании влияния числа обучающих изображений (или дискретизации угла поворота) на качество распознавания для обучения классификаторов использовались выборки В1-В8. В режиме тестирования использовалась выборка Т1. Эксперименты показали, что вероятность распознавания в случае МСП больше, чем при ОВК, а при заданной вероятности правильного распознавания необходимое число обучающих изображений меньше. Иначе говоря, способность к обобщению у МСП выше, чем у ОВК. Таким образом, в рассматриваемой задаче распознавания изображений ОВК проигрывает в эффективности МСП. А. П. Барсуков, журнал "ТКТ", № 9, 2004 г. (через эту ссылку можно бесплатно скачать справочник)

Тема распознавания образов на VI Международной конференции «Цифровая обработка сигналов и её применение» (по материалам РНТОРЭС им. А. С. Попова).
Распознавание образов (РО) в дискретном линейном потоке (Ярославский государственный университет им. П. Г. Демидова). Предложен алгоритм распознавания эталонных сигналов в дискретном линейном потоке, основанный на оконном преобразовании Фурье. Его особенности:
- инвариантность к шумам и изменению амплитуды потока;
- инвариантность к сдвигу эталона в потоке;
- трудоёмкость не зависит от длин заданных для распознавания эталонов.
Под дискретным линейным потоком будем понимать бесконечную числовую последовательность. Под образом будем понимать конечную числовую последовательность. Образ, в отличие от потока, известен нам сразу целиком.
Требуется построить алгоритм, на вход которого предварительно подаются образы, далее на вход также подаются порциями отсчеты потока, а на выходе, после обработки порции, выдаётся номер распознанного образа или ноль, если ни один из образов не был распознан в данный момент.
Алгоритм делится на две основные части: предобработку образов с целью выявления наиболее важной для их распознавания информации, и собственно РО в потоке. Главная суть предобработки образа – в нахождении его оконного спектра мощности. При РО очередная порция отсчетов потока преобразуется в спектр мощности. Получившийся спектр сопоставляется с оконными спектрами образов.
Сложности, возникающие при решении данной задачи распознавания:
- поток может быть зашумлён (как правило, импульсным или ВЧ шумом);
- средняя амплитуда потока может меняться, то есть, эталон может выходить из потока усиленным или ослабленным;
- если сравнение потока и эталона производится последовательно в некотором окне, то возможен сдвиг эталона в потоке на величину, не превосходящую шаг окна.
Дискретное преобразование Фурье числовой последовательности (сигнала) задаётся формулой, описывающей дискретный спектр сигнала, откуда определяется дискретный спектр мощности сигнала. Чаще всего, анализируя сигнал, рассматривают его дискретный спектр мощности. Поскольку предстоит иметь дело с действительными сигналами, то можно перейти к одностороннему (нераздвоенному) спектру мощности сигнала, процедура определения которого описана в докладе.
Преобразование отдельного образа делится на этапы:
1) оконное преобразование спектра мощности сигнала;
2) поиск локальных максимумов в спектре по временным срезам и усечение значений спектра по порогу, величина которого определяется как средняя мощность образа по всей его длине;
3) поиск единичных последовательностей, длина которых не менее заданной величины L>1 по частотным срезам бинарной матрицы;
4) усечение найденных последовательностей.
Второй шаг служит для выявления в спектре доминирующих частот, которые наилучшим образом характеризуют сигнал в данный момент времени. После этого шага получаем из оконного спектра сигнала бинарную матрицу тех же размеров, что и спектр. Единица в матрице будет означать, что в данный момент времени в сигнале присутствует ярко выраженная составляющая данной частоты.
После третьего шага количество сопоставляемой информации резко уменьшается (в среднем, в L раз). Величина L – это минимальное «время действия» гармоник, на которые алгоритм будет обращать внимание.
Последний шаг необходим для придания алгоритму инвариантность к сдвигу образа в потоке.
Проблему импульсного шума (мощных кратковременных искажений сигнала) можно обойти, сконструировав инертный сканер, который, в случае несоответствия потока образу, некоторое время будет продвигаться вперёд, принимая поток за верный образ. Максимальное время инертного движения сканера можно задавать жестко или в процентном отношении к длине образа. В первом случае трудоёмкость не будет зависеть от длины образа.
Если поток сначала выдаст неполный образ, а сразу за ним – тот же самый образ, но уже полный, то сканер не сможет его распознать, так как некоторое время будет работать по инерции и пропустит начало настоящего образа. Следовательно, надо последовательно друг за другом запускать каскад сканеров длиной К. Какой бы длины ни был каскад, легко построить образ вместе с предшествующей ему последовательностью потока, который не будет распознаваться. Однако с ростом величины К вероятность появления такой последовательности в реальном потоке уменьшается.
Сканирующее устройство для каждого из распознаваемых образов представляет собой массив сканеров длины К, состоящих из двух полей:
- счетчика продвижения сканера по образу;
- счетчика инертных шагов.
Отсчеты потока подаются на вход сканера порциями длиной, равной ширине окна. Перед тем, как подавать очередную порцию на вход сканера, её необходимо преобразовать в спектр мощности.
Предложенный алгоритм был запрограммирован и состоялись эксперименты. В качестве образов брались небольшие звуковые файлы формата WAV с частотой дискретизации 48 кГц. Они вставлялись в произвольном порядке в более крупный файл, который брался в качестве потока.
Часть экспериментов была направлена на проверку инвариантности алгоритма к зашумлению потока, к изменению амплитуды потока и к смещению образов в потоке. Тестирование показало высокую надёжность РО в потоке.
Другая часть экспериментов была направлена на выяснение максимального количества образов, которые алгоритм способен распознать в режиме реального времени. На современных компьютерах это число составляет порядка нескольких десятков образов. А. П. Барсуков, журнал "ТКТ", № 10, 2004 г. (через эту ссылку можно бесплатно скачать справочник)

Применение генетического алгоритма при анализе двумерного изображения (По сборнику докладов на IV Международной конференции «Цифровая обработка сигналов и её применение»). Автор - Аверьянов Т. А., Московский государственный открытый университет
При построении автоматизированных систем управления часто возникает проблема выделения значимых параметров из общего потока информации, поступающего на вход системы. Алгоритм соответствующего преобразования входной информации не всегда очевиден, а иногда его построение может представлять большие трудности - например, если входные данные слабо структурированы, стандартные и теоретически обоснованные методы отсутствуют или приводят к недостаточно эффективным алгоритмам.
Одним из выходов в этой ситуации может быть применение эволюционных алгоритмов для нахождения требуемого преобразования. Всё множество потенциально возможных преобразований Х = {х1, X2,.., xn} рассматривается как пространство поиска. Каждому преобразованию хi приписывается показатель качества F(хi), отражающий степень его пригодности для решения поставленной задачи. Таким образом, задача синтеза преобразования сводится к задаче оптимизации целевой функции F на пространстве Х.
Для решения описанной оптимизационной задачи целесообразно применять генетические алгоритмы, основной идеей которых является имитация эволюционных процессов в живой природе. При этом каждое решение (в нашем случае - каждое преобразование) хi однозначно представляется набором элементарных количественных показателей (генов): хi = (хi1, хi2, .... хiM). Над случайно выбранным исходным множеством (популяцией) решений (особей) в определённом порядке проводятся операции скрещивания, мутации и отбора. В результате может быть найдена лучшая особь, представляющая собой приближённое решение оптимизационной задачи.
Основные преимущества генетических алгоритмов перед традиционными градиентными методами поиска и методами перебора состоят в том, что, в отличие от первых, не требуется линейности пространства поиска; в отличие от вторых, количество вычислений, как правило, гораздо меньше. Кроме того, не требуется априорного знания общего вида решения. Эти преимущества особенно важны в поставленных выше условиях, когда вид искомого преобразования может быть неизвестен.
Описанный подход был применён к задаче определения одного из технологических параметров по видеоинформации, поступающей в автоматизированную систему управления технологическим процессом. Видеоизображение смеси твёрдых частиц различных размеров и формы поступает на вход системы. Требуется определить средний размер (диаметр) частиц, отображаемых в кадре. Изображение снимается светочувствительной матрицей размером L х L пикселов. Глубина цветопередачи - 1 бит, то есть изображение чёрно-белое. Количество двоичных разрядов в определяемом диаметре ограничено ошибкой дискретизации изображения и равно К = log2L. Дискретизированное изображение содержит М = L2 бит. Таким образом, требуется построить преобразование, входом которого является двоичный вектор из М бит изображения, а выходом - К бит, представляющих двоичные разряды диаметра.
Такое преобразование можно рассматривать как совокупность К булевых функций М переменных. Поскольку о виде преобразования ничего не известно, его можно представить таблицами истинности этих функций, то есть двоичным вектором длиной 2M К.
Для оценки качества каждого преобразования хi применяется тестовая последовательность изображений, для каждого из которых вычисляемый параметр (диаметр) заранее известен. Значение целевой функции F(хi) равно средней ошибке определения диаметра - разности между значением, вычисляемым преобразователем по предъявленному изображению, и точным значением.
Существует Т = 22M К ≈ 22(22K)К возможных преобразований. При такой мощности пространства поиска методы перебора, очевидно, не могут быть эффективны уже для небольших значений К. Если считать, что основное время затрачивается на вычисление целевой функции F(хi), то задача перебора в данном случае вообще является НП-полной относительно К.
Для решения этой задачи был применён генетический алгоритм. В результате работы алгоритма было найдено преобразование, определяющее диаметр частиц со средней погрешностью около 3 пикселей (при размере всего изображения 32 х 32 пикселей). При этом целевая функция вычислялась всего около 70000 раз, что более чем в 221000 раз меньше, чем для полного перебора. Преобразование получено в виде таблицы истинности и допускает не только программную, но и аппаратную реализацию. При проведении эксперимента использовалась программная библиотека GАlib (автор - М. Уолл, Массачусетский Технологический Институт).
Результаты проведённого эксперимента позволяют сделать следующие выводы:
1) задача синтеза преобразования двумерного изображения может быть сведена к задаче оптимизации;
2) для приближенного решения такой оптимизационной задачи целесообразно применение генетических алгоритмов.
ЛИТЕРАТУРА
1. Сиппер М., Краткое введение в генетические алгоритмы, 1996;
2. Даджион Д., Мерсеро М., Преждевременная сходимость в задаче составления расписания, 1996;
3. Бисли Д., Булл Д. Р., Мартин Р. Р., Обзор генетических алгоритмов, 1993.

АНАЛИЗ СТАТИЧЕСКИХ СЦЕН С ПРИМЕНЕНИЕМ КОНЦЕПЦИИ ПОЛЕВЫХ СТРУКТУР: ЭКСПЕРИМЕНТАЛЬНАЯ МОДЕЛЬ. Описанная в докладе модель была апробирована на системе идентификации графических образов, представленных в виде геометрических объектов, с последующей классификацией объекта. Система выполняет распознавание заданного геометрического шаблона в представленной статической сцене, анализируя отдельные составляющие части шаблона, после чего идентифицированный составной объект передается нейронной сети, выполняющей более расширенную и точную классификацию неделимых частей идентифицированного объекта. Она была использована в приложении распознавания государственных регистрационных знаков транспортных средств. Из доклада А. О. Чечеля, В. С. Чистова на конференции "Современное телевидение"

Поиск по содержимому изображения поддерживает картридж Oracle VIR, о чем рассказала компания «ФОРС» на конференции «EVA'99 Москва». Картридж, базируясь на таких внутренних визуальных атрибутах изображений, как цвет, структура и текстура, эмулирует процесс, посредством которого люди воспринимают сходство между изображениями. Для этого картридж устанавливает основные характеристики изображений и обеспечивает управление теми из них, которые являются основными при вынесении решения о соответствии. В число таких характеристик входят:
глобальный цвет, представляющий количество каждого цвета в пределах изображения, независимо от места его позиционирования;
локальный цвет, представляющий распределение цветов с точки зрения того, как они распределены в изображении (например, синий цвет занимает верхнюю часть пейзажа);
текстура, представляющая мелкомасштабные элементы изображения (например, зернистость или гладкость);
структура, представляющая обнаруженные в изображении формы.
В процессе сопоставления пользователь назначает каждому визуальному атрибуту меру значимости (вес), а затем пакет Oracle interMedia вычисляет меру сходства между двумя изображениями для каждого атрибута. Пользователь может назначить величину отсечения (порог), чтобы с его помощью определить, являются два изображения аналогичными или нет, а также может получить ранжированный ряд сравнений, чтобы с его помощью определить, насколько каждое изображение похоже на заданное. Кроме того, результат первого запроса на изображения, которые «выглядят похожими на эту картинку», может быть пространством поиска для повторного запроса. Другими словами, результатом первого поиска могут оказаться несколько изображений, немного отличающиеся друг от друга, и одно из них окажется ближе к тому, которое имел в виду пользователь.
Формат компьютерных изображений ISO/IEC 10918 был рассмотрен в докладе сотрудников Государственного Исторического музея на конференции «EVA'99 Москва». Формат стал, по существу, музейным стандартом для баз данных изображений благодаря применению в ряде проектов ЕС, он использован в крупнейших музеях и архивах изображений мира, на его основе создана единая Европейская сеть компьютерных изображений «Museus On Line». Преимущество формата — он открытый, и благодаря этому возникает возможность создания сервисных программ, а также интегрирования его в существующие приложения. Формат состоит из:
- графического формата компьютерного изображения JTIP;
- системы индексации (описания) SPIFF;
- регистрации RECAUT изображений на английском и национальных языках.
Структурное лингвистическое описание изображений в ISO/IEC 10918 является этапом на пути создания формата JPEG 2000 с автоматическим компьютерным распознаванием образов. Система же регистрации изображений RECAUT разработана для защиты интеллектуальной собственности и безопасного обмена и коммерческого использования компьютерных изображений. А. П. Барсуков, журнал "ТКТ" № 2, 2000 г. (через эту ссылку можно бесплатно скачать справочник)

Альтернативный способ обучения многослойных нейросетей прямого распространения в задаче распознавания образов (По сборнику докладов на IV Международной конференции «Цифровая обработка сигналов и её применение») Автор - Колентьев С. В., Саратовский государственный технический университет
На сегодня наиболее часто используемый в целях обучения сети алгоритм обратного распространения страдает своей медлительностью и не гарантированным успехом распознавания искаженных образов при цифровой обработке сигналов. Кроме того, остается неочевидной зависимость между количеством нейронов в скрытых слоях модели и количеством распознаваемых сетью образов, а также точностью их распознавания. Также, сеть в результате обучения с помощью алгоритма обратного распространения (и многочисленных его модификаций), на этапе распознавания образов в сигнале начинает вести себя непредсказуемо. В результате на выходе сети при распознавании появляются образы, которым ее никто не обучал или не распознаются сигналы очень похожие на элементы обучающей выборки. При задании более строгих ограничений на качество обучения, сам процесс тренировки сети может затянуться на неопределенный срок.
Предлагается алгоритм, позволяющий избежать всех этих неприятностей, а кроме того, заранее, на этапе проектирования модели, знать сколько потребуется в ней нейронов для конкретного объема обучающих образов.
Алгоритм содержит элементы обучения, чем-то похожие на методы встречного распространения.
Topology neuronetТопология нейросети
Метод обратного распространения ошибки [1] (bасk рrораgаtion) основан, фактически на многомерной антиградиентной оптимизации синаптических весов сети в соответствии с набором обучающей выборки - пар входных образов и соответствующих им желаемых выходных значений сети. Метод же встречного распространения [2] (соuntеr рrораgаtiоn) основан на отыскании корреляция пар этих образов обучающей выборки (входных и соответствующих им «желаемых» выходных).
Рассмотрим ситуацию, когда у нас имеется k образов в обучающей выборке. Причем каждому «входному» образу Vi соответствует один выходной образ Di (i = 1..k). В каждом входном образе содержится т элементов (Vij - j-тый элемент i-го входного образа), а в каждом выходном образе содержится n элементов (Dij - j-тый элемент i-го выходного образа).
Задача распознавания сети сводится к тому, чтобы сопоставить искаженному входному образу Рi, похожему на один из входных образов, соответствующий ему «желаемый» выходной образ, причем это будет не обязательно один из выходных образов обучающей выборки, а скорее комбинация из нескольких Di, в соответствии со степенью искажения Рi по отношению к Vi.
Рассмотрим, также топологию сети (см. рисунок). Это обычный «персептрон» - многослойная сеть прямого распространения.
Для каждого синаптического веса wij будем полагать, что i - это индекс нейрона из предыдущего слоя, а j - это индекс нейрона, которому принадлежит вес wij.
В таком случае этап обучения состоит из шагов:
1. Синаптические веса нейронов входного слоя принимают значения в соответствии с выражением wij = Vji. Это означает, что веса содержат в себе «следы» входных образов обучающей выборки.
2. Синаптические веса нейронов выходного слоя принимают значения в соответствии с выражением wij = Dij. Это означает, что веса содержат в себе «следы» выходных образов обучающей выборки.
3. Синаптические веса нейронов скрытого слоя принимают значения, по суть, коэффициентов корреляции элементов входных и выходных образов. Выражение для них имеет вид:
Synaptic weights neurons the latent layer
где i,j = 1…k. Первая из этих формул, по сути, определяет коэффициент присутствия j-го образа во входных значениях сети, тогда как вторая определяет коэффициент «похожести» входного образа на i-тый образ.
Выходное значение каждого нейрона рассчитывается в соответствии с выражением:
Target value of everyone neuron
где F - функция ограничения, u - порог, Ini - входные значения для нейрона, wij - его cинаптические веса, р - количество входов нейрона, а i - номер нейрона в слое.
Как правило, выбор функции ограничения остается на усмотрение разработчика, так что все приведенные здесь выражения для подсчета начальных значений весов взяты без ее учета. Порог чаще всего в практических моделях тоже не используется. Собственно говоря, данная модель может использоваться как прослойка в «более многослойной» сети произвольной топологии. Если использовать порог или ограничительную функцию в этой модели, то необходимо подкорректировать начальные значения весов wij в вышеуказанных трех пунктах.
Итак, первый слой нейронов вычисляет коэффициенты корреляции заданного в процессе распознавания входного образа Рi с каждым входным образом Vi из «эталонной» обучающей выборки.
Далее по этим коэффициентам скрытый слой вычисляет коэффициенты присутствия во входных значениях Рi каждого из k входных образов Vi обучающей выборки (коэффициент «присутствия» - это, по сути, выход каждого из нейронов скрытого слоя).
И уже по этим данным выходной слой подсчитывает реальный выход сети, скомбинированный из всех выходных образов а обучающей выборки, в соответствии с коэффициентом присутствия каждого из них.
Между тем, гарантировано, что при появлении образов Рi, максимально численно «похожих» на Vi, выходы сети будут максимально похожи на Di.
Как видно из рисунка, на всю модель требуется 2k + n нейронов с k(k + m + n} синаптическими связями. Это, конечно, требует немалых затрат оперативной памяти, однако взамен мы получаем возможность обучить ее всем нужным образам выборки за один раз, не прибегая к итерационным процессам.
Самое удобное, что после этого данную модель можно дообучать по своему усмотрению любым доступным методом, в том числе и методом обратного распространения ошибки.
Кроме того, дообучение можно тоже оптимизировать. Как видно из вышеописанного, модель требует значительных затрат памяти (в основном на скрытый слой). Вследствие этого, при дообучении, когда появился новый образ, которому нужно натренировать сеть, мы можем пойти двумя путями:
1. Если нехватки оперативной памяти у нас нет или сравнительно мало образов в обучающей выборке, то просто добавляем новый образ как самостоятельный. При этом в скрытый слой добавляется еще один нейрон; добавляются синаптические связи с ним в входной, скрытый и выходной слои, веса в которых устанавливаются в соответствии с выражениями для инициализации соответствующих wij, описанных выше.
2. Если же оперативная память в дефиците или количество образов в обучающей выборке число немалое, то можно поступить по аналогии с обучением карт Кохонена, а именно: никаких нейронов не добавлять, а сместить «акцент распознавания» в пользу того (или тех) образов Vi, на которые похож новый (добавляемый) образ Рi, пропорционально его «похожести». Достигается это путем умножения диагональных весов синаптической матрицы скрытого слоя на величину этой самой «похожести». Эту «похожесть» можно рассчитывать по разному. Кроме того, можно не умножать все диагональные значения весов wij, а посчитать их сумму постоянной величиной и перераспределить эти значения весов в соответствии с коэффициентом схожести.
Предложенный алгоритм позволяет снизить временные затраты на обучение нейросети и, кроме того, может использоваться в задачах распознавания образов и обработки цифровых сигналов, в частности их экстраполяции или восстановления искаженных («зашумленных») участков.
ЛИТЕРАТУРА
1. Уоссермен Ф. Нейрокомпьюгерная техника: Теория и практика. - М.:Мир, 1992. - 301 с.
2. Несht-Nielsen R. Counterpropagation Networks. Proceedings of the IЕЕЕ International Conference on Neural Networks, II, IЕЕЕ Рrеss New York, NY, рр. 19-32, 1987.

Ну как, робот-знахарь лечить его будет, или пусть живёт?«Медтехника-2002». Образец машинного зрения продемонстрировал на этой выставке Центральный научно-исследовательский радиотехнический институт. Микровидеотестер МВТ-Л — пока редкая в медицинской практике микроскопная установка для автоматической диагностики возбудителей инфекционных и паразитарных заболеваний. Он может быть использован для обнаружения любых патогенных микроорганизмов, окрашиваемых видоспецифичными флуорохромами. Для него разработано специализированное ПО диагностики малярийных плазмодиев и микробактерий туберкулёза; возможна также его адаптация к обнаружению хламидий, микрофиллярий, трипанасом, спирохет, уриновых и кишечных простейших. Состоит микровидеотестер из люминесцентного микроскопа, сканирующего столика, видеокамеры, компьютера и ПО. Принцип действия основан на том, что после размещения окрашенного флуорохромом препарата на столике и фокусировки выполняется в автоматическом режиме (без участия специалиста) цикл следующих операций:
— перемещение препарата на заданный шаг;
— ввод изображения, находящегося в поле зрения видеокамеры, в память компьютера;
— поиск в видеокадре заданных микроорганизмов;
— запись в память кадров с обнаруженными микроорганизмами и их координат на препарате (при этом могут создаваться банки данных в виде изображений микроорганизмов, трансформирующихся под воздействием лекарственных препаратов).
Тяжело в леченьи - легко в роботизированном гробуОтсюда растёт значение приёмов работы с микроскопом, являющимся одним из ключевых узлов медицинского машинного зрения. Фирма «Карл Цейсс» предложила несколько методов контрастирования, способных помочь в случаях, когда исследуются препараты, которые почти не поглощают света (например, бактерии или живые клеточные культуры) и поэтому с большим трудом наблюдаются в светлом поле. С помощью же методов контрастирования невидимые для глаза оптические эффекты преобразуются в воспринимаемые глазом изменения интенсивности (рис. 1).
В связи с разработками в области стереоскопического компьютерного зрения актуальны разъяснения на эту тему, предоставленные этой же фирмой. Отличительной особенностью стереомикроскопов являются, наряду с большим предметным полем, большие рабочие расстояния. Предельная кратность увеличения, достигаемая современными стереомикроскопами, составляет 250. Различают два принципа действия современных стереомикроскопов (рис. 2).
1. Принцип Грина. Два одинаковых объектива, расположенных под определённым углом друг относительно друга, проецируют два раздельных изображения, наблюдаемые через два окуляра как пространственное изображение.
2. Телескопический принцип. Две раздельные, проходящие параллельно друг другу, микроскопические системы обладают одним главным объективом. При этом пары внеосевых лучей образуют стереоскопический угол. А. Барсуков, журнал "ТКТ", № 6, 2002 г. (через эту ссылку можно бесплатно скачать справочник, авторские материалы которого разрешено использовать для написания таких работ, как эссе, сочинение, доклад, реферат, курсовая работа, дипломная работа, бакалаврская / магистерская работа, диссертация)

Функция распределения времени поиска при идентификации биологических микрообъектов по телевизионному (ТВ) изображению (По сборнику трудов 15-й Всероссийской научно-технической конференции "Современное телевидение"). Авторы - А. В.Храмов, В. И. Петренко, Е. А. Храмова, (ИНПРИС)
Развитие телевизионной техники привело к ее широкому применению в медицине и биологии. Одна из задач, решаемая с помощью телевизионной аппаратуры в этой области - идентификация биологических микрообъектов, то есть выделение и подсчет частиц определенного вида (формы). Необходимость просмотра большого числа изображений с одновременным обеспечением высокой вероятности правильной идентификации объектов требует правильного выбора параметров ТВ систем. Для их выбора необходимо знание закономерностей зрительного поиска по ТВ изображению и, в частности, вид и параметры функции времени поиска при идентификации биологических микрообъектов.
Как известно [1], зрительный поиск - это последовательный процесс выдвижения и проверки гипотез о сходстве или различии образа искомого объекта с тем или иным участком изображения (другим объектом). Принятие решения об отнесении биологического объекта к искомому или ложному происходит с учетом сходства анализируемого в данный момент объекта с искомым. В работе [2] проведена экспериментальная оценка нескольких критериев сходства изображений и показано, что в качестве критерия сходства изображений Q можно использовать отличие от единицы взвешенного коэффициента корреляции.
Q = |1-Qкор (1), где Qкор - коэффициент корреляции с весовой функцией влияния составляющих пространственного спектра объектов на субъективное восприятие сходства изображений.
Критерий сходства связан с характеристиками ТВ аппаратуры через функцию передачи модуляции [З]. Для определения функции распределения времени поиска в зависимости от сходства, при идентификации биологических объектов, был проведен эксперимент с использованием специально разработанных тестовых изображений. На рис. 1 для сравнения показана одна из реальных картин (микрофотография) поля зрения ТВ микроскопа (а) и тестовое изображение (б).

Рис. 1. а) реальная микрофотография поля зрения ТВ микроскопа, б) тестовое изображение

 

микрофотография поля зрения ТВ микроскопа

Для упрощения расчета критерия сходства реальные изображения микрообъектов на тестовом изображении аппроксимировались фигурами, состоящими из квадратов, пространственные спектры которых известны. Методика эксперимента заключалась в следующем. Оператору ставилась задача обнаружить заданный объект в поле зрения. При этом фиксировалось время поиска заданного объекта, то есть время анализа картины. В процессе эксперимента изменялось количество объектов на изображении и их коэффициент сходства с искомым объектом. Угловой размер поля зрения составлял 60°, освещенность - 150-200 лк.
Обработка результатов эксперимента показала, что вид функции плотности времени поиска Р(tk) соответствует логанормальному закону распределения. Вид функции определяется выражением [4]:

Р(tk) = (√2πσ2)-1∫t-1exp{-[ln(t/m)]2 x 0,5σ-1}dt, (2)

где m и σ2 - параметры закона распределения, равные

m = ехр μ;

σ2 = (k-1)-1∑(ln ti - μ)2, суммирование по i = от 1 до k; (3)

μ = k-1∑ln ti, суммирование по i = от 1 до k.

где k - количество реализаций по одной ситуации (в эксперименте 300-400);

ti - время поиска микрообъекта в конкретном опыте.

Проверка выбранного закона распределения времени поиска по критерию χ2 позволила сделать вывод о том, что функция распределения времени поиска не противоречит логанормальному распределению при доверительном уровне α = 0,01...0,05. На рис. 2 и рис. 3 приведены зависимости математического ожидания времени поиска искомого объекта tобн от количества объектов на изображении n и от коэффициента сходства Q искомого объекта с объектами составляющими фон.

Рис. 2. Математическое ожидание времени поиска искомого объекта tобн от количества объектов на изображении n

 

Математическое ожидание времени поиска искомого объекта от количества объектов на изображении
Рис. 3. Математическое ожидание времени поиска искомого объекта tобн от коэффициента сходства Математическое ожидание времени поиска искомого объекта от коэффициента сходства

Исследование указанных зависимостей показало, что математическое ожидание времени обнаружения объекта линейно зависит от логарифма коэффициента сходства. Это свидетельствует о возможности распространения закона Вебера-Фехнера на рассматриваемый случай взаимодействия стимула и реакции на него. Данные зависимости при 20 ≤ n ≤ 300 аппроксимируются выражением:

tобн = (1,161lnn - 2,97) х (|lnQ| - 2,30).  (4)

На рис. 4 и рис. 5 приведены зависимости параметров распределения времени поиска m и σ2 от количества объектов на изображении и от коэффициента сходства.

Рис. 4. Зависимость параметра распределения времени поиска m от количества объектов на изображении n Зависимость параметра распределения времени поиска от количества объектов на изображении
Рис. 5. Зависимость параметра распределения времени поиска σ2 от количества объектов n на изображении Зависимость параметра распределения времени поиска от количества объектов  на изображении

Таким образом, результаты эксперимента позволили определить функцию распределения времени поиска при идентификации биологических микрообъектов и определить её параметры в зависимости от количества в поле зрения биологических микрообъектов и от их степени сходства с искомым микрообъектом. Полученную зависимость целесообразно использовать, на наш взгляд, при расчете параметров ТВ-систем наблюдения биологических микрообьектов.
ЛИТЕРАТУРА
1. В. И. Кушпиль, Ю. В. Алексеев. Критерий сходства изображений и оценка сложности зрительного поиска: Труды ГОИ, т. 44, вып. 178, Л., 1979.
2. Ю. В. Алексеев, В. И. Петренко, А. В. Храмов. Экспериментальная оценка критериев сходства изображений: Труды ГОИ, т. 57, вып. 191, 1984.
3. В. С. Сусов, А. В. Храмов, В. И. Петренко. К вопросу оценки качества воспроизведения изображений в иконических системах. Вестник дерматологии и венерологии.- М.: Медицина, 1984, № 5.
4. Н. Хастингс, Дж-Пикок. Справочник по статистическим распределениям.- М.: Статистика, 1980.

Об использовании данных приёмников глобальных спутниковых систем определения координат (систем глобального позиционирования) GPS / ГЛОНАСС, встраиваемых в видеокамеры, ноутбуки, мобильные телефоны, ИК-камеры и другую съёмочную и компьютерную технику, в качестве метаданных для структурирования видео- и аудио информации при её анализе, поиске и архивировании

«Признаки раба бесстыжего, годного, чтобы смотреть за собаками или лошадьми, таковы: нужно, чтобы у него было чистое лицо и чистое тело, лицо круглое, тонкие руки и ноги, темно-серые глаза, отливающие в синий, высокий рост, молчаливость, волосы темно-рыжие, плоские»

Кей-Кавус, «Кабус-наме» (Глава XXIII «О покупке рабов и ее правилах»), XI в.

Темы серии справочников «Компоненты и решения для создания роботов и робототехнических систем»

HD7R8FW - распознавание изображений лиц: метод главных компонент. JFE945E - обучение психологии жестов. NIFTGR9 - параметры лица, классификация лиц. JDT84ET - язык мимики и жестов в иллюстрациях: жестова мова. N8ER5TE - язык телодвижений в общении. J8E5TER - система кодирования движений лица. JDRR9T43 - OpenCV: определение точек на лице, чтение точек, контур обнаружения, сравнение лиц . JFT8Y495 - динамическое слежение за объектами: алгоритм. системы телевизионного слежения за подвижными обьектами. J8954TUE - экспертиза записей видеокамер наблюдения. JDTR8834 - алгоритм выделения контуров изображения. JFGHIRE5 - как пультом дистанционного управления контролируется мимика. GSR745T - программа распознавания изображений с видеокамер. JRY8564 - профайлинг: невербальное поведение. VDF374EW - оптические системы обнаружения, захвата и сопровождения. HD48UFW - распознавание дыма: спектральный анализ. JUERT84 - база жестов руки Image. UR88R4H - OpenCV: распознавание кисти рук. JFUT98RE - Дарвин и мимика: обзор исследований за последние сто лет. HFUR85W - этапы распознавания изображения.  NFUR8WQ - распознавание по цвету глаз. KJGI3OF - контрольная биометрия в торговле. NDU9TGW - тест на распознавание мимики. JSDYRYW55 - анализ антропометрических характеристик. JFUR8W - микродвижения мимики губ, глаз, бровей. FJE8WW3 - обзор методов биометрической идентификации пользователей. NFS84WE - определение угла наклона головы. HIRT8R4 - как натренировать нейросеть на распознавание частей картинки. DU9R9DRF - OpenCV: поиск фигур по шаблону. HD8RISR - распознавание пересечения линий.  JVYR8RY - идентификация возрастных черт лица. XHDUER8 - алгоритм поиска ярких точек. NVJE8RK - система технического зрения со структурированным подсветом. JFURR8E - программа для распознавания лица в темноте. HFYE74E - книга о вестибулярных жестах и мимике. HDYE8YE - время распознавания лиц. NCUER48 - распознавание лжи по  расположению рук. DHUE8R8U - какие из черт лица не меняются с возрастом. DSYERR7 - поиск образов в массиве. CUTIRI39 - язык телодвижений: подмигивание глаза.   FDITRE9R - идентификация человека по ладоням. NHVIIE47 - что изменило в науке распознавание образов.

Поведенческие шаблоны роботов-прорицателей, снабженных системой распознавания образов (приложение к трилогии «Роботы и частное право»):

    Возникновение гадания как мнимого чудодейственного искусства избранных лиц относится к эпохе материнского рода, когда разделение труда зашло достаточно далеко и привело к от делению труда умственного от труда физического, а вместе с тем и к выделению особой категории лиц, монополизировавших духовное влияние в родовых группах (колдуны, маги, знахари и т. п.).
Существующие у разных народов бесчисленно многообразные способы гадания классифицируются в специальной литературе по двум формально-типологическим признакам: гадание по внешним знамениям и гадание по внутреннему просветлению (ясновидение) .
К первому типу относятся следующие виды гадания: по небесным телам (астрология); по огню (пиромантия); по метеорологическим явлениям (гром, град, радуга и т. п.); по воде; по лопаточной кости (скапулимантия); по решету (коскиномантия); по священным книгам (библиомантия); по старинным стихам (рапсодомантия); по птицам и их полету (орнитомантия); по внутренностям животных (гаруспиция); по строению человеческого тела (морфоскопия и физиогномика); по строению руки (хиромантия); по цифрам (арифмомантия); по «дрожанию земли» (геомантия); по кофейной гуще, по бобам, по воску, по игральным картам и т. д. и т. п.
Ко второму типу относятся следующие виды гадания: по сновидениям (онейроскопия и онейрокритика); по «непосредственному откровению» (хресмология и ясновидение); по «показаниям покойников» (некромантия) и т. д...
Гадание по огню известно у многих народов — у древних греков, у североамериканских индейцев, в современной Англии, у татар, кое-где в нашей стране. Техника гадания такова: зажигается огонь (это может быть свеча, костер, лучинка, лампа, лампада и т. д.) и при этом что-нибудь загадывается. В зависимости от того, как горит огонь, считается, что на загаданное дается ответ.' Существует поверье, что при горении сырой лучинки даются следующие ответы гадающему: ясно горит — долго жить, горит с искрами — будут болезни, погаснет лучинка неожиданно — гадающему предстоит умереть в недалеком будущем.
Гадание по воде также весьма распространено. Древние греки гадали по шуму водопадов и речных стремнин, по журчанию ручейков. В дореволюционной России на святках девушки гадали так: они пристально глядели в воду (в прорубь, в ведро, в кувшин и т. п.) с надеждой увидеть в ней своих суженых. Считалось, что наиболее успешным гадание по воде бывает в тех случаях, когда оно происходит на «заговоренной» или «освященной» воде.
Гадания по метеорологическим явлениям имеют глубокую древность и еще сохраняются в наше время в быту многих народов. В Древней Греции считалось, что гром, молния, ветер, радуга, комета и метеор — все это знамения Зевса. В дореволюционной России было издано специальное .руководство для метеорологического гадания под заглавием «Молнияник и колядник пророка Ездры». Пережитком древних метеорологических гаданий являются так называемые приметы, по которым дождь или гром при известных обстоятельствах (например, на свадьбу) или в определенный день (например, в праздник благовещенья), предсказывают урожай, удачу в жизни или несчастье и т. п.
Гадание по лопаточной кости (скапулимантия) теперь уже составляет редкость, но у древних греков и арабов оно было широко известно и считалось, так сказать, гаданием высокого класса. Процедура гадания состояла в том, что в огонь (на очаге или на костре) клали лопаточную кость какого-нибудь животного и держали ее в огне известное время, после чего кость вынимали и рассматривали на свет те фигуры, которые возникли на тонкой части кости от действия огня, «разгадывая» их «таинственное значение»,
Гадание по решету (коскиномантия) было в особенности распространено в средневековой Европе, в Аравии и у среднеазиатских народов для разгадывания воров. Оно и в наше время бытует для этой же цели кое-где в Англии и Германии. Гадающий держит решето подвешенным на нити на одном пальце с таким расчетом, чтобы оно могло медленно поворачиваться; на чьем имени оно остановится (имена подозреваемых в воровстве выписываются на бумажках, которые раскладываются по кругу), тот и есть вор...
Близкой коскиномантии по методу является клеромантия — гадание с помощью жребия. Простейшим способом гадания этого рода является бросание монеты с загадыванием чего-нибудь «на орла» или «на решку». Клеромантический характер носят также гадания по игральным картам.
К библиомантии относятся несколько способов гадания. Простейший способ состоит в том, что гадающий с маху раскрывает какую-нибудь книгу и смотрит, о чем идет речь на открытой странице; что там написано, того и следует ожидать. В старой Руси этот способ гадания был настолько распространен, что ради него была издана «Гадальная книга пророка и царя Давида». Впрочем, подобные издания проникли в Россию из Западной Европы, где во времена средневековья они были весьма распространены. К библиомантии относится также гадание «по рафлям» — разграфленному листу бумаги, где в каждой клетке написано или нарисовано что-нибудь загаданное. На рафли, т. е. на гадательный лист, бросали горошину или пшеничное зерно; на какой клетке оно остановится, то и сбудется. Лет сто тому назад на сельских ярмарках продавались подобные рафли под названием «Колесо фортуны» и «Случаи описания».
Рапсодомантия — это также, в сущности, библиомантия в древнегреческом варианте. Для гадания брали не любую книгу, а произведения Гомера и Гесиода, написанные стихами.
Орнитомантия — гадание по крику, полету, посадке и поведению птиц. Орнитомантия была развита в Древней Греции, где ей придавалось большое общественное значение. В дореволюционной России было известно гадание «на курицу» и «на петуха»: как они клкиот зерно; когда и как поют; какого цвета курица попадется в руки ночью в курятнике. Все подобные «показания» принимались в расчет как имеющие таинственный смысл. Признаком близкого несчастья считалось, если курица вдруг голосила петухом.
Гаруспиция, гадание по внутренностям животных, возникла в глубокой древности и особенное развитие получила в Древнем Риме, где содержались особые жрецы для этого гадания. Гаруспиция известна также у малайцев и полинезийцев, у перуанцев, у монгольских народов, у болгар.
Гадание по строению человеческого тела (морфоскопияи физиогномика) сводится к предсказанию человеческой судьбы на основании тех или иных внешних признаков: цвета глаз, рисунка бровей, устройства рта и контуров губ, наличию родимых пятен и бородавок на определенных частях тела и т, д. и т, п.
Хиромантия, гадание по устройству руки, была известна в глубокой древности у халдеев, евреев, греков, римлян, индусов. Эпоха наибольшего процветания хиромантии в Западной Европе относится к XVI-XVIII векам. Еще в начале XVIII века в большинстве немецких университетов существовали кафедры хиромантии. Хиромантия в своих истоках, по-видимому, связана с астрологией; так, главными признаками руки, которые принимаются во внимание при гадании, являются «семь холмов» на ладони, называемые именами Солнца и шести планет: Меркурия, Венеры, Сатурна, Юпитера, Луны, Марса. Кроме того, по воззрениям хиромантов, имеют значение «линии руки» — морщины на ладони: «линия жизни», «линия природы» и т. д...
Гадание по цифрам (арифмомантия.) связано с наивной верой в таинственное магическое значение некоторых чисел. В особенности эти магические свойства приписываются цифрам 3, 7, 9 и 13. Тройка считается магическим числом потому, что она наименьшее нечетное число после единицы и заключает в себе «триединство». Семерке приписываются таинственные свойства потому, что она «соответствует» семи планетам. Девятка потому-де магична, что она есть тройка, возведенная во вторую степень. Тринадцать считается «чертовым числом» или «чертовой дюжиной».... Арифметическое гадание состоит в том, что имя гадающего пишется цифрами, из которых каждая заменяет соответствующую букву имени. Затем сумму цифр имени делят на одну из «вещих» цифр (3, или 7, или 9, или 13), и дальнейшая процедура гадания состоит в толковании остатка. Арифметическое гадание было вывезено Пифагором из Египта; оно было известно у арабов и евреев и через Апокалипсис утвердилось у народов, воспринявших христианство, у которых арифмомантия связана с так называемым «звериным числом» (666).
Геомантия — это гадание по геологическим явлениям: землетрясения, деятельность вулканов, образование карстовых провалов и т. п. Так как подобные явления наблюдаются главным образом в странах активной вулканической деятельности, то и геомантия получила распространение лишь в некоторых местностях — в Греции, Италии, Японии. Позднее геомантией стали называть очень древний способ гадания, ведущий начало, по-видимому, от халдеев. Гадание производится с помощью песка, который высыпают на заранее подготовленное ровное и чистое, место, покрытое тканью. По тому, как ложился песок и как располагался конус, делались различные предположения о будущем. В. Ф. Зыбковец, «О черной и белой магии»