Электронная память: хроника событий
Электронный документооборот
Робототехника

16 сентября 2009 года российское подразделение корпорации EMC в рамках конференции «Как перейти к безбумажным процессам работы. Современные корпоративные решения для перевода бумажных документов в электронный вид» провело пресс-брифинг

Пресс-брифинг открыла Елена Стрелкова, директор по маркетингу, Content Management & Archiving, ЕМС Россия и СНГ, рассказавшая о конференции, проходящей в рамках европейского Road, на которой представлены решения на основе EMC Captiva по переводу бумажных документов в электронный вид и опыт успешных внедрений в России и в мире, а также об актуальности обсуждаемой на конференции тематики в свете изменений российского законодательства - в частности, вступающего в силу с 1 января 2010 г. федерального закона, регулирующего правовые вопросы свободы доступа к информации. Действие этого федерального закона распространяется на отношения, связанные с обеспечением доступа пользователей к информации о деятельности государственных органов и органов местного самоуправления. Трудности с выполнением этого закона обусловлены тем, что количество обращений граждан может исчисляться сотнями тысяч в год, время на предоставление информации жестко регламентировано, каждая заявка должна проходить проверку и утверждение, предоставляемая информация хранится в бумажном виде. Отсюда пути решения: оцифрованный архив информации, предоставляемой по запросу; автоматическая обработка заявок в бумажной и электронной форме (через e-mail и web-сайт организации); автоматический запуск процессов утверждения и согласования; автоматическая отправка запрашиваемой информации по различным каналам (печать, e-mail, ftp, публикация на сайте); полный контроль секретариата над всеми процессами и загрузкой сотрудников информационных каналов.
Обзор продуктов EMC Captiva и предлагаемых на их основе решений начнём с примера, приведённого Марком Дубле (на фото - в центре), менеджером по продуктам EMC Captiva по региону ЕМЕA и касающегося главной для большинства населения планеты в настоящее время проблемы - трудоустройства. Компания Adecco специализируется на кадровом менеджменте, собирая, с одной стороны, резюме соискателей рабочих мест, а с другой - комплектуя банк вакансий. Затем программа-робот сопоставляет резюме (а резюме соискатель зачастую подаёт на бумажном носителе) и вакансии на соответствие друг другу и генерирует необходимый пакет документов, куда входит контракт с работодателем. Преимущество программы-робота в том, что сводится к минимуму субъективное влияние людей-модераторов. Учитывая, что компания уже имеет филиалы во многих странах (таких, как Швеция, Франция, Италия, Словакия), глобализация рынка труда постепенно становится всё более разумной. 
Наш комментарий. Как известно, первое интеллектуальное решение проблемы кадров в смысле их соответствия занимаемой должности было предложено Гансом Христианом Андерсеном в фантастическом триллере "Новое платье короля". Глубина нынешнего экономического кризиса в некоторых странах усугубляется тем, что подавляющее большинство должностных лиц в этих странах по своим профессиональным качествам абсолютно не соответствуют занимаемым должностям, и когда подбором кадров на эти должности займутся роботы по вышеописанному принципу, от кризиса и следа не останется.
Следующий пример, касающийся на практике очень многих людей, которым приходится решать различные вопросы бюрократического характера с множеством различных организаций - решение "Электронная канцелярия", которое способно облегчить эти утомительные процедуры (во всяком случае тем, кто освоит хотя бы основные правила электронного документооборота). Типичные сферы и аспекты применения "электронной канцелярии":
– Государственные и частные компании, работающие в непосредственном контакте с клиентами, отделы работы с корреспонденцией розничных банков и страховых компаний, колл-центры и организации, оказывающие услуги по материально-техническому обеспечению.
– Обеспечение платформы управления вводом информации для всех входящих документов (как электронных, так и прочих), информация должна направляться нужным лицам.
– Ускорение процесса и сокращение общих затрат на передачу обычной почты, электронной почты и факсимильных сообщений нужным лицам.
– Сокращение затрат на дублирование и пересылку бумажных документов в тех случаях, когда есть необходимость отправки документа нескольким адресатам.
– Исключение риска утери документов и создание надлежащих процедур отслеживания отправленных документов.

Перечислим некоторые особенности и возможности представленных технологических решений безбумажных процессов обработки документов (электронная канцелярия, электронный архив и т. д.)
■ Данные, которые требуют извлечения, определяются автоматически по типу документа
– Некоторые документы требуют только индексации для архивирования и возможности поиска
– Счета, заявки и другие формы требуют извлечение данных из полей
 ■ Использование зонального и свободного извлечения
– Технологии свободной формы позволяют извлекать данные из неструктурированных документов
– Расширенные возможности снижают затраты на ручной ввод и ускоряют бизнес-процессы
При зональном извлечении:
- Уровень достоверности извлеченных данных выше 95 %.
- Время обработки документов месячного объема составляет 3-4 часа
■ Ручной труд только на этапе загрузки бумаги в сканнер
■ Автоматический захват электронной почты и документов, созданных в других системах
■ Удаленный ввод документов через интернет
■ Ввод электронных форм с сайтов
■  Ключевые данные из образов
- Извлечение данных с использованием OCR, ICR, OMR и распознаванием штрих-кода
- Поддержка OCR-индексирования с растяжимыми границами области
- Обеспечение целостности данных
- Валидация по внешним системам и базам данных в режиме реального времени
- Задание специальных бизнес-правил для каждого типа документа
■ Автоматическая загрузка в хранилище
- Динамически управляет экспортом документов на хранение
- Запускает workflow-процесс в Documentum на основе типа документа и/или значения извлеченных данных/индекса
- Управляет доступом к экспортированным документам
- Применяет состояния жизненного цикла к экспортированным документам
- Управляет версиями
- Инициирует и обрабатывает запросы на «пересканирование»
Пример: параметры для установления однозначного соответствия
1. Номер договора
2. Код нефтепродукта
3. Номер ж/д квитанции
4. Суммарный вес
5. Дата ж/д квитанции

Виды сортировки документов
■ Ручная классификация документов
– Удобный интерфейс пользователя
– Готовый справочник типов документов
– Сортировка только в электронном виде
■ Автоматическая классификация
– Автоматическое определение на основании данных из документа и его образа
– 80% входящей информации может быть классифицировано полностью автоматически
– Высокая степень отсева ошибочных документов и спама

Виды извлечения данных из документов
■ Ручное извлечение
– Гибко настраиваемые интерфейсы пользователя
– Дополнительные правила проверки заполнения полей
– Индексация через Интернет
■ Автоматическое извлечение
– Автоматическое распознавание
– Любые виды форм и неструктурированные документы
– Таблицы данных
– 60% документов может быть обработано полностью автоматически
Пример метаданных
1. Автор
2. Данные
3. Откуда
4. Предмет
5. Заказчик

Виды проверки документов
■ Ручная проверка
– Проверка правильности извлеченных и распознанных данных в случае автоматически обнаруженных ошибок
– Автоматическая настройка интерфейса пользователя под соответствующий тип документа
■ Автоматизированная проверка
– Математический расчет значений и гибкая настройка проверок
– Обращение к внешним системам и справочникам с выдачей соответствующих оповещений

Виды передачи документов адресату
■ Доставка документов в бизнес приложение, систему или архив
■ Передача образа документа, файла и метаданных
■ Автоматический запуск бизнес-процессов на основании классификации и распознанных данных

Интеллектуальная проверка
■ Выполнение автоматической проверки достоверности извлеченных данных перед их поступлением в бизнес-процессы
– Поставщик соотносится с данными в другой системе
– Привязка к существующему счету
– Трансформация значения в нужный формат
– Различного рода вычисления: Сумма + НДС = ИТОГО
– Извлечение данных в многостраничном режиме

Интеллектуальная передача
■ Выполнение автоматической передачи документов в бизнес-приложения
– Применения правил передачи данных (что перемещать, в какое приложение)
– Применение политик безопасности при перемещении документов в бизнес-приложение
– Запуск бизнес-процессов связанных с перемещаемым типом документов
– Применение регламентов хранения документов при передачи документов в бизнес-приложения

Классификация документов: общий анализ изображения. Метод автоматического обучения: чрезвычайно просто создать, настроить и использовать
• Анализ макета/графики для определения типа документа
• Алгоритм “Fuzzy-Logic”, не зависящий от языка и формата
• Автоматическая обучаемая система для динамичного создания базы знаний
• При подаче в Dispatcher повторяющихся изображений автоматически создаются семейства автоматически создаются семейства документов (шаблоны)

Классификация документов: локальный анализ изображения
■ Обозначается локальная область (логотип или заголовок) для определения типа документа
■ Семейства документов разбиваются на подсемейства для определения специфического процесса
■ Локальный анализ изображения дополняет общий анализ изображения в случаях различий документов в рамках одного семейства
■ Идентификация документа по специфическим элементам документов (шаблоны)

Классификация документов: анализ по ключевым словам
■ Совпадение ключевого слов для определения типа документа
■ Использование механизма полнотекстного поиска для извлечения информации из документа
■ Поиск совпадений в извлеченном тексте в бизнес-словарях для классификации информации
■ Настройка собственных правил для ключевых слов с использованием часто употребляемых выражений
■ Метод классификации для нешаблонных, не повторяющихся документов и документов в свободной форме
■ Создание специальных правил для проведения различий между аналогичными документами

Классификация документов: сопоставление текста
• Тип документа определяется в тех случаях, когда документы выглядят одинаково и не обладают уникальными ключевыми словами
• Повышается уровень классификации неструктурированных документов в Dispatcher до 40%
• Возможность автоматической классификации до 90% неструктурированных документов

Программа пресс-брифинга также включала представление русской версии исследования международного независимого сообщества AIIM «Extending Capture Capabilities – Measuring the ROI» («Расширение возможностей ввода документов — Измерение ROI»), проведенного по заказу EMC. Результаты нового исследования AIIM свидетельствуют о том, что инвестиции в перевод документов в электронный вид обеспечивают быструю и существенную экономию средств менее чем за 12 месяцев.
Результаты исследования, проведенного по заказу EMC, подчеркивают ценность применения электронных документов для таких областей, как соблюдение требований регулирования, повышение качества клиентского сервиса, экономия офисных площадей и скорость доступа к информации. В ходе опроса выяснилось, что инвестиции в средства сканирования и ввода документов отличаются гораздо более низким уровнем рисков по сравнению с другими проектами в сфере ИТ и при этом зачастую полностью окупаются быстрее, чем за год. В опросе приняли участие 667 специалистов по управлению записями и информацией, сотрудников ИТ и руководителей бизнес-подразделений. Несколько ключевых выводов:
▪ В 42% организаций инвестиции в инфраструктуру сканирования и ввода документов привели к повышению производительности труда на 50%.
▪ В 43% организаций капиталовложения окупились за первые 12 месяцев, а в двух третях организаций — в течение 18 месяцев.
▪ Почти половине предприятий удалось сократить затраты на хранение бумажных документов не менее чем на 40%.
▪ Многие респонденты (41%) назвали "улучшение доступа к информации" важнейшим фактором, побудившим их к инвестициям в инфраструктуру сканирования и ввода документов. Это свидетельствует о том, что, помимо абсолютной окупаемости, предприятия также получают косвенную пользу от повышения эффективности труда персонала. Среди прочих движущих факторов — соблюдение требований регулирования, повышение производительности и улучшение клиентского сервиса.
В ходе опроса также выяснилось, что хотя большинство предприятий уже вложили средства в технологии ввода, в двух третях по-прежнему сканируются только 50% документов от возможного количества. Респонденты отнесли столь низкую цифру на счет нехватки систем ввода в непосредственной близости к бизнес-процессам, а также наличия очень небольшого количества корпоративных приложений, обеспечивающих сканирование.
"Сегодня ввод документов следует рассматривать не как отдельную технологию, а скорее как интегральную часть бизнес-процесса, — говорит Уитни Тидмарш, Chief Marketing Officer направления Content Management & Archiving в EMC. — В дополнение к тесной интеграции с платформой Documentum, новейшие версии EMC Captiva® InputAccel® и EMC Captiva Dispatcher обеспечивают новую сервисную архитектуру, поддерживающую интеграцию с другими бизнес-приложениями и способствующей расширению распространение применения ввода документов в масштабах предприятия. В результате организации повышают окупаемость инвестиций за счет снижения затрат и рисков, ускорения бизнес-процессов и снижения общей стоимости владения".

В программу конференции были включены следующие доклады:
■ Безбумажный офис – мечта или реальность? Как избавиться от бумаги в процессах ежедневной работы. (Марк Дубле, менеджер по продуктам, EMC)
■ Примеры внедрений EMC Captiva в России: Безбумажные технологии в операционной деятельности территориально распределенной банковской структуры. ECM-сервисы, как основа повышения мобильности региональной сети продаж и общей операционной эффективности банка. (Артем Высторобец, Начальник отдела, Организационный департамент, ЗАО ЮниКредит Банк, Группа ЮниКредит)
■ Примеры внедрений EMC Captiva в России: Безбумажная технология в бизнес-процессах ОАО "Сургутнефтегаз". (Иван Чалей, заместитель начальника управления информационных технологий, ОАО "Сургутнефтегаз")
■ Электронная канцелярия. Как перевод в электронный вид всех входящих документов поможет вашей организации увеличить эффективность и улучшить управление документами. (Андрей Николаев, технический консультант, EMC)
■ Решения для ввода документов, используемых в операционных процессах. Как повысить качество клиентского сервиса и повысить эффективность процессов. (Дмитрий Сергеев, технический консультант, EMC)
■ Как использовать уже сделанные инвестиции в системы управления содержанием и Microsoft SharePoint. (Дмитрий Сергеев, технический консультант, EMC)
■ Вычисляем ROI – как обосновать ваши инвестиции в технологии корпоративного ввода. (Михаил Шехтер, консультант, EMC)
■ Обзор технических и функциональных возможностей EMC Captiva Intelligent Capture Platform.  (Дмитрий Пушкарук, технический консультант, EMC)


█ На основе материалов, подготовленных организаторами конференции, приведём несколько обзоров представленных решений

Обзор конкурентных преимуществ последних релизов системы интеллектуального ввода EMC® Captiva®
Решения интеллектуального ввода EMC Captiva позволяют организациям осуществлять ввод, классификацию, извлечение и валидацию важной деловой информации с использованием целого ряда бумажных источников и источников данных, а также передавать такие данные в ключевые приложения операционных подразделений, базы данных и системы управления содержанием. При помощи трансформации бумажных документов в электронное содержание, организации могут снизить затраты, ускорить бизнес-процессы, повысить качество обслуживания клиентов и снизить риски, связанные с соблюдением нормативных требований.
Последние релизы решений для интеллектуального ввода информации EMC Captiva позволяют EMC установить новый стандарт для корпоративных систем ввода информации. InputAccel 6 и Dispatcher 6 предоставляют ключевые преимущества, обеспечивающие потребности организации в области ввода корпоративной информации:
• Ускорение обработки документов и упрощение управления процессами
• Упрощение применения возможностей ввода информации и повышение производительности
• Упрощение процесса настройки специфической функциональности при помощи сервисно-ориентированной архитектуры (СОА) и .NET
■ Можно выделить несколько функциональных возможностей InputAccel 6 и Dispatcher 6
Для бизнес-пользователей:
• Простота использования переработанных программ-клиентов для сканирования и индексирования
• Индивидуально настраиваемое рабочее пространство и «горячие клавиши» предоставляют возможности настройки под индивидуальные задачи и процессы
• Реализована возможность сохранения и совместного использования конфигураций сканера для пользователей, рабочих станций и процессов
• Интегрированная функция создания отчетности, обеспечивающая создание журнала регистрации событий для документов, а также статистика по документам и вводу информации
Для ИТ-пользователей/администраторов:
• Расширение производительности сервера для ускорения обработки документов и повышенных возможностей масштабирования
• Новая консоль центрального администрирования на основе веб-приложения для управления, мониторинга и отчетности по среде ввода информации
• Централизованное управление многосерверными средами ввода информации
• Расширенные роли для поиска пакетов и безопасности предоставляют ключевые возможности для управления корпоративной средой ввода информации
• Простота запуска программы-клиента с использованием технологии Microsoft ClickOnce
• Упрощенный процесс индивидуальных настроек
• СОА ускоряет интеграцию ввода информации
• Скрипты программ клиентов на основе .NET обеспечивают гибкость для определения специфических бизнес-правил
■ Конкурентные преимущества, предоставляемые Captiva следующим типам пользователей:
Бизнес-пользователи: В число бизнес-пользователей входят отдельные пользователи, непосредственно задействованные в процессе ввода информации — операторы сканирования и индексирования, а также руководители операционных подразделений. Еще один вид бизнес-пользователей включает администраторов по работе с заявками клиентов в страховых компаниях, администраторов по кредитным операциям в финансовых компаниях, сотрудники отделов по работе со счетами к оплате, менеджеры по кадровой работе. ИТ-менеджеры: ИТ-менеджеры участвуют в разработке и внедрении проектов ввода информации, а также ежедневной поддержке операций ввода информации. ИТ-менеджеры отвечают за ИТ-инфраструктурный компонент решения, операционные вопросы для них не всегда приоритетны. В категорию ИТ-менеджеров также можно включить администраторов приложений или управления содержанием.
■ Ввод документов и данных на уровне предприятия
Captiva InputAccel 6 является интеллектуальным решением для ввода информации с широкими возможностями конфигурирования и масштабирования, осуществляющим ввод и идентификацию документов, а также автоматическое извлечение и валидацию данных из этих документов перед передачей данных в операционные приложения и системы управления содержанием.
Для бизнес-пользователей:
- Новые программы-клиенты с широкими возможностями конфигурации для приложений транзакционного ввода.
- Новые интерфейсы для сканирования и индексирования предоставляют пользователям и администраторам гибкие возможности индивидуальной настройки этих клиентов по ролям с целью соблюдения требований удобства использования, повышения качества обслуживания пользователей и повышения производительности. Организация рабочего пространства позволяет пользователям изменять размер, перемещать, добавлять и скрывать панели задач. Данные приложения для сканирования и индексирования больших объемов информации обладают возможностями для реализации в веб-среде и могут применяться в масштабе всего предприятия, что упрощает процессы установки и обновления конфигураций программ-клиентов.
Для ИТ-менеджеров:
- Улучшенная производительность, масштабируемость и высокая доступность
Созданные на основе проверенной корпоративной платформы для ввода больших объемов информации, многочисленные дополнения сервера ввода информации InputAccel 6 обеспечивают повышенную производительность и пропускную способность на 50% выше, чем в предыдущих версиях InputAccel. Самый новейший сервер InputAccel в полной мере использует возможности многоядерной обработки, обеспечивая значительный прирост производительности. Возможности InputAccel по восстановлению работоспособности после отказа системы были доработаны и поддерживают кластеризацию Microsoft Active/Active.
■ Расширенные возможности централизованного управления системой
- Новая система администрирования InputAccel на основе веб-приложения предоставляет подразделениям ИТ расширенные возможности для доступа, управления и контроля за всеми системами ввода с центрального пункта, который может находиться в любой стране мира. Используя консоль, подразделение ИТ может управлять мультисерверной средой, осуществлять удаленное администрирование, мониторинг системы ввода, анализировать проблемные пакеты и создавать системные отчеты.
- Упрощение процесса настройки специфической функциональности при помощи сервисно-ориентированной архитектуры (СОА) и .NET.
- Сервисно-ориентированная архитектура поддерживает возможности интеграции с другими корпоративными бизнес-приложениями и позволяет подразделению ИТ использовать стандарты для подключения систем ввода к корпоративным приложениям. Скрипты программ клиентов на основе .NET обеспечивают новую среду разработки для индивидуальной настройки процессов до непосредственной маршрутизации документов и проведения инспекции баз данных, а также валидации на уровне полей.
■ Инновационное и интеллектуальное распознавание документов
Dispatcher 6 обеспечивает интеллектуальное распознавание документов с помощью автоматической идентификации входящих документов — структурированных форм, полуструктурированных и неструктурированных документов, маршрутизации документов на основе предварительно установленных бизнес-правил и извлечения ключевых бизнес-данных с использованием технологий зонального распознавания и распознавания в свободной форме.
Для бизнес-пользователей:
- Расширение функциональности Dispatcher 6.
Используя лидирующие позиции в сфере автоматизированной классификации документов и возможности по извлечению данных, Dispatcher 6 предоставляет следующие дополнительные возможности.
• Обновления процесса распознавания для ускоренной и более точной классификации документов и извлечения данных. Повышенные уровни распознавания улучшают точность классификации документов и извлечения данных, снижая издержки и уровни ошибок.
• Новые возможности распознавания штрих-кодов, включая PDF-417 и Data Matrix.
• Использование самых последних нововведений в InputAccel 6, включая новые возможности для составления отчетов. В готовые отчеты входят уровни классификации документов и статистика производительности пользователей.
• Новые возможности распознавания контрольного считывания/рукописного текста, использование данных возможностей обеспечивает автоматический ввод и извлечение данных о суммах прописью и цифрами из чеков, а также других элементов данных из чеков.
Для ИТ-менеджеров:
- Интеграция в архитектуру InputAccel 6.
Тесная интеграция Dispatcher 6 с InputAccel облегчает процесс управления всей системой ввода информации, снижая общую стоимость владения системой и обеспечивая быстрый доступ к важной системной информации.
■ Дополнения для разработки проектов классификации документов
Функция автоматического изучения документа была дополнена с помощью сокращения количества дублирующих шаблонов документов, в результате чего достигается сокращение трудозатрат на слияние шаблонов.
■ Простота разработки
Dispatcher 6 обеспечивает возможности для устранения ошибок в скриптах классификации и валидации Dispatcher в рабочем режиме, обеспечивая более простой процесс разработки и устранения ошибок в скриптах.
■ Распределенная функциональность ввода информации
InputAccel 6 позволяет организациям с широкой сетью отделений осуществлять ввод документов в крупных и мелких удаленных отделениях, сотнях филиалов и в ситуативных средах ввода информации. Веб-клиент EMC Captiva eInput интегрируется с InputAccel,
позволяя интегрировать удаленные транзакционные процессы на бумажных носителях в централизованные процессы операционных подразделений. Использование этой возможности сокращает издержки и повышает общую производительность пользователей и бизнес-процессов.
Для бизнес-пользователей:
Альтернативные варианты распределенного ввода информации EMC предоставляет несколько альтернативных вариантов распределенного ввода информации для использования в рамках специфических требований клиентов.
• Ввод больших объемов информации в удаленных офисах.
• Распределенный ввод в офисах филиалов — ситуативное сканирование и индексирование.
• Ввод документов при помощи устройств, подключенных к сети — сетевых сканеров и мультифункциональных периферийных устройств (МФПУ).
■ Использование мультифункциональных периферийных устройств для сканирования в филиалах
InputAccel 6 обеспечивает интеграцию InputAccel и решения eCopy ShareScan. Это позволяет удаленным сотрудникам сканировать и индексировать документы непосредственно с сотен различных устройств МФУ, а также передавать цифровое содержание прямо на сервер InputAccel для обработки.
■ Гибкие возможности программы-клиента для выполнения всех потребностей при удаленном вводе информации
eInput предоставляет пользовательский интерфейс на основе веб-клиента, легко интегрируемый с веб-интерфейсами для сканирования и индексирования в среде распределенной обработки организации.
Клиенты сканирования и индексирования InputAccel 6 также устанавливаются по сети и обеспечивают взаимодействие пользователя с интеллектуальной программой-клиентом в тех случаях, когда для удаленного ввода требуется сканирование и индексирование больших объемов информации.
Для ИТ-менеджеров:
- Простота установки программ-клиентов
InputAccel 6 предоставляет новые интеллектуальные программы-клиенты для сканирования и индексирования, легко устанавливаемые при помощи технологии Microsoft ClickOnce. Использование этой технологии позволит быстро установить, настроить и организовать централизованное управление распределенными клиентами.
■ Централизованное управление средой распределенного ввода
Новая консоль администрирования InputAccel 6 предоставляет ИТ-администраторам инструменты для централизованного управления средой распределенного ввода. С этой консоли ИТ-персонал может осуществлять администрирование пакетов, мониторинг процессов ввода и контролировать разрешения безопасности пользователей.
■ Индивидуальные настройки и интеграция
InputAccel 6 представляет новую сервисно-ориентированную архитектуру и клиентские сценарии на основе технологии .NET, позволяя организациям создавать индивидуальные настройки и разрабатывать приложения для ввода информации, а также легко интегрировать их в другие корпоративные приложения и системы.
Для бизнес-пользователей:
- Индивидуальные бизнес-правила для обеспечения достоверности информации и оптимизации процессов
InputAccel 6 использует свои возможности индивидуальной настройки процессов ввода информации при помощи клиентских сценариев на основе .NET. Индивидуальные сценарии могут управлять любой операцией — от валидации поля, поиска по базе данных или направления пакета конкретному оператору. Сервисно-ориентированная архитектура InputAccel 6 позволяет использовать ввод информации в качестве службы для повышения уровня использования в масштабах предприятия, в результате чего достигается дальнейшая экономия затрат и более высокая операционная эффективность.
Для ИТ-менеджеров:
- Сервисно-ориентированная архитектура
СОА InputAccel обеспечивает ИТ-подразделениям повышенный уровень окупаемости вложений посредством снижения затрат и рисков, ускорения бизнес-процессов и более низкой стоимости владения системой.
■ Клиентские сценарии на основе .NET
Инструмент создания сценариев на основе .NET обеспечивает разработчикам ИТ единую среду разработки. Можно разрабатывать индивидуальные сценарии с использованием VB.Net, C#, а также любого другого языка программирования Microsoft, предоставляя разработчикам возможность работать с бизнес-требованиями процесса ввода информации. При использовании клиентских сценариев .NET устанавливаются индивидуальные бизнес-правила для управления маршрутизацией документов, работы с исключениями, поиска по базе данных, предварительного заполнения полей или выполнения валидаций на уровне полей.
■ Модульный дизайн архитектуры
Использование комплекта для разработки модулей .NET позволяет разрабатывать индивидуальные модули InputAccel и применять их на разных этапах процесса ввода информации для проведения валидаций, взаимодействия с другими бизнес-системами или экспорта данных и изображений в серверную систему.

Оценка решений для корпоративного ввода информации: Не все продукты ввода информации равны
Выбирая решение ввода информации в настоящий момент, вы увидите, что выбор продуктов очень широк. Некоторые решения ввода предоставляют простой в использовании подход для тех, кому нужны базовые функции сканирования и индексирования документов, другие решения ввода обеспечивают гибкие функции, оптимизированные для использования в корпоративной среде ввода и предъявляющие исключительные, а в некоторых случаях и комплексные требования. Если рассмотреть основные возможности продуктов ввода, то вы увидите, что большинство решений охватывают все базовые функции — сканирование, повышение качества изображения, распознавание, валидация и экспорт. И в некоторых случаях данные возможности являются достаточными.
Тем не менее, не все потребности некоторых клиентов могут быть удовлетворены при помощи этих базовых функций ввода. К примеру, если вы рассчитываете осуществлять ввод больших объемов информации и различных типов документов, большое значение приобретает возможность приобретения масштабируемого решения, обеспечивающего автоматическую идентификацию документов.
Возможности решения ввода по автоматизации идентификации документов сократят количество времени, затрачиваемое на подготовку и сортировку документов перед сканированием. Автоматизация только одного этого процесса приведет к существенной экономии средств. Если объем сканируемых страниц очень велик, весьма важно выбрать отработанное решение, без проблем масштабируемое на несколько серверов в корпоративной среде.
Так как технологии ввода в последние несколько лет получили большое развитие, упростился процесс их внедрения и эксплуатации в децентрализованной среде, в настоящее время многие организации рассматривают возможности для переноса процесса ввода ближе к источнику информации, к точке входа информации на предприятие. К примеру, в офисы филиалов финансовой компании от клиентов поступает большое количество разных финансовых документов. В централизованной среде ввода эти документы должны пересылаться по почте на центральную площадку для обработки, что ведет к возникновению затрат на пересылку, задержкам доставки, а также требует дополнительных ресурсов от принимающей стороны. Для организаций важно учитывать как ближайшие, так и долгосрочные потребности среды ввода информации, чтобы обеспечить поддержку их решением и централизованного, и филиального ввода документов.
Ниже приведены несколько ключевых аспектов, которые следует учитывать при выборе решения ввода информации. Если ваша организация рассматривает возможности приобретения решения ввода, дальнейший учет этих аспектов может быть полезен в процессе выбора нужного решения.
■ Поддерживает ли платформа ввода информации среду ввода больших объемов информации и среду ситуативного ввода в офисах филиалов?
Требования многих организаций к вводу информации включают комбинацию как централизованного ввода больших объемов информации, так и распределенного сканирования в офисах филиалов. Независимо от того, планируется ли использовать один или оба способа, уверенность в том, что платформа ввода сможет разрешить все аспекты ваших сред ввода в настоящий момент и позволит организации расширяться в будущем, обеспечит покупку нужного решения.
В случае с распределенной обработкой использование одного из этих подходов не обязательно удовлетворит все потребности. К примеру, процесс распределенного сканирования и индексирования может задействовать небольшие объемы ситуативного сканирования или ввод больших пакетов информации. В случае удаленных операций по сканированию больших объемов информации, может понадобиться запуск сервера с изображениями и данными, передаваемыми между серверами в установленное время в течение дня. В случае среды с низкими объемами ситуативного сканирования, когда у организации могут быть сотни площадок, для которых требуются базовые возможности сканирования, перечень требований может включать легко устанавливаемый веб-клиент, или необходимость использования большого количества существующих многофункциональных периферийных устройств (МФУ) для обеспечения ввода в ряде филиалов.
■ Позволит ли реализация решения снизить высокие издержки на подготовку документов?
Одним из наиболее сложных этапов обработки бумажного документа является идентификация его типа. Если ваша организация будет обрабатывать большие объемы документов, макеты страниц которых существенно различаются, то обязательной для вас функцией будет функция автоматической идентификации документов. Функция интеллектуального распознавания документов (ИРД) автоматизирует процессы идентификации и классификации всех типов документов, сокращая объем вмешательства человека. Это означает, что организации в дальнейшем смогут получать выгоду от снижения затрат на подготовку и сортировку документов, а также значительного ускорения процесса передачи введенного содержания нужным сотрудникам и системам.
■ Сможем ли мы оптимизировать автоматизированный процесс ввода информации таким образом, чтобы минимизировать объем ручного ввода данных?
Как уже отмечалось ранее, процесс распознавания данных из формы или документов получил значительное развитие, зачастую документ может пройти весь процесс без вмешательства или при минимальном уровне вмешательства человека. Тем не менее, если вы работаете с комплектом неструктурированных документов, в которых данные не всегда расположены в одном и том же месте, то очень важно иметь возможность извлечения информации из свободных форм. Возможность автоматического ввода всех ключевых данных еще более сократит необходимость ручного ввода данных, неизбежного в других случаях. Для обеспечения достоверности информации решение ввода должно включать способы исполнения бизнес-правил либо с использованием индивидуальных бизнес-правил, либо с помощью соединения с другими бизнес-приложениями и базами данных.
■ Сможем ли мы осуществлять индивидуальную настройку решения для соответствия требованиям нашего бизнеса, или нам придется изменить наши бизнес-процессы для соответствия технологии?
Если ваша организация выдвигает специализированные или комплексные требования, вам следует убедиться в том, что эти требования можно удовлетворить простым способом. Хотя все базовые продукты для ввода информации удовлетворят ваши основные потребности в сканировании, повышении качества изображения, распознавании, валидации и экспорте, это не означает, что такой продукт подойдет вам. Очень важно понимать бизнес-требования к вашему процессу ввода. Если для вас важно соблюсти ускоренные сроки прохождения некоторых документов через систему, важно обеспечить наличие способов для определения приоритетности процессов обработки документов. Организации может потребоваться маршрутизация разных комплектов документов разным операторам для валидации на основе установленных бизнес-правил. Решение для ввода информации, обладающее модульной архитектурой, предоставит вам более гибкую среду для удовлетворения ваши специфических требований к вводу. К сожалению, многие решения для ввода вынуждают вас адаптировать ваши бизнес-требования к способу работы их продукта.
■ Каковы возможности соединения решения с нашими приложениями и бизнес-процессами?
Возможно, это прозвучит как прописная истина, но очень важно в полной мере понимать, будет ли решение работать вместе с вашей системой управления содержания и другими необходимыми бизнес-системами, и если будет, то как? Перед тем, как сделать следующий шаг при необходимости индивидуальной адаптации, важно убедиться в том, что решение предлагает среду разработки, позволяющую интегрировать приложение ввода с различными системами от сторонних производителей. Более того, возможности адаптации существующих интеграционных модулей, разработанных поставщиками, в дальнейшем позволят организации использовать существующий модуль и модифицировать его для собственных нужд. Учет этих ключевых пунктов предотвратит ситуации, в которых организации будут ограничены в возможностях интеграции их приложений.
■ Будет ли приложение поддерживать планируемые нами объемы ввода бумажных документов?
Объем документов, ввод которых планирует ваша организация, является важным требованием. В некоторых организациях объемы страниц чрезвычайно высоки и превышают несколько миллионов страниц в день. Понимание того, что некоторые решения лучше использовать для небольших объемов и нужд отдельных департаментов, знание будущих объемов вашей организации и правильно задаваемые вопросы помогут вам приобрести решение, соответствующее вашим текущим и будущим требованиям к объемам. Если рассматриваемый вами производитель не обслуживает клиентов, соответствующих требованиям ваших объемов, то его решение, возможно, не сможет обеспечить надежную обработку этих объемов.
■ Каким образом я смогу осуществлять мониторинг моей среды ввода и приложений, с которыми она взаимодействует?
В крупномасштабной реализации системы с несколькими серверами многие службы ввода работают бесконтрольно, десятки станций валидации клиентов, каким образом подразделение ИТ узнает о возникновении проблем или узких мест? Большинство текущих продуктов ввода предоставит вам базовые возможности мониторинга пакетов и отчетности, но во многих случаях организациям нужны более совершенные возможности для устранения проблем, возникающих при остановке работы служб, разрыве соединения между приложением ввода и базой данных, либо возникновении в узком месте затора из пакетов, нуждающихся в обработке. Такие проблемы непосредственно влияют на уровень производительности, снижают ценность ввода информации и влияют на общий уровень. Функция мониторинга обеспечит вам полную отдачу от ваших инвестиций. Средство мониторинга приложений должно осуществлять мониторинг всех процессов ввода и позволять ИТ-менеджерам предпринимать опережающие меры до того, как проблема сможет повлиять на деловой процесс.
■ Сможем ли мы использовать данное решение для ввода в нескольких бизнес-процессах?
Некоторые решения для ввода работают только с одним бизнес-процессом, к примеру, обработкой инвойсов или форм требований. Решение для ввода, способное обрабатывать все типы документов, позволит организации использовать решение во многих подразделениях. Хорошим примером является организация из сферы здравоохранения, рассматривающая возможность ввода для обработки документов с детализацией страховых выплат. Подбор решения для ввода информации, способного обрабатывать документы с детализацией страховых выплат, а также другие документы, относящиеся к сфере здравоохранения, позволит организации этого типа достичь наиболее существенной окупаемости вложений.
■ Может ли производитель предоставить нам полное решение?
Ответ на этот вопрос поможет вам узнать, сможет ли производитель обеспечить все ваши деловые потребности. В последние годы рынок систем ввода информации в определенной степени консолидировался, что сыграло на руку организациям, нуждающимся не только в решениях для ввода информации, но и в решениях, управляющих обработкой информации, архивированием содержания и требованиями к хранению информации. Работа с одним поставщиком может быть значительным преимуществом, сокращение количества сторон, принимающих участие в решении рабочих проблем позволяет организации более эффективно транслировать свои потребности, в результате добиваясь максимального эффекта от вложений.

Обзор по технологиям обработки документов и имиджинга
Веками бизнес был основан на бумаге. Во многих отраслях это и до сих пор так. Возьмем, например, ипотечное кредитование. Типичный комплект документов на получения ипотеки может включать сотни страниц, включая различные формы, копии письменных документов, оригиналы свидетельств о правах собственности, цифровые фотографии, факсы и даже рукописные заметки.
Но по мере того, как темпы бизнеса растут, бумага становится бременем и «узким горлом». Она замедляет производительность, поскольку с бумажным документом в один и тот же момент времени может работать только один человек (за исключением случая, когда документ копируют, что тоже занимает много времени и снижает эффективность). В условиях повышения строгости требований среды регулирования бумага также становится фактором правового риска. Необходимость поиска документов в ответ на юридическое требование может привести к значительным штрафам и потере производительности в случае, если документ утерян или не найден.
Чтобы избежать этих и других возможных проблем, организации модернизируют медленные процессы ручной работы. Последние тенденции заключаются в использовании оцифровки и других технологий ввода (например, механизма классификации документов и оптического распознавания символов) для перевода документа в электронную среду в самом начале процесса обработки, когда документ только поступил на предприятие. Разработанные для различных отраслей, интенсивно использующих бумажные документы (таких как финансовые услуги, страхование, здравоохранение, нефтяная и газовая промышленности и производство) и транзакционно ориентированных процессов (таких как, оплата счетов и получение платежей), эти технологии специально созданы, чтобы преобразовать большой объем бумажных документов и другого исходного содержания в цифровую форму и сделать их доступными для автоматизированных бизнес  процессов.
Преимущества от прекращения хождения бумаги могут наступить немедленно и быть очень значительными. Это — улучшение отклика на запросы потребителей, уменьшение продолжительности циклов, увеличение эффективности, снижение затрат и улучшение соблюдения требований регулирования — только за счет автоматизации ручных процессов. Организации, желающей извлечь максимум пользы из своей стратегии обработки документов и образов, следует рассмотреть единое сквозное решение, в котором транзакционное содержание управляется в центральном хранилище совместно с другим содержанием, необходимым для ведения бизнеса.
Организации, отличающиеся высоким уровнем применения технологий управления содержанием на всех участках деятельности, выполняют свою работу быстрее и часто вырываются вперед в бизнесе по сравнению с менее проворными конкурентами. Они принимают лучшие решения на основе целостного обзора всей необходимой информации. Они улучшают обслуживание клиентов за счет лучшего, более быстрого и более полного ответа на запросы. Они избегают штрафов и неприятностей, связанных с невозможностью найти документ в ответ на судебный запрос. И, как свидетельствует типичный опыт заказчиков EMC, они получают от 30 до 50 % выигрыша в накладных расходах и эффективности процессов.
В данном обзоре, главным образом, мы обсудим основные стратегии эффективного использования транзакционного содержания в решениях по обработке документов и образов, включая преимущества автоматического ввода информации, ценность интеграции содержания с управлением бизнес процессами, а также пример сквозного решения, позволяющего средствами единой платформы сделать содержание доступным в масштабе всего предприятия.
Транзакционное содержание: Термин, введенный исследовательской компанией Forrester Research для описания «содержания, которое, как правило, поступает в организацию извне, от заказчиков или партнеров, и использует технологии workflow или управления бизнес  процессами (BPM), чтобы приводить в действие транзакционные бизнес процессы в бэк офисе. В некоторых случаях содержание не только инициирует внутренние процессы, но и является основой для самой транзакции».
Имиджинг и обработка документов: Программное решение, позволяющее организациям с использованием единой платформы управления содержанием вводить, обрабатывать и получать доступ к электронным образам документов. Содержание, которое может включать бумажные и электронные документы, фотографии, отчеты, компьтерно сгенерированные отчеты, XML данные и электронные формы, обрабатывается необходимым образом и интегрировано с функциональными системами, которые обрабатывают данные.
По данным аналитической компании Delphi Group (Бостон): 15% всех бумажных документов, используемых в различных типичных областях деятельности, теряются 30% рабочего времени сотрудники тратят на поиск документов Каждый потерянный бумажный документ обходится компании в 120 долларов США
■ Как выиграть в битве с бумагой: Автоматизация ввода входящих документов
За счет внедрения одного только решения по управлению вводом документов, например, EMC Captiva® InputAccel®, организации сразу же могут добиться существенной окупаемости. Организации сэкономят время, так как данные поступают в обработку гораздо быстрее, чем в ручных процессах. Они снизят затраты, поскольку им потребуется меньшее количество человеческих взаимодействий, что очень важно для любой организации, в которой непрерывно растет объем обрабатываемой информации и документов, но количество персонала неизменно по бюджетным соображениям. Они улучшат качество информации, поскольку ошибки, неизбежные при ручном вводе данных, теперь будут исключены.
Кроме того, за счет использования интеллектуального программного обеспечения распознавания документов, такого как EMC Captiva Dispatcher, организации могут автоматически идентифицировать документы при их вводе и направлять их в соответствующие организации, отдельным пользователям или приложениям. Быстродействующее решение для автоматической классификации, индексирования, извлечения и маршрутизации позволяет компаниям быстро и эффективно обрабатывать огромное количество ежедневно получаемой информации.
В некоторых случаях такая эффективность обработки может стать непосредственным конкурентным преимуществом. Например, в ипотечном кредитовании заявка на получение кредита может включать сотни страниц. С помощью цифрового ввода кредитных документов, извлечения ключевых данных и предоставления одновременного доступа к ним всем сотрудникам и системам, участвующим в оформлении кредита, кредитор может обрабатывать больше заявок на кредит, делая это более точно и быстро.
■ Интеграция транзакционного содержания с управлением корпоративными процессами
Столетие назад Генри Форд доказал, что намного быстрей и дешевле производить автомобили с помощью сборочного конвейера, чем собирать их по отдельности от начала и до конца. Вместо того, чтобы закончить сборку одного продукта, а затем начинать другой, автоматизированная система обеспечивает выигрыш в производительности за счет точной настройки повторяющихся процессов. Она делает некоторые этапы более эффективными, в то же время исключая другие шаги, выполнявшиеся вручную.
Управление бизнес процессами (BPM) привносит эту концепцию автоматизации в программные приложения, такие как обработка претензий и открытие новых счетов, в которых клиенты для ускорения обработки заполняют интерактивную форму. Компании, деятельность которых сильно зависит от улучшения бэк-офисных или транзакционных процессов, все в большей степени используют BPM технологии во многих своих операциях. Компании, не использующие такие процессы, несут риски возникновения дополнительных затрат, низкого уровня эффективности и несоответствия правовым условиям деятельности.
Как приспособить транзакционное содержание к управлению бизнес процессами? Многие компании, использующие транзакционное содержание, имеют множество повторяющихся процессов, тем самым, являясь кандидатами на применение BPM систем. Сюда относятся получение кредита, обработка счетов, обработка претензий, управление делами и открытие нового счета. Ключевым моментом является обеспечения способа предоставления бизнес приложению доступа к необходимой информации в нужный момент времени, чтобы транзакция могла быть проведена точно и гладко. Это выполняется посредством классификации содержания и использования метаданных (данных, описывающих данные) в тот момент, когда документ вводится в бизнес процесс.
Как только транзакционное содержание станет доступным для соответствующего бизнес процесса, организации могут ожидать:
▪ Улучшения отклика на обращения клиентов, так как решения принимаются быстро и точно, а запросы клиентов изучаются быстрее;
▪ Улучшения процесса принятия решений, так как работники интеллектуального труда имеют доступ ко всей необходимой информации, когда это необходимо;
▪ Эффективного многократного использование стандартного содержания, например, заявки на получение кредита, которая становится шаблоном для создания новых заявочных документов;
▪ Снижения риска за счет использования стандартизованных шаблонов, которые гарантируют соответствие процессов правовым и бизнес правилам;
▪ Улучшения реакции организации на прогнозируемые и непредвиденные бизнес или конкурентные факторы.
■ Пример сквозного решения по обработке документов и образов
Страховая претензия, касающаяся ДТП, является примером ситуации, когда множеству разных людей в страховой компании и за ее пределами, включая участников ДТП, полицию и следователей по происшествию, персонал автомастерских и экспертов по оценке ущерба, компании по прокату автомобилей, сотрудников службы внутреннего контроля страховой компании и, разумеется, страхователей и агентов, требуется доступ к одному и тому же содержанию.
В «бумажном мире» обработка такой претензии может быть продолжаться несколько месяцев, так как необходимые материалы находятся в папке, которая перемещается по рабочим столам сотрудников. Один департамент не может начать работу с ней, пока не закончит другой. Даже компании, в которых успешно выполняется оцифровка транзакционного содержания, возможно, не используют все преимущества использования этого содержания, поскольку они работают с несколькими несовместимыми приложениями или из за того, что информация хранится в отдельных хранилищах.
Во многих организациях применяются «точечные решения» первого поколения, выполняющие отдельные функции: одна система для обработки факсов, другая — для электронной почты, третья — для ручной обработки почтовых сообщений и т.д. Но проблемы появляются при передаче данных из одной системы в другую: если все содержание, связанное с транзакционным решением, невозможно собрать воедино, возникают различные задержки и увеличение затрат. Высококвалифицированные и зачастую высокооплачиваемые работники интеллектуального труда тратят много времени на отслеживание, поиск и/или ожидание доступа к информации, необходимой для проведения важных бизнес транзакций.
■ Как единая платформа сэкономила деньги Cincinnati Insurance
Страховая компания Cincinnati Insurance работает на рынке страхования собственности от несчастных случаев в 32 штатах, и ее бизнес модель сосредоточена на поддержании низких расходов. Для сокращения времени обработки претензий, компания Cincinnati Insurance заменила обработку бумажных претензий на автоматизированную систему, включающую центральное хранилище документов.
Новая система позволила снизить время регистрации претензий с 18 30 дней до одного дня и предоставить пользователям вторичный доступ к претензиям, чтобы гарантировать улучшение обслуживания клиентов. Новая система также снижает правовой риск за счет хранения всех данных в защищенном неизменяемом состоянии. Кроме того, Cincinnati Insurance удалось снизить расходы за счет хранения большего объема данных на устройствах хранения с адресацией по содержанию EMC Centera™.
Гари Гивлер, вице президент отдела рекламаций главного управления, говорит: «Единая виртуальная папка претензии является существенным компонентом нашего успеха в высококонкурентной отрасли. Благодаря новой системе управления претензиями мы документируем большее количество претензий меньшим числом персонала. Мы принимаем лучшие и более информированные решения, а также можем быстро реагировать, поскольку наша информация актуальна и доступна централизованно. В свою очередь наши затраты уменьшились, а удовлетворенность клиентов возросла».
За последние годы все эти проблемы усилились за счет процессов консолидации, слиянии и приобретения.
Новые объединенные компании могут иметь несколько различных (и несовместимых) приложений, выполняющие одинаковые функции.
Это основная причина, по которой компании выбирают сквозные решения от таких компаний как EMC, которые используют единый виртуальный репозиторий, чтобы управлять содержанием и сделать его доступным любому приложению, которому оно требуется. Содержанием также управляют таким образом, что организации известно, кто обладает информацией, откуда она пришла и как была
изменена — перспектива, способствующая прозрачности бизнеса и являющаяся существенной для соответствия регулятивным правилам.
Сквозное решение также обеспечивает управление содержанием в течение всего его жизненного цикла.
При этом учитывается, что не вся информация используется одинаковым образом или имеет одинаковую ценность в любое время. Особо ценная информация, например, папки по счетам активных клиентов, хранится на локальных высокопроизводительных устройствах хранения. Неактивные записи могут быть перемещены на более медленные устройства, но они все равно будут соответствующим образом храниться, архивироваться и, что наиболее важно, извлекаться или уничтожаться.
Этапы управления транзакционным содержанием
Теперь рассмотрим процесс внимательней: что фактически происходит при преобразовании бумажных документов и другого транзакционного содержания в цифровые документы и данные и при их передаче в корпоративные бизнес процессы, где можно оценить или использовать эти данные и документы, и как, в конечном счете, они архивируются или удаляются.
Этап 1: Ввод
Чем больше можно ввести и сохранить в электронном виде в одном хранилище документов взаимодействия с клиентами и сопроводительной документации, тем более ценным становится содержание и более просто автоматизировать бизнес процессы. Исходная документация может быть представлена в следующем виде:
▪ Документация, полученная в виде бумажных документов или факсов, а затем отсканированная, введенная и проиндексированная в виде цифровых образов;
▪ Электронные формы, представленные в виде бумажных документов и отсканированные (см. выше) или заполненные и поданные в онлайновом режиме;
▪ Сгенерированное компьютерными системами содержание, такое как счета, выписки и др., веденное посредством COLD систем (Computer Output to Laser Disk) или ERM систем (Enterprise Report Management), например, счета, заявления и др.;
▪ Документы, созданные в приложениях для создания содержания, таких как Microsoft Office;
▪ Сообщения электронной почты и XML данные.
■ Как сквозное решение позволило повысить эффективность работы Commerzbank
Повышение эффективности труда является серьезным фактором выживания на конкурентном рынке розничных и коммерческих банковских услуг. Поэтому Commerzbank, один из ведущих частных банков Европы с активом примерно в 400 млрд. евро, использует в процессе корпоративного кредитования программное обеспечение для управления содержанием EMC Documentum.
Бизнес правила теперь моделируются в рамках автоматизированной системы и вся документация (включая бланки заявок на получение кредита, анализ рисков, таблицы рентабельности инвестиций, презентации, корреспонденцию, годовые отчеты, повестки и протоколы собраний) хранится в центральном хранилище. Документы клиента и другие документы, представленные в бумажном виде, сканируются. Заявки на получение кредита, протоколы собраний и вся кредитная документация вводится с помощью интерактивных XML форм.
Когда внедрялась первая очередь системы, в Commerzbank хранилось около 100 000 страниц документации, связанной с деятельностью за предыдущий год. Рост документации составлял примерно 150 страниц в день (или один картотечный шкаф в месяц). Сегодня, необходимость в хранении бумажных документов практически отпала. Благодаря центральному хранилищу группы сотрудников могут совместно работать над кредитными заявками. В результате повышается эффективность работы и сокращается время до получения конечного утверждения. Уровень внутреннего аудита в банке значительно повысился благодаря улучшенным регламентам ввода и отслеживания событий и действий, а также благодаря исключению возможности потери и неправильного размещения документа.
Как правило, входящее содержание проходит через некоторые или все перечисленные ниже процедуры:
▪ Ввод: Процесс улучшения качества отсканированных изображений может включать очистку от мусора, изменение ориентации страницы, удаление рамки, устранение искажений и другие функции предварительной обработки изображений, предназначенные для уменьшения шума и удаления или игнорирования несущественного материала, и хранения только транзакционного содержания.
▪ Классификация: Использование анализа текста, изображения, а также интеллектуального анализа позволяет автоматически идентифицировать документы и подготовить их к обработке без необходимости использования ручной сортировки или разделителей страниц. Такой анализ позволяет определять документы различных типов, например, форму оценки или форму W 2, и автоматически маршрутизировать документы в соответствии с бизнес правилами. Затем документы индексируются или тегируются, чтобы их легко можно было извлечь из хранилища системы управления корпоративным содержанием или из другой системы.
▪ Извлечение данных: Во многих случаях требуется извлечь данные из транзакционных документов и сделать их доступными для пользователей различных приложений. Например, можно выполнить распознавание рукописного заявления на открытие счета и преобразовать его в машинночитаемый текст.
▪ Валидация: После извлечения данные можно проверить в отношении функциональных приложений для обеспечения их точности и целостности. Например, новое обращение по поводу открытия счета можно сравнить с бизнес правилами для проверки заполнения всех полей.
▪ Экспорт: Во время экспорта данные становятся доступными в соответствующем формате, например, PDF, XML, или в файловую систему, и конвертируются для непосредственного использования в базах данных, например, Microsoft, Oracle, Informix и Sybase. Компании, использующие систему управления содержанием EMC Documentum, могут экспортировать любые данные и документы в хранилище Documentum.
Этап 2: Интеграция с системой управления бизнес-процессами
С того момента, как документ введен в хранилище, его можно включить в работу. Мы уже обсуждали преимущества автоматизированных бизнес процессов для значительного увеличения производительности, улучшения процесса обслуживания клиентов и устранения ошибок.
BPM система позволяет автоматизировать человеческие взаимодействия. Этапы могут включать:
▪ Применение бизнес правил к BPM службам для автоматизации повторяющихся задач, которые традиционно являлись ручными процессами. Например, сверка счета с данными заказа на покупку из ERP приложения, например, Oracle, без участия человека.
▪ Установление очереди, в которой можно указать приоритет для работ или задач и направлять их работникам в зависимости от уровня квалификации и/или пропускной способности.
▪ Интеграция с функциональными приложениями, например, ERP, CRM и Microsoft Office таким образом, что дополнительная информация становится доступной для переписки, исследовательской и коллективной работы.
▪ Обязательное применение технологий управления записями и регламентов хранения для определения, какие документы следует хранить и как долго, а также какие предпринимать меры обеспечения безопасности.
▪ Объединение содержания с соответствующими шаблонами исходящих документов для создания персонализированных коммуникаций, например, формирование писем в отделе обслуживания клиентов.
Идеальное решение обеспечивает сбор всего взаимосвязанного транзакционного содержания в «виртуальных папках», которые содержат все необходимые документы по данному делу, папке, транзакции или заказчику.
Виртуальные папки можно эффективно маршрутизировать и систематизировать таким образом, что информация не будет потеряна или не принята во внимание. Чтобы отклик на запрос был более быстрым, можно использовать управление очередями для автоматической маршрутизации информации соответствующим сотрудникам.
Кроме того, для автоматизации максимального количества процессов и минимизации необходимости ручного вмешательства можно использовать управление правилами. Например, компания может применять правило к счетам ниже, чем на 5 000 долларов США, позволяющее утверждать их автоматически и оплачивать без взаимодействия с человеком.
Этап 3. Доступ в сочетании с необходимыми мерами контроля
Управление бизнес файлами в цифровом виде предоставляет сотрудникам по требованию глобальный доступ к содержанию, которое требуется для обеспечения полного обзора клиентских данных и бизнес  транзакций.
Как только документ оцифрован и сохранен в едином хранилище, необходимые данные можно легко извлечь для получения быстрого доступа к запросу клиента и интеллектуальной обработки этого запроса. Сотрудники могут выполнять поиск, просмотр и аннотирование документов. Извлечение информации происходит быстрее при использовании эффективных функции поиска по метаданным или при навигации по папкам и категориям, структурирующим хранилище.
Доступ также облегчает коллективную работу с целью сокращения времени принятия решений и повышения качества услуг. Теперь, например, все участники конкретного дела имеют постоянный доступ ко всей информации, доступной как часть папки, неважно какой. Коллективную работу также можно автоматически инициировать как часть бизнес процессов; например, на основе критериев, определенных в бизнес-правилах, можно вызвать сотрудников по электронной почте в «виртуальный конференц-зал» (например, EMC Documentum eRoom) для просмотра некоторых заявок.
В обслуживании клиентов лучший доступ к целостному представлению информации приводит к улучшению удовлетворенности клиентов и уменьшению числа клиентов, потерянных из за проблем в обслуживании.
Он также экономит время и деньги, поскольку при первоначальном контакте можно решить большее количество вопросов.
Предоставление лучшего доступа имеет преимущества, но доступ также необходимо контролировать для защиты конфиденциальности клиентов и обеспечения целостности записей. Типичные меры контроля включают:
▪ Меры безопасности для определения того, кто имеет доступ к каждому документу и как часто;
▪ Функции аннотирования, включающие информацию о том, кто комментировал документы и когда.
Этап 4: Архивирование и хранение
Как правило, в обработке содержания наступает момент, когда документ становится неактивным. В этот момент документ можно «логически заламинировать» и поместить под управление системы управления формальными записями. Документ можно выписывать и возвращать в хранилище, но если он будет каким то образом изменен, будет создана новая запись, включающая метаданные о том, кто и когда сделал изменение. Это обеспечивает защиту записи в соответствии с регулятивными и бизнес правилами.
Это также позволяет установить любые регламенты хранения относительно того, как долго хранится документ и где он должен быть расположен.
■ Как компания может эффективно хранить информацию после того, как процесс обработки счета закончен?
Выбор стратегии хранения очень важен в связи с большим объемом хранимых документов. Организация может значительно сэкономить за счет перемещения архивных документов с «первичных» высокопроизводительных устройств хранения (например, локальных серверов) на дисковые устройства хранения (например, EMC Centera) для обеспечения менее частого доступа. Решение Centera предлагает дополнительные преимущества по сравнению с обычными средствами хранения (ленточные накопители или оптические устройства хранения) за счет обеспечения аутентичности содержания, мгновенного онлайнового доступа и применения регламентов хранения и размещения в соответствии с корпоративными и регулятивными требованиями.
Ключевые требования к хранению этого содержания включают:
▪ Аутентичность: Достоверность документов необходимо обеспечить с помощью соответствующих мер безопасности, управляющих доступом и ограничивающих возможность изменения или удаления. Система должна предоставлять журнал контроля для просмотра всех действий, совершенных с документами в хранилище.
▪ Целостность: Система должна иметь встроенную защиту от отказов системы хранения данных, сбоев системы или внешних угроз. Как правило, данные автоматически реплицируются на вторичные носители, а функции самовосстановления непрерывно контролируют целостность данных и при необходимости восстанавливают их.
▪ Доступность: Соответствие регулятивным требованиям (раскрытие информации) может включать быстрое восстановление сотен или тысяч архивированных записей в ответ на повестку о вызове в суд или на другой юридический запрос. В таком случае способность быстрого реагирования может повлиять на судебные издержки и позволяет компаниям избежать штрафных санкций за
несоответствие нормативным требованиям.
Система хранения с адресацией по содержанию (Content Addressed Storage, CAS) представляет собой относительно новый подход по удовлетворению таких требований к системе хранения. Адресация по содержанию устраняет для приложения необходимость знать физическое расположение информации на устройстве хранения. Вместо этого адреса вычисляются непосредственно по содержанию и используются как «виртуальная квитанция на получение», которую приложения используют для поиска и извлечения хранимых объектов. Это не только упрощает задачу управления огромным количеством объектов, но также предоставляет цифровой «отпечаток пальца» для содержания, гарантируя его аутентичность. CAS также обеспечивает возможности собственного управления и конфигурирования, позволяющие организациям управлять большим содержанием силами меньшего количества персонала и со значительно меньшими расходами по сравнению с традиционными методами управления архивированием.
■ Управление транзакционным содержанием для обеспечения соответствия требованиям регулирования деятельности
Новые требования регулирования, начиная с закона Sarbanes Oxley и заканчивая законом об отчетности и безопасности медицинского страхования (HIPAA), вынуждают организации хранить и соответствующим образом управлять своим содержанием. Это обеспечивает целостность содержания и готовность быстро его найти и предоставить в ответ на повестки о вызове в суд и юридические запросы. Есть множество сценариев, начиная от иска страхователя до расследования регулятивных органов, в которых организации может потребоваться предоставить транзакционное содержание по требованию. Контроль и доступность сквозной системы обработки документов и образов позволяют значительно сэкономить затраты на исследования и избежать потенциальных штрафов, тем самым обеспечивая душевное спокойствие.
Такая система может:
▪ Устранить неотъемлемый риск, связанный с бумажными документами, которые можно легко потерять, положить не на свое место, изменить (например, согласно HIPAA, оставление истории болезни пациента на стойке регистратуры может считаться нарушением, за которое полагается солидный штраф).
▪ Гарантировать целостность документов — так что вы можете подтвердить, что запись не была удалена или изменена.
▪ Предоставить проверяемый журнал контроля, по которому можно узнать, когда были созданы и изменены документы, и кто имел к ним доступ.
■ Автоматизация жизненного цикла сделки в компании Boston Capital
Компания Boston Capital, пионер в области строительства доступного жилья, ежегодно берет на финансирование и приобретает 80 100 многоквартирных домов. Обработка всех этих сделок является высокотранзакционным и производящим большой объем бумажной документации процессом, а отдельные документы могут включать в себя сотни страниц.
Как заявил Брайан Мэдн, директор по информационным технологиям: «Наши прямые расходы на внутреннее и внешнее хранение документов, как и административные расходы на ведение картотеки и копирование всех бумажных документов, росли очень быстро. Косвенные издержки также возрастали пропорционально — от времени поиска документа до времени, потраченного зря из за работы с неправильной версией».
Для увеличения производительности и рентабельности компания Boston Capital внедрила центральное хранилище для управления документами по сделкам на платформе EMC Documentum, интегрированной с системой ввода документов EMC Captiva InputAccel. Новая система:
▪ Обеспечивает единую точку доступа для всего содержания, необходимого для сделки;
▪ Ускоряет процесс поиска и извлечения;
▪ Позволяет пользователям маршрутизировать электронные документы в ходе электронного workflow процесса.
В настоящее время, по словам Мэдна, «команды, управляющие активами и приобретениями, тратят меньше времени на поиск документов и больше времени уделяют сделкам. Более того, наш налоговый отдел значительно сократил объем работы с бумажной документацией, которая накапливалась за каждый отчетный период; теперь сотрудники данного отдела просматривают налоговые отчеты посредством электронного workflow процесса совместно с ревизорами внешних фирм. Несомненно, платформа Documentum стала неотъемлемой частью нашего бизнеса и играет большую роль в нашей повседневной деятельности».
▪ Установить политики безопасного удаления документов после истечения срока их хранения и обеспечить их применение. Это полезная функция, так как любую существующую запись потенциально можно затребовать с целью предоставления для судебного дела, даже если запись устарела и ее содержание вам неизвестно.
▪ Обеспечить быстрый и экономичный доступ к документам в случае судебных процессов.
■ Готовы начать?
Если вы готовы воспользоваться преимуществами управления транзакционным содержанием совместно с обработкой документов и образов, то есть несколько возможных путей начать эту деятельность.
Как и многие компании, вы можете начать с простого — с сокращения количества бумажной документации с которой вы работаете. Для этого разработано множество решений по вводу больших объемов документации (включая, EMC Captiva InputAccel). Просто оцифровывая транзакционное содержание можно повысить эффективность работы и при этом устранить проблемы безопасности, которые несут в себе бумажные документы. Одно из преимуществ системы InputAccel заключается в предоставлении возможности организациям вводить содержание и архивировать его в хранилище содержания EMC Documentum, которое само по себе обеспечивает различные преимущества, включая возможность гарантировать соответствие требованиям регулирования.
Или можно начать с отдельной функциональной области или деятельности отдельного департамента.
Если большая часть ручной обработки происходит, например, при оплате счетов, автоматизированная система обработки счетов может обеспечить быструю отдачу за более короткое время и при меньших расходах, чем в случае, когда требуется автоматизировать всю организацию. При этом следует убедиться, что точечное решение может быть позже интегрировано с другими приложениями и не останется надолго изолированным.
Можно также начать с самого начала — с задачи выбора корпоративной платформы, которая позволит вам покупать необходимые части, и затем объединять с другими решениями по управлению содержанием, такими как управление веб содержанием, управление цифровыми активами, управление записями и др., если они нужны, в тот момент, когда они вам потребуются.
Именно такой путь использовали в вышеупомянутой компании Cincinnati Insurance. В этой организации начали с решения по управлению корпоративным содержанием Documentum для подачи документов в Министерство страхования (DOI), затем постепенно добавили системы ввода документов, систему work-flow, интеграцию с SAP, системы для публикации динамического содержания и управления корпоративными отчетами (все это продукты Documentum и Captiva), а также хранилище EMC Centera для использования преимуществ от быстрого возврата инвестиций и соответствия требованиям регулирования.
Независимо от выбранного подхода усилия организации по преобразованию способа ввода, обработки и предоставления доступа, долговременного хранения и архивирования транзакционного содержания принесут значительные преимущества, включающие:
▪ Улучшение обслуживания клиентов за счет более быстрых и полных ответов на запросы.
▪ Исключение неэффективности, расходов и риска, связанного с бумажной средой, когда документы могут быть обработаны только последовательно, легко теряются и помещаются не на свое место.
▪ Объединение всех типов взаимосвязанной бизнес информации, от отсканированных документов до цифровых изображений, заявок, электронных сообщений и др., в одной виртуальной папке и управление ими.
▪ Предоставление полного контроля над бизнес процессами в соответствии с нормами деятельности, отраслевыми стандартами или регулятивными факторами.
▪ Усиление рыночной позиции организации относительно конкурентов, которые по прежнему сражаются с ручными процессами и бумажными документами.

КРАТКОЕ ОПИСАНИЕ EMC Captiva InputAccel 6 и EMC Captiva Dispatcher 6
Использование бумаги представляет постоянную проблему с точки зрения эффективности бизнеса. Ее сложно хранить, осуществлять повторный доступ и эксплуатировать. Использование бумаги требует ведения процессов ручного труда — неэффективных, медленных, дорогостоящих и зачастую включающих высокую вероятность ошибок. Часто все эти аспекты становятся препятствием для повышения качества обслуживания клиентов. Наличие бумажных документов также затрудняет эффективное управление и мониторинг деятельности для соблюдения нормативных требований. Но бумага продолжает играть важнейшую роль в большинстве организаций в виде документов, таких, как страховые требования, заявления на открытие новых счетов, инвойсы, кредитные документы, документы учета кадров и другие.
Внедрение системы ввода корпоративной информации может помочь организациям справиться с проблемами, связанными с использованием бумажных документов. Но не все решения для ввода информации равны.
Организациям необходимо решение, которое можно адаптировать к их специфическим и комплексным требованиям, а также простое в разработке, внедрении и эксплуатации. Решения для интеллектуального ввода информации EMC® Captiva® помогают организациям разобраться с проблемами использования бумажных документов — сэкономить время, снизить затраты, повысить качество обслуживания клиентов и обеспечить соблюдение нормативных требований.
EMC Captiva InputAccel® является решением для интеллектуального ввода информации с большими возможностями изменения конфигурации, осуществляющим ввод и идентификацию документов, автоматическое извлечение и валидацию данных из этих документов перед их передачей в линейные приложения и системы управления содержанием. EMC Captiva Dispatcher использует возможности интеллектуального распознавания документов для автоматической классификации документов, индексирования, извлечения и маршрутизации. Последние выпуски этих решений в комплексе предоставляют клиентам значительно повышенную производительность процессов ввода корпоративной информации и масштабируемость, а также простоту использования, разработки и внедрения как в централизованной, так и в распределенной среде ввода информации.
■ Крупным планом:
• Обеспечивают ускоренную обработку документов и более высокую пропускную способность для важнейших бизнес-процессов
• Обеспечивают централизованную консоль администратора для упрощения управления процессами и всей средой ввода информации
• Предоставляют возможности быстрого внедрения системы ввода и повышения производительности при помощи новых клиентских интерфейсов
• Упрощают индивидуальную настройку и интеграцию с использованием СОА и технологии .NET
■ Расширяя возможности ввода корпоративной информации
Сегодня организации требуют снижения стоимости владения системой, повышенного удобства в применении и совершенно новых способов интеграции интеллектуального ввода информации. EMC Captiva InputAccel 6 использует основные сильные стороны работы с вводом корпоративных данных и документов, а также включает в себя расширенную поддержку централизованных и распределенных сред ввода информации, значительное повышение производительности и доступности системы, а также упрощенные способы разработки. Новая сервисно-ориентированная архитектура (СОА) обеспечивает быструю интеграцию ввода документов в бизнес-приложения и обеспечивает гибкость, необходимую для использования ввода в масштабе всего предприятия. Используя целый ряд новейших технологий, InputAccel 6 облегчает использование, внедрение и эксплуатацию системы ввода информации.
■ Повышенная производительность, масштабируемость и высокая доступность
InputAccel может осуществлять обработку от сотен и тысяч до нескольких миллионов ежедневно. InputAccel 6 использует преимущества улучшенного кэширования и многопоточной обработки на сервере, эффективно использующем несколько процессоров, достигая значительно повышенной производительности. InputAccel 6 обладает повышенными возможностями для восстановления работы после аварии, использующими технологию активной группировки Microsoft Active/Active с целью обеспечения высокого уровня доступности в критических ситуациях.
■ Отвечая ИТ-требованиям предпрятий
Организации могут внедрять InputAccel 6 в небольших департаментах или для обработки больших объемов документации в масштабах большого предприятия.
Новая консоль администратора на основе веб-приложения осуществляет централизованное управление и контроль за всеми средами, при применении одного или нескольких серверов. В число других ключевых усовершенствований входят:
• Роли безопасности: Администраторы могут легко устанавливать роли безопасности и разрешения, осуществляя контроль доступа.
• Отчетность: Интегрированные в систему функции отчетности обеспечивают ведение журналов регистрации событий, статистику ввода данных и документов и контрольные показатели операторов. Индивидуальные отчеты создаются с помощью инструмента Business Objects’ Crystal Reports.
• Поиск по пакетам: Расширенный поиск по пакетам предоставляет быстрый доступ к информации. EMC Captiva InputAccel 6 обеспечивает высокую степень доступности, централизованное управление и контроль над средой ввода информации для повышения общего качества системного мониторинга, управляемости и реализации
■ Максимальное наращивание производительности
Новые интерфейсы клиентов для сканирования и индексирования в InputAccel 6 обладают широкими возможностями конфигурации и повышают качество работы как операторов, так и ИТ-персонала.
• Индивидуализированные рабочие пространства: макетом интерфейса клиента можно управлять и настраивать индивидуально, изменяя размеры, перемещая, дополняя и удаляя панели задач.
• Профили сканера: Установки профиля сканера легко сохраняются и совместно используются рабочими станциями, процессами и пользователями, повышая производительность операторов сканирования.
• Семейства индексов: Предусмотрено простое создание семейств индексов для определенных типов документов, в результате чего достигается повышение скорости обработки и внедрения процессов, а также повышение производительности операторов.
• Централизованное внедрение и управление: Использование технологии Microsoft ClickOnce позволяет быстро устанавливать программы-клиенты и производить автоматическое обновление клиентов, облегчая процесс обслуживания.
■ Упрощенная индивидуальная настройка с помощью СОА и .NET
InputAccel 6 использует сервисно-ориентированную архитектуру и клиентские сценарии на основе технологии .NET. СОА упрощает процесс интеграции при помощи представления процессов ввода InputAccel в качестве служб, обеспечивающих динамичную среду и позволяющих тесно интегрировать ввод информации с другими корпоративными приложениями. Инструмент разработки сценариев .NET обеспечивает повышенную гибкость для удовлетворения специфических требований к вводу информации. При использовании клиентских сценариев на основе .NET устанавливаются индивидуальные бизнес-правила для управления маршрутизацией документов, работы с исключениями, выполнения поиска в базе данных, предварительного заполнения полей или проведения валидации на уровне полей.
EMC Captiva InputAccel 6 позволяет вам использовать, создавать индивидуальные настройки и легко устанавливать программы-клиенты в централизованной и распределенной среде ввода информации
■ Возможности классификации документов и распознавания данных
EMC Captiva Dispatcher 6 работает совместно с InputAccel 6 для обеспечения интеллектуального распознавания документов при помощи автоматической идентификации входящих документов по мере их ввода, направляя их в соответствии с установленными бизнес-правилами, а также извлекая деловые данные из широкого спектра форматов документов. Эти возможности повышают производительность и ускоряют процесс обработки. При помощи передовых возможностей автоматической классификации и извлечения данных, Dispatcher 6 обеспечивает усовершенствованную функциональность, ведущую к более высокой скорости обработки и более точному распознаванию документов, в конечном итоге сокращая объемы ручного труда. Усовершенствованные возможности распознавания обеспечивают ускоренную и более точную классификацию документов, а также извлечение данных. Dispatcher 6 также интегрируется с последними усовершенствованиями в InputAccel 6, включая новые функции отчетности.

КРАТКОЕ ОПИСАНИЕ EMC Captiva InputAccel
EMC® Captiva® InputAccel® является краеугольным камнем решения для интеллектуального ввода информации EMC Captiva. InputAccel обеспечивает организациям возможности эффективной обработки больших объемов информации, поступающем в корпоративные приложения, а также предоставляет возможности для реализации специфических требований к вводу информации. InputAccel справится с ежедневной обработкой как нескольких тысяч, так и нескольких миллионов документов.
Помогая организациям устранить временные затраты и издержки от ввода данных в ручном режиме и снижая вероятность возникновения ошибок при обработке, InputAccel обеспечивает сокращение расходов и совершенствование бизнес-процесса. Предприятия получают быстрый и простой доступ к важным деловым данным, одновременно с повышением производительности. В результате они получают более быстрое и эффективное средство управления информацией, позволяющее компаниям экономить и время, и деньги.
■ Полное решение для ввода информации
InputAccel предоставляет организациям гибкое и полное решения для ввода информации, включающее функции ввода документов, классификации документов, извлечения данных, валидации информации и передачи в серверные системы.
• Ввод: InputAccel взаимодействует с сотнями сканеров с использованием технологии EMC Captiva ISIS® и работает с мультифункциональными периферийными устройствами и сетевыми сканерами в средах распределенного ввода информации. Документы и данные также вводятся из сообщений электронной почты, сетевых папок и других источников, обеспечивая организациям множество вариантов для ввода документов.
• Классификация: InputAccel использует как традиционные технологии идентификации документов — штрих-коды, разделительные листы и корректировочные коды —, так и передовую технологию идентификации документов, предоставленную EMC Captiva Dispatcher. Технология интеллектуальной классификации использует широкий спектр различных методов для идентификации типов документов, включая анализ текстов и анализ изображений. Использование нескольких методов классификации позволяет продуктам ввода Captiva работать быстрее и обеспечивать более высокую степень достоверности данных по сравнению с конкурирующими технологиями.
■ Крупным планом:
• Позволяет организациям трансформировать бумажные документы и данные в цифровое содержание, а также передавать информацию в ключевые серверные системы и репозитории содержания.
• Оптимизирует бизнес-процессы при помощи рациональной организации потоков информации в корпоративные приложения—экономя время, сокращая затраты, повышая точность информации, снижая риски и обеспечивая более высокий уровень обслуживания клиентов.
Основные преимущества использования системы интеллектуального ввода данных InputAccel:
• Сокращение трудозатрат
• Повышение уровня удовлетворенности клиентов
• Повышенная производительность
• Усовершенствованные и оптимизированные бизнес-процессы
• Снижение рисков
• Извлечение: InputAccel сокращает объемы ввода данных в ручном режиме, необходимого для извлечения важных деловых данных из документов. InputAccel использует несколько технологий распознавания — включая OCR, ICR, OMR и распознавание штрих-кодов — для автоматического извлечения данных из документов. InputAccel обеспечивает поддержку индексирования при вводе данных с изображения, зональное распознавание OCR, и эластичную связь OCR для быстрого извлечения данных из документа и индексирования. Использование Dispatcher позволяет расширить диапазон извлечения данных и включить возможности извлечения данных в свободной форме из неструктурированных документов.
• Валидация: Извлеченные данные проходят валидацию и сопоставляются с существующими данными, хранящимися в ERP, системе управления корпоративным содержанием или другими информационными репозиториями для обеспечения достоверности данных и снижения рисков возникновения ошибок при первичной обработке. Индивидуальные бизнес-правила устанавливаются с использованием клиентских сценариев для направления документов, выполнения поиска в базе данных и валидации данных на уровне полей.
• Передача: InputAccel обеспечивает интеграцию на уровне API с EMC Documentum® Content Server, EMC Documentum ApplicationXtender®,
IBM Content Manager, FileNet Panagon, OpenText Livelink, любой базой данных ODBC, и другими системами. Изображения и данные передаются во множестве различных форматов, включая TIFF, PDF, XML и другие форматы.
■ Архитектура системы ввода
Модульный дизайн InputAccel предоставляет платформу, способную обрабатывать любую информацию: от информации департаментов до ввода больших объемов информации на уровне предприятия. Клиентские модули InputAccel работают над пакетами в параллельном режиме, а сервер регулирует уровень рабочей нагрузки, обеспечивая наивысшую скорость обработки и производительность пользователя. Решение готово к выполнению всех требований к вводу корпоративной информации, включая использование унифицированной мультисерверной среды ввода информации, обеспечивающей высокую доступность системы, максимальную пропускную способность и возможности восстановления после отказа.
Сервисно-ориентированная архитектура поддерживает интеграцию с операционными приложениями и позволяет ИТ-организациям использовать открытые стандарты для создания служб ввода и индивидуальных процессов ввода, доступных в виде служб — свободно связанных компонентов, которые можно связать с бизнес-процессами. Эти службы упрощают задачи разработчиков и повышают возможности разработки и мониторинга полных бизнес-процессов.
■ Ввод информации в филиалах для организаций с широкой сетью подразделений
Многие организации перенесли ввод информации на удаленные площадки. Распределенные возможности ввода информации InputAccel дают организациям много вариантов для сканирования, индексирования либо выполнения других задач ввода на удаленной площадке. InputAccel предлагает наиболее полный комплекс возможностей для организаций, которым необходим распределенный ввод информации, обеспечивая работу серверов распределенного ввода информации на разных площадках в масштабах предприятия, используя возможности интеграции с мультифункциональными периферийными устройствами, или используя веб-клиент для ситуативного сканирования небольших объемов информации и ее индексирования.
InputAccel оптимизирует многие процессы работы с документами:
▪ Заявления на открытие новых счетов
▪ Инвойсы
▪ Заказы на покупку
▪ Записи кадрового учета
▪ Медкарты пациентов
▪ Юридические документы
▪ Ипотечные и кредитные документы
▪ Страховые требования
▪ Налоговые формы
▪ Разрешения

КРАТКОЕ ОПИСАНИЕ EMC Captiva Dispatcher
EMC® Captiva® Dispatcher обеспечивает выполнение функций высокоскоростной автоматической классификации, индексирования, извлечения и маршрутизации документов, разработанных с целью содействия организациям в управлении крупными ежедневными объемами входящей информации.
Использование Dispatcher позволяет компаниям анализировать информацию в смешанных пакетах структурированных, полуструктурированных и неструктурированных документов в рамках общего потока, не прибегая к помощи разделительных листов, штрих-кодов или корректирующих кодов. Применяйте Dispatcher вместе с платформой для ввода документов EMC Captiva InputAccel®, и вы получите возможность сканировать, классифицировать, индексировать и передавать данные практически из любого типа бумажных или электронных документов, зачастую без необходимости ручной сортировки или подготовки.
Применение данного решения позволяет снизить затраты и оптимизировать бизнес-процессы, обеспечивает измеримые результаты, помогающие экономить время и повышающие возможности управления потоками входящих документов.
Непревзойденные возможности для классификации документов
Одной из самых сильных сторон Dispatcher является его способность идентифицировать документы подобных типов с использованием инновационных технологий классификации. Для определения типов документов, ввода информации по индексированию для поиска и архивирования, извлечения бизнес-данных для запуска транзакционных процессов, а также маршрутизации документов по соответствующим департаментам или сотрудникам для последующей обработки, Dispatcher использует как графический, так и текстовый анализ. Эта технология работает на основе автоматического изучения атрибутов существующих документов и их использования в качестве основы для классификации новых входящих документов, поступающих в масштабах всего предприятия.
Dispatcher полностью независим от языка и формата документа, так как программа анализирует общий макет документа и обнаруживает повторяющиеся блоки информации, такие как логотипы или другие графические элементы. В случаях с полуструктурированными или неструктурированными документами система использует результаты поиска по всему тексту, поиск производится по ключевым словам и фразам в тексте какого-либо документа с целью определения типа документа.
Dispatcher осуществляет автоматическое извлечение и валидацию данных, снижая необходимость вмешательства в ручном режиме и обеспечивая передачу достоверной передачи в системы операционных подразделений. Dispatcher включает в себя несколько систем распознавания информации, позволяющих извлекать информацию из документов, изготовленных полиграфическим способом, рукописного текста, написанного печатными буквами, а также штрих-кодов.
При помощи систем считывания и сканирования, дополненных расширенными функциями на основе технологий классификации и извлечения данных, Dispatcher упрощает и ускоряет обработку входящих документов разнообразных типов. Dispatcher также исключает необходимость ручных операций, используя возможности автоматической классификации до извлечения данных и их экспорта в ваши системы управления содержанием.
При работе со структурированными формами документов Dispatcher извлекает данные с использованием скоростного и точного распознавания предварительно заданных областей. При работе с документами, имеющими менее четко выраженную структуру, к примеру, инвойсами или контрактами, Dispatcher извлекает данные с использованием более гибких механизмов для произвольных форматов, обеспечивая извлечение данных вне зависимости от их фактического расположения на странице. Широкий диапазон технологий и методов распознавания обеспечивает высочайший уровень производительности и точности извлечения данных из структурированных форм, одновременно предоставляя максимально гибкие возможности для извлечения данных из всех типов документов.
Являясь компонентом решения для интеллектуального ввода информации EMC Captiva, Dispatcher идеально интегрируется с InputAccel, обеспечивая платформу для ввода информации, поддерживающую как централизованные, так и распределенные средства ввода информации. Индивидуально настраиваемые рабочие процессы ввода InputAccel управляют процессом от начала и до конца, обеспечивая классификацию документов, извлечение и валидацию данных, а также доставку информации во все соответствующие репозитории содержания и бизнес-системы. Совместное использование InputAccel и Dispatcher предоставляет организациям комплексное решение, обладающее возможностями обработки в объемах от нескольких тысяч документов в день до нескольких миллионов.
В условиях современной конкурентной деловой среды компании должны использовать все возможности по снижению затрат, ускорению циклов обработки и повышению производительности. Совершенно неважно, в какой сфере работает ваша компания — финансовые услуги, страхование, здравоохранение, государственное управление или другие отрасли, — Dispatcher специально создан для того, чтобы обеспечить выполнение всех ваших задач по обработке документов. Проверенные технологии, автоматизирующие процессы классификации и извлечения данных для любых типов документов, позволяют организациям, использующим Dispatcher, сократить количество операций ручного труда, связанных с подготовкой документов и вводом данных. Dispatcher оптимизирует разнообразные виды процессов обработки документов:
▪ Бланки заявлений на страховое возмещение по медицинским, стоматологическим и другим страховым случаям
▪ Заявления на получение полисов
▪ Заявления об открытии новых счетов
▪ Инвойсы
▪ Заказы на покупку
▪ Чеки
▪ Корреспонденция (включая рукописные сообщения)
▪ Формы детализации страховых выплат
▪ Медицинские документы пациентов
▪ Юридические документы
▪ Ипотечные и кредитные документы
▪ Автоматизация отделов обработки корреспонденции

 

Более полный поиск по теме Вашего запроса (наберите его в окне поиска)

В дополнение к теме:

 

ХОПКИНТОН (Массачусетс, США), – 15 декабря 2009 г. – Корпорация EMC представила новейшее дополнение к интеллектуальному решению для ввода – ЕМС Captiva® InputAccel® - нового мощного инструмента для графического проектирования, предназначенного для создания и конфигурирования процессов ввода без программирования, но при этом с полным соответствием уникальным потребностям каждой организации. Устанавливая новые стандарты в разработке процессов корпоративного ввода, InputAccel CaptureFlow™ Designer предоставляет среду разработки, позволяющую заказчикам с помощью функции drag-and-drop быстро, в течение всего нескольких часов, разрабатывать процессы ввода с существенно меньшими затратами денег и ресурсов. С новым инструментом графического проектирования реализовать потенциал корпоративного ввода гораздо проще.
Новый инструмент InputAccel CaptureFlow Designer предоставляет системным интеграторам, реселлерам, ИТ-компаниям и ключевым пользователям следующие конкурентные преимущества:
• Разработка процессов ввода за несколько часов без программирования;
• Ускорение внедрения за счет уменьшения необходимого количества ресурсов, что ускоряет время окупаемости и снижает совокупную стоимость владения;
• Упрощение структуры проектов и устранение рисков, связанных с заказным программированием;
• Использование модульной архитектуры Captiva и обеспечение гибкости при выполнении даже самых сложных требований к корпоративному вводу;
• Быстрое создание демонстрационных примеров с целью ознакомления партнеров с преимуществами данного решения и привлечения новых клиентов.
■ Процесс ввода документов
Процесс ввода документов представляет собой набор шагов и инструкций, которые определяют, как документ движется по процессу после того, как он занесен в Captiva. Типичная последовательность шагов включает в себя сканирование, улучшение качества образа документа, классификацию документа, извлечение данных и валидацию, а также передачу данных в системы управления содержанием или в бизнес-приложения. В большинстве случаев в процессе также предусмотрены условия, встроенные для обработки проблем качества образов документов, проверки правильности распознавания данных, передачи некоторых типов документов на рассмотрение, либо пользовательские шаги для реализации бизнес-правил или интеграции с другими корпоративными приложениями. В прошлом разработчикам приходилось писать для этих процессов программный код на Visual Basic for Applications (VBA), на что могло уходить до нескольких дней, в зависимости от сложности задачи.
■ Предварительная версия InputAccel CaptureFlow Designer
Более 100 заказчиков и партнеров по всему миру приняли участие в тестировании предварительной версии нового продукта, что помогло им познакомиться с InputAccel CaptureFlow Designer до его официального выпуска. Программа предварительного тестирования, развернутая в лаборатории досрочного доступа в EMC Community Network, дала заказчикам и партнерам возможность высказать свое мнение о продукте.
Инструмент InputAccel CaptureFlow Designer входит в состав InputAccel. Заказчики, использующие InputAccel 6, могут бесплатно загрузить инструмент графического проектирования, зайдя на EMC Powerlink.
■ Основные результаты опроса AIIM относительно нового ввода документов
• В опросе приняли участие 882 специалиста по управлению записями и информацией, а также сотрудники ИТ и руководители бизнес-подразделений.
• Централизованное сканирование внутри компании и сканирование в канцелярии значительно увеличились по сравнению со сканированием и переводом документов в электронный вид услугами аутсорсинга.
• Управление знаниями с целью улучшения возможностей поиска в бизнес-документации является основным движущим фактором для внедрения средств сканирования. Следующими по значимости факторами являются обеспечение соответствия законодательным требованиям и оптимизация бизнес-процессов.
• Сорок шесть процентов пользователей сообщили об окупаемости инвестиций в течение 12 месяцев, а окупаемость в течение 18 месяцев прогнозируют две трети опрошенных.
• Бесплатный экземпляр исследования «Capture: local, central, outsource - what’s working best?» («Перевод документов в электронный вид: локальный, централизованный, внешний — что лучше всего?») можно загрузить со страницы www.emc.com/capturestrategies.
■ Цитата представителя руководства EMC
«Последняя версия InputAccel вполне очевидно указывает на преимущества Captiva на рынке корпоративного перевода документов в электронный вид, даже при наличии самых сложных процессов. Новый InputAccel CaptureFlow Designer, будучи оснащенный современным графическим интерфейсом, прост в использовании и не требует программирования. Это позволяет компаниям работать максимально динамично и рационально».
- Уитни Тидмарш, Chief Marketing Officer направления Content Management & Archiving в EMC
■ Дополнительные цитаты
«Я работаю с Captiva InputAccel вот уже 12 лет, и новый InputAccel CaptureFlow Designer — это именно то, что нам нужно. Разрабатывать процессы стало гораздо проще, что, безусловно, сэкономит нам довольно много времени на проектирование и внедрение процессов ввода документов в InputAccel».
- Джей Калпепер, директор по техническому обслуживанию, Business Imaging Systems, Inc.
«Мы работаем с EMC уже несколько лет, и мы с нетерпением ожидали выхода новой версии Captiva. У наших специалистов были только положительные впечатления от последней версии Captiva InputAccel CaptureFlow Designer. Она, безусловно, поможет нам предоставить новые возможности InputAccel при внедрении решений для ввода как на уровне департаментов, так и на корпоративном уровне».
- Джон Мидлтон, управляющий партнер и вице-президент по продажам, BRT
«Несколько часов…вот и все, что нам потребовалось, чтобы спроектировать процесс ввода документов с помощью нового Captiva InputAccel CaptureFlow Designer. Новое приложение с графической средой разработки очень многофункционально и удобно в использовании. Оно позволяет использовать все возможности InputAccel для удовлетворения необходимых требований любых заказчиков».
 Уильям Коллинз, технический эксперт по Captiva, The Windward Group

 

Ретроспектива:

 

Не понять вкуса этих женщин может только робот-патагонец, питающийся водяными крысами / Not understand taste of these women the robot - Patagonian eating water rats can onlyАрхивы, деньги, юристы. Коммерческое использование архивных материалов всегда было важнейшим занятием архивистов, скрашивающим их бедную жизнь. Например, в начале 80-х годов в Центральном Государственном архиве звукозаписей (ЦГАЗ СССР) был создан хозрасчетный отдел, «выпускавший в свет» товарную аудиопродукцию. Все были довольны: архивисты получали премии, ЦГАЗ получал прибыль и направлял ее на материально-техническое переоснащение. Главк был тоже не в обиде. Сейчас это кажется идиллией, но ничего сверхъестественного не происходило — просто соблюдали финансовую дисциплину, боясь ОБХСС. Авторско-договорные проблемы тоже не создавали кризисов: участники хозрасчета старались выполнять инструкции ВААП, о котором ходили слухи, что оно — подразделение КГБ.
Этот поезд давно ушел, оставив после себя некоторые ненужные вещи. Одна из таких вещей — юридические препятствия свободному доступу к информации. Дело в том, что по мере того как суммарное количество информации в мире растет, ценность ее как некой абстракции падает. Зато возрастает ценность инструментов ее поиска и адресной доставки — т.е. либо киберпрограмм поиска, либо информационных продюсеров (в частности, журналистов, составителей баз данных и т.д.). Понятно, что одним из главных антагонистов обработки информации становятся устаревшие законы об авторском праве с их рутинной исполнительской процедурой. Новые же законы отстают от жизненных реалий на много лет, поскольку законотворчество находится в руках профессиональных юристов, а юристы — самая консервативная из профессий. Но надо было случиться скандалу, чтобы маразм отдельных представителей юридического цеха стал очевиден всем. Речь идет о требовании «автоправозащитников» распространить действие Конвенций об авторском праве на промежуточные копии, которые жесткий диск компьютера записывает из Сети в процессе работы поисковых программ. Требование (которое парализовало бы навигацию в Сети) отклонили, но вместе с тем стало ясно, что проблема требует решений системного характера.
Решение стало вырисовываться на конференции «Документирование цифрового века», состоявшейся в феврале в Сан-Франциско. Инициатором конференции был представитель Microsoft Натан Мирвальд. Основной темой было архивирование содержимого «Интернет». Суть дела в том, что информация, циркулирующая в Сети, существует лишь до тех пор, пока ее не заменят более актуальной. В большинстве случаев эта информация нигде не сохраняется, поскольку участники Сети считают ее недостаточно ценной, чтобы затрачивать средства на архивирование. Сохранение 1 Гбайт на винчестерах обходится в 200 долл., а на магнитных лентах — 20 долл. Но вот нашлись фирмы, посчитавшие оправданным затратить 400 тыс. долл. на запись содержимого «Интернет», емкость которого сегодня оценивается в 2 терабайт (включая текст, аудио и видео). Названная сумма покрывает стоимость записи одного «среза» Сети, но содержимое постоянно меняется, и через некоторое время потребуется запись следующих «срезов». На этом и строится расчет новоявленных архивистов: если пользователь Сети ищет информацию в одном «срезе», а она уже была в прошлом «срезе» и теперь стерта либо будет в следующем «срезе», то пользователю удобнее обратиться в архив и поискать там в записях за какой-то период.
Тут-то и подсуетились юристы-автоправозащитники, почуяв наживу: дескать, в результате архивирования возникнут нарушения авторского права и без юридических консультаций не обойтись. Но информационные технологии для того и развиваются, чтобы обходиться и без юристов, и без прочих дорогостоящих излишеств — надо лишь все оцифровать и цифрами оперировать. А цифры развенчивают один миф за другим. Например, козырь наших интернет-агитаторов: «Через Сеть все смогут пользоваться библиотекой Конгресса США». Это преувеличение.
Содержимое библиотеки Конгресса США равно 20 терабайт, а содержимое всей сети «Интернет», как говорилось выше, 2 терабайт. То есть и библиотека Конгресса, и другие библиотеки, а также архивы, киностудии, кинофестивали и им подобные заведения выставляются в Сети главным образом лишь в такой степени, чтобы привлечь клиента, заказчика, зрителя, инвестора — короче говоря, деньги. Сеть «Интернет» — это чисто торговая сеть, и вся информационная начинка ее состоит из рекламы и саморекламы, хотя и в оригинальной «сетевой» форме. В Сети иная система ценностей, и, даже воспользовавшись какой-то информацией, пользователь так или иначе расплачивается за нее, достаточно дорого платя за работу в Сети.
Почему конференция во Фриско, посвященная архивированию информационных ресурсов планеты, состоялась именно в начале 1997 г.? Ведь идея была известна давно. В частности, Брюстер Кали, один из участников конференции и владелец архива (сердцем которого является программа «Ползун», обшаривающая Сеть в процессе перезаписи), был создателем одной из первых поисковых программ. Все дело в том, что сейчас разворачивается широкомасштабная транснациональная программа DVD. Предполагается обеспечить весьма разнообразное наполнение цифровых дисков аудио- и видеоматериалами. Но особенности технологии DVD таковы, что все ее звенья должны работать безошибочно — в том числе и продюсерское звено. Соответственно понадобились новые способы изучения информационно-зрелищных потребностей всего населения планеты (ведь новый диск способен нести звуковое сопровождение на нескольких языках). Вот тут-то и форсировали проект интернет-архивов, стратегическая ценность которых в том, что если прежде запросы миллионов пользователей «Интернет» фиксировались разбросанными по всему миру серверами и фактически пропадали без пользы, то теперь счетчики интернет-архивов (а таких архивов будет на планете порядка десяти) будут накапливать ценнейшие статистические данные: сколько человек, из каких стран, в какое время чем интересуются. Интеграция этих сведений в продюсерских DVD-центрах с репертуарными планами, по расчетам, принесет колоссальный экономический эффект рекламодателям, за счет которых предполагается печатать на DVD кинофильмы и эстраду.
В свете сказанного российским архивам и телерадиофондам есть прямой смысл объединить образцы своих реликвий (особенно сохраняемых на кино-, видео- и аудиолентах) в корпоративной сети «Интранет», предусмотрев выход в «Интернет». Это, во-первых, стимулирует коммерческое использование фондов, во-вторых, поможет участвовать в качестве интеллектуальных партнеров в индустрии DVD, что важно, если иметь в виду стоимость российской части проекта DVD на этапе 2000 г. — 10 млрд долл. («разблюдовку» названной суммы мы приведем в следующих публикациях, основываясь на поступающих сейчас данных), причем деньги придут из смежных отраслей и бизнесов за счет кардинального структурного изменения рынка.
Кто-то может не поверить: откуда взялась цифра 10 млрд, если оборот всего российского аудиовизуального рынка оценивается в 500 млн долл.? За счет неиспользованных резервов, в том числе — архивов. Например, в одном из наших архивов хранятся записи радиопереговоров советских еще космонавтов с ЦУП, оригинальных тем, что, когда на борту корабля возникала нештатная ситуация, эфир наполнялся неформальной лексикой. А если продолжить тему «неформального», то в другом архиве хранятся записи (совершенно официальные) собраний достаточно радикальных организаций. Казалось бы, кому это нужно? Но вот один из интернет-архивов под названием «Де жа ньюс» специализируется на записи происходящих в Сети конференций, переписки и прочих форм личного общения, содержащих порой очень личные моменты и чрезмерно эмоциональные высказывания. При соответствующей обработке эти записи могут вылиться в высокодоходные бестселлеры — по типу публикации переписки известных исторических персонажей. Конечно, могут опять возникнуть проблемы юридического характера, но деньги, как всегда, окажутся сильнее. А. П. Барсуков, журнал "ТКТ", 1997, № 5 (через эту ссылку можно бесплатно скачать справочник, авторские материалы которого разрешено использовать для написания таких работ, как сочинение, доклад, реферат, курсовая работа, дипломная работа, диссертация)