Информатика на пять О нас
 Добавить в избранное
5byte.ru
 Теория
 8 класс
 9 класс
 10 класс
 11 класс
Задания
 8 класс
 9 класс
 10 класс
 11 класс
Книги
Тесты
ЕГЭ
Turbo Pascal 7
 Описание
 Задачи
HTML
Рефераты

Приложение

П1. Примеры информационных систем для бизнеса

1. Информационная система по отысканию рыночных ниш. При покупке товаров в некоторых фир- мах информационная система регистрирует данные о покупателе, что позволяет:

    • определять группы покупателей, их состав и запросы, а затем ориентироваться в своей стратегии на наи- более многочисленную группу;
    • посылать потенциальным покупателям различные предложения, рекламу, напоминания;
    • предоставлять постоянным покупателям товары и услуги в кредит, со скидкой, с отсрочкой платежей.

2. Информационные системы, ускоряющие потоки товаров. Предположим, фирма специализируется на постаbвках продуктов в определенное учреждение, например в больницу. Как известно, иметь большие запасы продуктов на складах фирмы очень невыгодно, а не иметь их невозможно. Для того чтобы найти оптимальное решение этой проблемы, фирма устанавливает терминалы в обслуживаемом учреждении и подключает их к ин- формационной системе. Заказчик прямо с терминала вводит свои пожелания по предоставляемому ему каталогу. Эти данные поступают в информационную систему по учету заказов. Менеджеры, делая выборки по поступившим заказам, принимают оперативные управленческие решения по доставке заказчику нужного товара за короткий промежуток времени. Таким образом экономятся огромные деньги на хранение товаров, ускоряется и упрощается поток товаров, отслеживаются потребности покупателей.

3. Информационные системы по снижению издержек производства. Эти информационные системы, отслеживая все фазы производственного процесса, способствуют улучшению управления и контроля, более рациональному планированию и использованию персонала и, как следствие, снижению себестоимости произ- водимой продукции и услуг.

4. Информационная система, установленная в фирме по сдаче автомашин внаем, отслеживает ме- стонахождение, стоимость и техническое состояние парка прокатных машин. Это позволяет минимизировать потери от простоя и пустого прогона для каждой автомашины, перераспределяя предложения согласно спросу.

5. Информационные системы автоматизации технологии ("менеджмент уступок"). Суть этой техноло- гии состоит в том, что, если доход фирмы остается в рамках рентабельности, потребителю делаются разные скидки в зависимости от количества и длительности контрактов. В этом случае потребитель становится заинте- ресован во взаимодействии с фирмой, а фирма тем самым привлекает дополнительное число клиентов. Если же клиент не желает взаимодействовать с данной фирмой и переходит на обслуживание к другой, то его затраты могут возрасти из-за потери предоставляемых ему ранее скидок.

6. Информационные система по продаже авиабилетов позволяет проанализировать архивные данные за многие годы, оценить перспективы наполнения салона, назначить разумную цену на каждое место, снизить количество непроданных билетов и пр. Она резервирует каждое место на самолет, например в США, за три ме- сяца до полета 1,5 раза, т.е. два места резервируются за тремя пассажирами.

7. Информационная система банка обеспечивает все виды оплат по счетам его клиентов. Она умыш- ленно сделана несовместимой с информационными системами других банков. Таким образом, клиент попадает в круг услуг банка, из которого ему трудно выйти. В обмен банк предлагает ему различные скидки и бесплат- ные услуги.

8. Комплекс информационных систем "Поликлиника Ленинградской области" создается с целью развития информационной поддержки деятельности медицинских учреждений, повышения качества лечебной, диагностической и профилактической работы по обеспечению здоровья населения. Разработка ведется в рамках региональной целевой программы "Предупреждение и борьба с заболеваниями социального характера и разви- тие материально-технической базы учреждений здравоохранения в ЛО на 2005 – 2008 годы", а также в целях успешной реализации национального проекта "Здоровье" на территории Ленинградской области.

До конца 2006 г. компания "ТопПлан" разработает и внедрит информационные системы в 29 поликлини- ках региона. Для конечных потребителей медицинских услуг использование такой системы позволит сущест- венно сократить время пребывания в поликлиниках за счет ускорения процессов регистрации, обработки пер- сональной информации и обслуживания. Электронная амбулаторная карта не может потеряться, что увеличива- ет ее надежность, а наличие полной проверенной информации повышает качество. Несомненным преимущест- вом для пациентов будет возможность получения врачом информации из дополнительных источников, напри- мер, наличие льготных лекарственных препаратов в аптеках, а также имеющиеся персональные льготы.

Информационные системы предназначены для решения следующих задач:

    • автоматизация деятельности основных подразделений и служб амбулаторно- поликлинических учреждений, а также обеспечение их взаимодействия с федеральными, ре- гиональными и муниципальными организациями по обмену информацией.
    • формирование единых баз данных обслуживаемого населения, заболеваемости, пре- доставляемых населению медицинских и медико-социальных услуг;
    • информационное обеспечение планирования лечебной, диагностической и профилак- тической деятельности поликлинических учреждений;
    • планирование загрузки ресурсов поликлинических учреждений и анализ эффективно- сти их использования;
    • обеспечение информационной поддержки системы принятия решений в сфере управ- ления здравоохранением и медико-социальной помощи населению, а также прогнозирование тенденций здоровья населения на ближайшие годы и обоснование потребностей в ресурсах, необходимых для охраны здоровья населения.

9. Автоматизированная информационная система (АИС) "TopLogistic" компании TopPlan (www.topplan.ru) предназначена для составления оптимального, с точки зрения минимизации транспортных издержек, плана автотранспортной доставки разнородной продукции.

АИС "TopLogistic" предназначенный для решения задач транспортной логистики. Система позволяет оп- тимизировать деятельность по доставке грузов в крупном городе или регионе, осуществлять планирование, учет и контроль процессов, связанных с отгрузкой и доставкой, сократить издержки на доставку, повысить ка- чество обслуживания клиентов, обеспечить надежность работы всего логистического комплекса.

Оптимальный план доставки строится на основе принятых заказов, дорожно-знаковой обстановки, харак- теристик автотранспорта, его наличного состава и параметров адресов доставки. При построении оптимального плана осуществляется автоматический подбор заказов для каждого рейса конкретной автомашины, с учетом ее технических характеристик и рабочего времени. Система по возможности состав-ляет маршруты, обслужи- вающие сразу несколько заказчиков, что позволяет значительно уменьшить общий пробег автомашин и расход топлива.

Система "TopLogistic" может обеспечивать минимизацию транспортных издержек по следующим критери- ям:

    • минимизация общего расхода топлива в стоимостном выражении (р.);
    • минимизация общей грузовой работы (т·км);
    • минимизация общего пробега автотранспорта (км).

Возможности

Система "TopLogistic" обеспечивает:

    • автоматизацию работ по распределению заказов по автомобилям;
    • автоматизированный расчет маршрутов доставки заказов;
    • визуализацию адресов и маршрутов доставки и на электронной карте.
    • формирование оптимального порядка объезда точек доставки с возможностью его из- менения.

Система "TopLogistic" формирует:

    • базу данных автотранспорта с характеристиками каждого автомобиля;
    • базу данных точек доставки с адресами, привязанными к карте;
    • базу данных заказов клиентов с количественными характеристиками.

Система "TopLogistic" рассчитывает:

    • планируемый расход бензина, пробег и время работы каждого автомобиля;
    • потребность в автомобилях для обеспечения развозки.

Интерфейс программы представляет собой подробное изображение карты города с указанием маршрутов транспортных средств. Также в отдельном окне может быть выведена подробная информация о каждой машине (тип, грузоподъемность, количество груза, сроки доставки и др.).

Система "TopLogistic" учитывает:

    • рабочее время каждого автомобиля;
    • время работы точек доставки;
    • ограничения по количеству точек доставки для автомобилей;
    • продолжительность разгрузки заказа в точке доставки;
    • возможность подъезда автомобилей определенного типа к точке доставки;
    • зональный принцип формирования заказов.

Система "TopLogistic" позволяет редактировать на карте и учитывать при прокладке маршрутов:

    • дорожно-знаковую обстановку;
    • категории автотранспорта, для которых разрешен проезд по улице или дороге;
    • среднюю скорость движения по отдельным участкам улиц и дорог.

Отчеты и документы:

    • маршрутные листы и маршруты движения для каждого автомобиля;
    • участки карты с нанесенными маршрутами;
    • сводные документы и отчеты по клиентам, заказам;
    • отчеты по результатам маршрутизации;
    • отчеты по заданному пользователем шаблону.

Интеграция с внешними системами:

    • экспорт и импорт данных через независимые от конкретной системы файлы; • система учета перемещения автомобилей (GPS-модуль); • бухгалтерия, склад, финансы и др.;
    • управленческие системы (ERP, CRM, SCM и т.д.).

10. Модель информационной системы бизнес-разведки. Система корпоративной безопасности – важ- нейший инструмент управления предпринимательскими рисками. Ее задачи состоят не столько в сборе, обра- ботке, оценке и накоплении данных, сколько в их информационном анализе и синтезе управляющих воздейст- вий.

Термин "бизнес-разведка" обозначает широкую категорию технологий, связанных со сбором, хранением, анализом и обеспечением доступа к информации с целью принятия оп- тимальных деловых решений. Методы ведения бизнес-разведки весьма близки к используе- мым в традиционной разведывательной деятельности. Сначала определяются требования к параметрам объектов (потенциальных источников угроз) для планирования и организации разведки. Затем рассматриваются возможные источники информации для проведения биз- нес-разведки (как правило, используются несколько альтернативных или доверенные источ- ники – СМИ, внутрифирменные, банковские и правительственные отчеты, прогнозы). Далее разрабатывается модель угроз и система управляющих воздействий при их обнаружении.

Для оценки эффекта от внедрения систем бизнес-разведки необходимо ясно представ- лять возможности подобных решений. Их использование, в частности, позволяет:

    • постоянно отслеживать и анализировать сведения о бизнесе конкурентов;
    • организовать мониторинг потоков с информацией о действиях конкурента (ценовая политика, слияния и поглощения, рекламные объявления и анонсы, отзывы об их изделиях и т.п.);
    • раскрывать планы конкурентов;
    • изучать потенциальный спрос на продукцию и услуги;
    • изучать реакцию рынка на отдельные свойства товаров и услуг (например, с помощью анализа тональности публикаций в прессе).

Приведем несколько примеров.

    Ведение уголовных дел. В процессе изучения фигуранта описание его поступков может быть получено из разных источников – отчетов участковых, протоколов, оперативных и агентурных сообщений и др. Зачастую эти документы хранятся в различных фондах. У объекта может быть много контактов, как прямых, так и предполагаемых по косвенным при- знакам. Учетная информация об объекте тоже может храниться в разных базах данных. По- лучение всей совокупности сведений является очень трудоемким процессом, в котором ис- пользуется специализированная система автоматического выделения фактов (А-факты), свя- зей и ведения дел.
    Проведение выборов. Кандидаты нередко собирают из открытых источников сведе- ния о конкурентах и их окружении, для чего обычно используются поисковые системы. Аре- ал выделяемых персон зачастую включает в себя свыше 50 человек, а объем информации со- ставляет сотни страниц. Ценность извлеченных сведений невысока, поскольку эксперт не может совместно проанализировать столь большое число фактов. В этих случаях применяет- ся технология выделения А-фактов с целью накопления первоначальных досье объектов, причем задействуются БД открытой исторической информации и Сеть.
    Мониторинг мнения потребителей. Для получения объективной картины качества выпускаемой объектами или конкурентами продукции обычно используются периодические опросы либо экспертная обработка сообщений из Сети.
    Оценка лояльности клиентов. Банки и страховые компании с целью минимизации рисков собирают в досье факты из всевозможных источников (регистрационные учетные до- кументы, финансовые отчеты, налоговые декларации, базы данных зарегистрированной соб- ственности и транспортных средств, СМИ, оперативные источники, аналитические системы)
.

Концепция информационных систем бизнес-разведки предполагает реализацию трех принципов:

    • использование единого информационного пространства взаимосвязанных фактов или гипотез вне зависимости от типа содержимого источников информации;
    • связь фактов или гипотез с релевантными источниками информации, т.е. аргументи- рованность фактов и гипотез;
    • применение исторически-пространственной информационной модели баз данных фактов и гипотез.

Все это означает наличие атрибутов времени и места для каждого факта или гипотезы, а также невозможность их безвозвратного удаления. Также разработчики систем бизнес- разведки сталкиваются с проблемами преобразования различных форм представления зна- ний. В частности, основная причина относительно малого объема рынка систем извлечения знаний и систем поддержки принятия решений состоит в том, что практически ни одна сис- тема аналитической обработки не выполняет формально-семантической интерпретации ре- зультатов своей работы (хотя бы за счет их семантического ранжирования). А это не позво- ляет без применения дополнительных программ преодолеть понятийный разрыв между ре- зультатами работы систем типа Knowledge Discovery и Data Mining и входом систем под- держки принятия решений.

Такой разрыв устраняется за счет того, что результаты работы программ интерпретирует эксперт-аналитик. Однако это приводит к тому, что добытые знания "упрятываются" в доку- менты, теряется их аргументация, и они не могут быть повторно получены. В большинстве предприятий каждый новый аналитик проходит весь путь накопления профильных знаний заново, прежде чем он сможет стать экспертом. Собранные факты находятся в головах экс- пертов, хранятся в разных документах и базах данных, что не позволяет совместно анализи- ровать разрозненные факты и объединять их в общее пространство фактографической ин- формации, ведет к потере ценности полученных сведений и вложенных в их разведку средств.

Для управления пространством фактов в информационных системах бизнес-разведки используется подсистема обработки фактографической информации. На ее входе из различ- ных источников формируется не только поток сведений об изучаемых объектах в форме ко- личественных показателей, видеоклипов и документов, но и выделенный из них поток зна- ний (т.е. аналитически обработанной, классифицированной и очищенной информации), ос- новной формой представления которых являются факты и гипотезы. Естественно, факты проходят очистку, интеграцию и другие стандартные процедуры управления единым инфор- мационным пространством фактов (ЕИПФ).

Множественность значений факта обусловлена возможностью разной интерпретации одного и того же явления, а также противоречивостью, неточностью или нечеткостью посту- пающих из внешних источников сведений. Поэтому инфологическими особенностями ин- формационной модели ЕИПФ являются поддержка множественных фактов об одном собы- тии, наличие у факта атрибутов для его тренинга (идентификации автора, времени, источни- ка факта) в целях его возможного повторного извлечения и поддержка множественных вер- сий интерпретации фактов. Подсистема обработки фактографических данных находится на вершине иерархии информационной инфраструктуры компании, поскольку для генерации фактов использует сервисы разных систем анализа и доставки контента (содержания).

С помощью своих программ извлечения знаний они получают факты из СУБД, храни- лищ многомерных данных, Internet, подсистем аналитической обработки и моделирования, а также из прикладных систем, порождают гипотезы или сигнальную информацию.

Разберем концептуальную и базовую информационные модели системы бизнес- разведки, проиллюстрировав их на примере программы XFiles, разработанной с использова- нием программных компонентов компаний Oracle, "Гарант-Парк-Интернет", Inxight, ABBYY Software House и Altova [www.it26.ru]. К этому же классу систем можно отнести продукты компаний Clear Forest, "Мегапьютер Интеллидженс", Rsoft и "Гарант-Парк-Интернет".

Информационная модель системы

Основные понятия информационной модели системы XFiles таковы:

Факт – событие (как правило, зафиксированное и произошедшее), сопровождаемое вре- менной и географической метками, аргументирующей информацией, ссылками на источники и др. Факт может быть извлечен из текста документов либо определен экспертом. Он может определять как свойства объекта, так и его связь с другими объектами.

Гипотеза – аналитическое высказывание (полученное в результате аналитической обра- ботки данных, например прогнозирования) относительно состояния атрибута досье, которое сопровождается аргументирующей информацией, ссылками на источники и др. Гипотеза мо- жет порождаться разными подсистемами извлечения знаний или экспертами.

Объект – сущность, информация о которой накапливается в системе. Объект имеет се- мантический фильтр для самоидентификации в тексте.

Тип досье – описание проблемной области, представленное в виде иерархии атрибутов. Для каждого объекта должен быть определен хотя бы один тип досье.

Досье – реализация типа досье для конкретного объекта.

Атрибут – структурный элемент типа досье, предназначенный для накопления фактов одного типа (биографические данные, сведения о поездках и др.). Атрибут имеет семантиче- ский фильтр для выделения "своих" фактов из потока документов. Один атрибут может вхо- дить в досье нескольких типов.

Связь – направленное или ассоциативное отношение определенного типа между объек- тами системы. Связь представляется специальным типом атрибута в каждом досье связывае- мых объектов.

Поскольку изучаемая предметная область зачастую довольно обширна, целесообразно использовать несколько досье для одного объекта (рис. 19). Например, одно досье может освещать бизнес-деятельность

Рис. 19. Фрагмент информационной модели
объекта, второе – его личную собственность, третье – медицинские данные и т.п. Такой под- ход дает возможность разным группам аналитиков "чувствовать" только профильную для них группу атрибутов, но лицо, принимающее решение, может анализировать все досье объ- екта и все его связи. На рис. 19 Объект X объединяет два типа досье (Тип досье А и Тип до- сье В) и содержит все семь атрибутов, а Объект Y имеет один тип досье (Тип досье В) и со- держит четыре атрибута, причем Атрибут 4 одновременно входит в состав обоих типов до- сье.

Актуализация базы данных досье производится путем ввода в нее новых фактов такого вида.

Факт: < идентификатор факта>, < значение факта>, < временной диапазон действия факта>, <место>, <источник факта>, <оператор>, <статус факта>;

Идентификатор факта: <идентификатор объекта>;

Идентификатор элемента досье – <идентификатор атрибута>, <идентификатор связи>.

Технологии обработки фактов

Один из наиболее важных, но и наименее достоверных источников информации для выделения фактов – масс-медиа. В связи с большой плотностью потока текстовой информации в современных фактографических системах интенсивно развивается технология автоматического выделения фактов, относящихся к объектам мо- ниторинга. Она позволяет в режиме квазиреального времени получить доступ к ретроспективным фондам до- кументов за десяток лет и получить актуальное "сырое" досье на новые объекты, что практически нереально при использовании экспертной технологии выделения фактов. В XFiles реализована функция сбора А-фактов практически изо всех доступных типов открытых источников.

Для последующей оценки достоверности фактов, их обобщения и для формирования аналитических материалов используется экспертная обработка. Экспертные факты (Э-факты) вводятся авторизованным пользователем в интерактивном или пакетном режиме.

Для установления связи между объектами системы необходима пара профильных атри- бутов в связываемых объектах. При наличии факта об определенном типе связи двух объек- тов в каждый профильный атрибут обоих объектов вводится ссылка на объект viz-a-viz. Этот процесс может выполняться автоматически и с участием эксперта. Если объекта – второго участника связи нет в базе данных, то, в зависимости от параметров системы, он создается автоматически либо гипертекстовая ссылка не создается.

В системе рассматриваются два типа связей: симметричные и асимметричные. Симмет- ричная связь между объектами X и Y создается автоматически путем установления в одном и том же атрибуте досье каждого из объектов гиперссылки на второй объект. При автоматиче- ском выделении этого факта из текста первичным объектом связи считается подлежащее, а вторичным – дополнение. Так, для атрибута Дружественные отношения в досье Персоны для объекта Орлов может фигурировать факт дружбы с объектом Петров. В этом случае у объек- та Петров появится симметричный факт и ссылка на объект Орлов в этом же атрибуте.

В случае асимметричной связи автоматическая репликация факта связи производится между различными атрибутами объектов. Например, при выявлении факта кредитования од- ним объектом другого для атрибута Сумма выданного кредита одного объекта активируе- мым будет атрибут Сумма взятого кредита другого.

На рис. 20 представлен пример структуры источников информации, используемых для ведения досье.

Рис. 20. Структура источников фактов в системе бизнес-разведки

Автоматическое выделение фактографической информации – это процесс выделения фактов для пар (объект, атрибут досье), которые находятся в состоянии автоматического мо- ниторинга (рис. 21). В зависимости от типа атрибута и источника информации процесс мо- жет быть выполнен различными методами: с применением инструментов контекстного поис- ка, синтаксического анализа, методов распознавания образов, статистического анализа и др.

В автоматическом выделении фактов в системе бизнес-разведки задействовано несколько программных компонентов.

Фактографический модуль предназначен для автоматического выделения фактов из ин- формационных объектов, доставляемых источником данных. Может обрабатывать структу- рированные (числовые и символьные данные, пространственная информация из геоинфор- мационных систем) и неструктурированные (видео, звук, текст) данные. Например, для тек- стового атрибута Покупка акций фактом является контрольный пакет акций, объектом связи – ОАО "XXX", а свойством факта – обстоятельство времени (май 2004 г.). С помощью се- мантико-

Рис. 21. Преобразование аномалий процессов, полученных в системе экономического мониторинга, в А-факты
лингвистических методов выделяются количественная информация, связанные с фактом объекты, обстоятельства места и времени. Выделенная информация очищается, нормализу- ется (например, приводится к единому формату даты в системе) и классифицируется. Она со- храняется в базе и используется для аналитической обработки, скажем для автоматического выявления прямых, косвенных и транзитивных связей между объектами, а также для построе- ния семантических сетей объектов.

Источник данных доставляет контент для автоматической обработки фактографическим модулем. Все источники документов системы поддерживают набор программных интерфей- сов, с помощью которых фактографический модуль выполняет запросы, получает контент и его атрибуты.

Задача управляет регламентом и настройками процесса автоматического выделения фак- тов из текстов.

Агент запуска задач управляет регламентом выполнения задач, производит их запуск и остановку. Агент определяет задачу, готовую к выполнению. По ее параметрам он устанав- ливает, какой фактографический модуль необходимо запустить и какие источники докумен- тов для этого использовать.

Для минимизации времени обработки потока документов используются контекстные фильтры, предварительно отделяющие потенциально "полезные" для выделения фактов до- кументы. Они могут быть связаны с объектом мониторинга или атрибутами досье. Каждый атрибут досье может иметь фактографическое правило, определяющее синтактико- морфологический шаблон, по которому выделяются факт и его атрибуты в тексте. Шаблоны строятся специальным модулем на основе обучающих примеров-предложений. На его вход подается предложение, содержащее факт для определенного атрибута, а на выходе формиру- ется шаблон факта для всех похожих предложений.

Технология выделения А-фактов из текста основана на использовании специальных се- мантико-лингвистических методов, которые позволяют получить А-факты, сопоставимые с экспертными по точности и полноте. Сначала строится дайджест объекта, который содержит все предложения документа, содержащие ссылки на объект. Затем создается информацион- ный портрет документа на основе смысла элементов текста, извлекаемых средствами синтак- сического анализа и синтеза. Далее он преобразуется в семантическую сеть, обеспечиваю- щую инвариантность представления смыслов относительно ряда особенностей поверхност- но-синтаксической организации текста.

Для решения задачи выделения А-фактов полное представление смысла текста в форме се- мантической сети избыточно; оно имеет большой объем (превышающий объем документа), а его утилизация требует высокопроизводительного оборудования и развитых нетривиальных средств для поиска и сравнения структур на графах. Будучи дополнен правилами для генерации канони- ческой формы синтагм, синтаксический анализ-синтез позволяет описать каждый смысловой атрибут текста в виде строки, инвариантной к его грамматическому выражению в различных фразах. Например, фразам "Транспорт был арендован террористом у автобазы", "Террорист арендует у автобазы транспорт" и "Аренда транспорта террористом у автобазы" будут соответ- ствовать одинаковые элементы смысла: "террорист арендует", "аренда транспорта", "аренда у автобазы".

Выделяемые связи между элементами смысла можно разделить на следующие основные классы:

    • связи между ситуациями и их участниками, например (сделать, покупка), (продажа, акции);
    • атрибутивные связи внутри именных групп, обычно называющих участников ситуа- ции, например акт (террористический, боевиков), предприятие (прибыльное, город);
    • связи между ситуациями, например, покупать (учиться), бороться (искореняя);
    • связи ситуаций с обстоятельствами или дополнительными атрибутами.

В последней технологической фазе извлечения А-фактов модуль фактографических правил на основе се- мантической сети дайджеста производит поиск шаблонов фактов и сохраняет структурированное описание вы- деленных фактов в базе данных системы. Еще раз подчеркнем, что выделенный факт – это не только контекст, но и его свойства. В XFiles алгоритм выделения фактов из текстов наиболее глубоко проработан для русского языка; для других языков могут использоваться источники документов, поддерживающие многоязычный по- иск.

Технология формирования досье

При коллективной работе зачастую несколько фактов вводятся в один атрибут одного объекта, после чего возникает необходимость в экспертной оценке достоверности введенных (возможно, противоречивых) фактов. Для этого в базе досье хранится дополнительная информация, подтверждающая факты в форме цитат из доку- ментов, а также прикрепленных к факту документов, почтовых сообщений, заключений экспертов, видеофраг- ментов и графических файлов. Каждый факт в системе имеет статус "достоверный" или "недостоверный". На основе дополнительной подтверждающей информации из базы данных эксперт может принять решение об из- менении статуса факта либо его удалить.

В системе реализован трекинг фактов – для любого факта пользователи имеют возможность вводить и про- сматривать комментарии и фрагменты контента, а также сами информационные объекты.

Технология пакетного формирования досье весьма актуальна в компаниях, имеющих рас- пределенную систему офисов, каждый из которых может порождать информацию, например о действиях конкурентов в их регионе. При этом рыночная политика формируется в центральном офисе на основании, в том числе, досье на конкурентов. Для разметки удаленно сформирован- ных сообщений, содержащих новые факты об объектах мониторинга, используется язык XML. Он удобен по нескольким причинам. Во-первых, состав атрибутов для каждого типа досье по- стоянно изменяется. Во-вторых, необходимо обеспечить возможность ввода новых типов досье. Встроенные в шаблон средства контроля над целостностью документа позволяют передавать только правильные факты. Автоматический ввод поступающих фактов производится с помо- щью программы-агента. Она выполняет мониторинг поступления новых сообщений, анализ корректности и структурный разбор XML-сообщения, формирование списка фактов, содержа- щихся в сообщении, и ввод фактов в базу данных.

Аналитическая обработка фактов

В системах бизнес-разведки обычно реализованы следующие базовые виды аналитиче- ской обработки фактов:

    • построение исторической цепочки фактов для каждого атрибута досье объекта;
    • автоматическое порождение досье на появившиеся в связях новые объекты. В случае появления в факте нового объекта – участника связи по определенному атрибуту по нему ав- томатически создается досье, и новый объект ставится на мониторинг;
    • автоматическое выявление косвенных связей объекта с другими объектами (связи че- рез третий объект или по общему диапазону дат и обстоятельству места, рис. 22);
    Рис. 22. Типы связей объектов
    • поиск наиболее коротких цепочек связей между заданными объектами; построение сети связей объекта (рис. 23);
    • определение областей влияния объекта; выявление кластеров (плотных скоплений) связанных объектов (группировок);
    • поиск релевантных объектов и связей по содержанию фактов.

Все виды аналитической обработки в XFiles могут дополняться ограничениями:

    • на атрибуты-связи (например, отображаются связи только по атрибутам Покупка и продажа акций и Банки-посредники операций);
    • на типы допустимых в цепочке связей (прямые, косвенные или любые);
    • на контент фактов; например, выделяются объекты, в атрибуте Акционеры которых содержится лингвистический шаблон Резник;
    Рис. 23. Фрагмент сети связей объектов
    • на длину цепочки связи объектов;
    • на временной диапазон существования связей;
    • на место совершения факта.

Сочетание возможностей

Информационная система бизнес-разведки для формирования досье базируется на технологиях извлечения знаний и использует в качестве источников все системы, применяемые в процессе подготовки и принятия ре- шений. Обычно они интегрированы в корпоративный аналитический портал компании.

Растущая популярность таких информационных систем объясняется возможностью инте- грации знаний, накапливаемых экспертами и программами-автоматами. Этим достигается со- четание возможностей автоматического сбора большого числа относительно "сырых" фактов из разных источников, их экспертной оценки и информационной поддержки принятия адек- ватных решений. Основанные на данном подходе системы бизнес-разведки компаний обеспе- чивают качественно новые конкурентные преимущества, безопасность и динамичное развитие бизнеса.





 У Вас есть материал пишите нам
 
    Copyright © 2008    
Rambler's Top100