5. Добытчик на все руки

Система MineSet от Silicon Graphics представляет собой инструментарий для интеллектуального анализа данных на основе мощной визуальной оболочки. Ее особенностью является использование нескольких взаимодополняющих стратегий добычи, анализа и интерпретации данных. Архитектура MineSet имеет открытый характер, что позволяет работать с информационным хранилищем, построенном на основе реляционных баз данных или "плоских" ASCII-файлах. Процесс анализа начинается с выборки некоторого подмножества данных для дальнейшего исследования, которые могут преобразовываться. Тем самым создается информационная модель в виде, наиболее подходящем для последующего изучения.

Набор инструментальных средств MineSet состоит из 3 основных модулей:

- управляющего модуля. Он включает в себя графический интерфейс пользователя, который называется Tool Manager, и базирующийся на сервере процесс - DataMover;

- модуля аналитического Data Mining, находящегося на сервере и имеющего четыре интеллектуальных инструмента;

- модуля визуального Data Mining, находящегося на клиентской машине и состоящего из пяти инструментов.

Менеджер инструментов (Tool Manager) предоставляет интерактивный графический интерфейс, с помощью которого пользователь получает доступ ко всем возможностям и инструментам MineSet в единой интегрированной среде. С его помощью пользователь получает доступ к данным.

Процесс DataMover осуществляет доступ к данным, производит их выборку и преобразования, инициализирует работу запускаемых на сервере инструментов аналитического data mining и возвращает данные на клиентскую станцию для распределения их по визуальным инструментам.

К инструментам аналитического Data Mining относят четыре взаимодополняющих инструмента аналитической добычи данных, основанных на методах искусственного интеллекта с использованием машинного обучения. Это Генератор ассоциативных связей (Association Rule Generator), Генератор Дерева решений (Decision Tree Inducer), Генератор свидетельств (Evidence Inducer) и утилита определения Значимости признаков (Column Importance).

MineSet содержит пять инструментов для визуального Data Mining, позволяющих выполнять интерактивное визуальное представление и исследование данных. Это Ландшафтный визуализатор (Map Visual-izer), Визуализатор дисперсии (Scatter Visualizer), Визуализатор деревьев (Tree Visualizer), Визуализатор правил (Rule Visualizer) и Визуализатор свидетельств (Evidence Visualizer).

 


 

6. Data Mining в Бизнесе

С помощью Data Mining предприятия розничной торговли могут выполнять анализ покупательской корзины, знание которой необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов их раскладки в торговых залах. Исследование временных шаблонов помогает торговым предприятиям принимать решения о создании товарных запасов, а создание прогнозирующих моделей дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением.

Достижения технологии Data Mining в банковском деле позволят выявлять мошенничество с кредитными карточками, сегментировать клиентов по категориям, а также прогнозировать изменения клиентуры.

В области телекоммуникаций методы Data Mining помогают компаниям более энергично продвигать свои программы маркетинга и ценообразования (анализ записей о подробных характеристиках вызовов и выявление лояльности клиентов).

Data Mining может применяться во множестве других областей. Например, в автомобильной промышленности при сборке автомобилей производители должны учитывать требования каждого отдельного клиента, поэтому нужна возможность прогнозирования популярности определенных характеристик и знание того, какие характеристики обычно заказываются вместе. Авиакомпании могут выявлять клиентов, которых поощрительными мерами можно побудить летать больше.

 


 

7. Крупнейшая онлайновая сеть научной и технической информации

Общепризнанным источником научной и технической информации является международная сеть научной и технической информации STN International (Scientific & Technical Information Network). Она находится в совместном управлении германского Специализированного информационного центра ФИЦ Карлсруэ (Fachinformationszentrum (FIZ) Karlsruhe), Реферативной службы по химии Американского химического общества (Chemical Abstracts Service (CAS), American Chemical Society) и Информационного центра по науке и технике Японской научно-технической корпорации (Information Center for Science and Technology (JICST), Japan Science and Technology Corporation). В настоящее время сеть STN International обеспечивает онлайновый доступ к более чем 200 базам данных во всех областях науки и техники (см. табл. 1).

После нахождения нужных публикаций или документов можно заказать их полные тексты, используя систему автоматизированной доставки через Интернет - FIZ AutoDoc/ChemPort. Многие известные международные библиотеки и издательства уже сегодня связаны с системой FIZ AutoDoc/ChemPort, и их численность постоянно увеличивается.

Чтобы иметь доступ к FIZ AutoDoc, необходимо зарегистрироваться, получить идентификатор для подключения и пароль (www.fiz-karlsruhe.de/autodoc).

Таблица 1. Наиболее крупные базы данных STN

Базы данных Количество документов, млн.
BEILSTEIN 7,7
BIOSIS 12,0
CA/CAPLUS 16,1
COMPENDEX 4,4
EMBASE 8,0
INPADOC 30,0
INSPEC 6,5
INVESTEXT 9,4
JAPIO 6,3
MEDLINE 11,0
PROMT 7,9
REGISTRY 23,3
SCISEARCH 17,7
WORLDCAT 41,0
WPINDEX 9,5

 


 


Информация о работе «Добыча знаний и управление ими»
Раздел: Информатика, программирование
Количество знаков с пробелами: 30294
Количество таблиц: 1
Количество изображений: 0

Похожие работы

Скачать
47826
1
0

... последовательные ступени обработки сырья, либо играющих вспомогательную роль одна по отношению к другой. И в случае межотраслевых объединений тресты представляют собой комбинаты.                                               ГЛАВА 2. «МЯГКИЕ» ФОРМЫ ОБЪЕДИНЕНИЙ. 2.1. КОНСОРЦИУМ Консорциум — временный союз хозяйственно независимых фирм, целью которого могут быть разные ...

Скачать
181293
9
0

... кредиты иностранных центральных и частных банков, а также МВФ. Использование заемных ресурсов связано с выполнением определенных требований кредитора. 3.3 Политика управления валютными резервами в кратко- и среднесрочном периоде и ее эффект Важную роль в развитии международных экономических отношений Молдовы играет финансовое регулирование внешнеэкономических связей через формирование и ...

Скачать
366812
5
19

... предыдущего чрезмерного стравления, в восстановлении будут преобладать разновидности сорняков.   Глава 3. Проблемы горных территорий и возможные способы их решения. Природные и антропогенные катаклизмы. Природные катаклизмы в горах представляют результат геотектонической природы гор и их экологических характеристик. Однако катаклизмы зачастую вызываются деятельностью человека. Перед ...

Скачать
174563
29
92

... по ГХК "Краснолиманская Показатели 1999 2000 Отклонение, пунктов Отклонение, % 1. Рентабельность капитала 2. Рентабельность основного капитала 3. Рентабельность производства 4. Рентабельность продаж 26,4 33,3 43,8 30,5 28,1 36,5 48,6 32,7 +1,7 +3,2 +4,8 +2,2 +6,4 +9,6 +11,0 +7,2 2.3 Управление затратами на ...

0 комментариев


Наверх