Системы классификации информации, основные идеи

Введение в информатику
Формализация предметной задачи. Уровни формализации задач Типы моделей Синтаксические меры информации Прагматические меры информации Системы классификации информации, основные идеи Система кодирования информации, классификация методов Информационное общество. Информационные революции Поколение, после 1946 года Техническое обеспечение ИТ. Виды ИТ Классификация ИТ по типу обрабатываемой информации Характеристики и назначение ИТ автоматизации офиса. Основные компоненты Данные и знания Основные компоненты экспертной системы, специалисты-разработчики Централизованная и распределенная обработка данных Основные характеристики коммуникационной сети Информационные продукты и услуги. Информационный бизнес Интернет-аукцион - торговая витрина, где продавцы выставляют на продажу принадлежащие им товары, а покупатели подают заявки на покупку этих товаров
161967
знаков
0
таблиц
2
изображения

16. Системы классификации информации, основные идеи

Важным понятием при работе с информацией является классификация объектов - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - это процедура группировки на качественном уровне, направленная на выделение однородных свойств.

Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.

При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.

Разработка классификаторов является достаточно сложной задачей и проводится, как правило, в несколько этапов.

На 1-м этапе проводят исследования, определяющие исходное множество объектов, подлежащих классификации; выбор метода классификации и классификационных признаков, позволяющих упорядочить объекты в систему.

На 2-м этапе разрабатывается методика создания классификатора, содержащая состав и характеристику объектов классификации: описание и обоснование классификационных признаков и методов классификации и кодирования объектов, включаемых в классификатор; структура классификатора.

3-й этап - создание классификатора и программного обеспечения системы ведения классификатора: сбор исходных данных; установление полного перечня объектов классификации и упорядочение этих объектов в систему; разработка структуры и формирование базы данных классификатора; подготовка задания на создание системы ведения классификатора; оформление, согласование и утверждение классификатора.

И только 4-й этап - ввод в действие классификатора.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков.

Иерархическая система классификации строится следующим образом: исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень; каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень; каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.

Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации: простота построения; использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации: жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами и (facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

Кs = (Ф1, Ф2, …, Фi, …, Фп),

где Фi - i-й фасет, п - количество фасетов.

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Достоинства фасетной системы классификации: возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок; возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

Примером фасетной системы классификации является система регистрации преступных элементов, предложенная французским криминалистом Альфонсом Бертильоном. Бертильон делит всех людей на три группы - по длине черепа, каждая из трех групп делится на три подгруппы - по ширине черепа, дальнейшие деления - по размеру среднего пальца левой руки, размеру правого уха, росту, длине рук, высоте в сидячем положении, размеру стопы, длине локтевого сустава. Всего 19683 категории.

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем: отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы; выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых; создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.


Информация о работе «Введение в информатику»
Раздел: Информатика, программирование
Количество знаков с пробелами: 161967
Количество таблиц: 0
Количество изображений: 2

Похожие работы

Скачать
26646
6
5

... мотивы указываются респондентами достаточно часто (более 60% респондентов указывают этот мотив). Ряд мотивов упоминается в анкетах не очень часто (от 20% до 45%). Есть мотивы, которыми при выборе дополнительного образования в области информатики школьники руководствуются редко (до 10%). В соответствии с этим условно все мотивы были разделены на три группы. Неожиданным для нас явился тот факт, что ...

Скачать
158303
36
0

... -педагогическая или научно-техническая проблема, являющаяся новым научным вкладом в теорию определенной области знаний (педагогику, технику и другие). 4.   ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ДЛЯ ВЫПОЛНЕНИЯ ВЫПУСКНОЙ КВАЛИФИКАЦИОННОЙ РАБОТЫ БАКАЛАВРА ФИЗИКО-МАТЕМАТИЧЕСКОГО ОБРАЗОВАНИЯ ПРОФИЛЬ ИНФОРМАТИКА   4.1. Положение о выпускной квалификационной работе бакалавра физико-математического образования: ...

Скачать
16405
0
1

... , нейрокибернетика и гомеостатика теснейшим образом связаны с развитием искусственного интеллекта. И конечно, работы в этой области немыслимы без развития систем программирования (рис. 1). Рис. 1 - Структура информатики Основная цель работ в области искусственного интеллекта - стремление проникнуть в тайны творческой деятельности людей, их способности к овладению знаниями, навыками и ...

Скачать
106950
19
0

... обучения информатике. Опыт таких разработок уже имеется как в нашей стране, так и за рубежом, описаны их положительные и отрицательные стороны. 1.3 Отечественный и зарубежный опыт непрерывного обучения информатике с 1 по 11 класс средней общеобразовательной школы Возраст, с которого дети начинают изучать информатику, неуклонно снижается. Об этом свидетельствует, как зарубежный, так и ...

0 комментариев


Наверх