Суббота, 04 Янв 2025, 07:10
Uchi.ucoz.ru
Меню сайта
Форма входа

Категории раздела
Авиация и космонавтика [0]
Административное право [0]
Арбитражный процесс [0]
Архитектура [0]
Астрология [0]
Астрономия [0]
Банковское дело [0]
Безопасность жизнедеятельности [1930]
Биографии [0]
Биология [2350]
Биология и химия [0]
Биржевое дело [78]
Ботаника и сельское хоз-во [0]
Бухгалтерский учет и аудит [4894]
Валютные отношения [0]
Ветеринария [0]
Военная кафедра [0]
География [2269]
Геодезия [0]
Геология [0]
Геополитика [46]
Государство и право [13375]
Гражданское право и процесс [0]
Делопроизводство [0]
Деньги и кредит [0]
Естествознание [0]
Журналистика [660]
Зоология [0]
Издательское дело и полиграфия [0]
Инвестиции [0]
Иностранный язык [0]
Информатика [0]
Информатика, программирование [0]
Исторические личности [0]
История [6878]
История техники [0]
Кибернетика [0]
Коммуникации и связь [0]
Компьютерные науки [0]
Косметология [0]
Краеведение и этнография [540]
Краткое содержание произведений [0]
Криминалистика [0]
Криминология [0]
Криптология [0]
Кулинария [923]
Культура и искусство [0]
Культурология [0]
Литература : зарубежная [2115]
Литература и русский язык [0]
Логика [0]
Логистика [0]
Маркетинг [0]
Математика [2893]
Медицина, здоровье [9194]
Медицинские науки [100]
Международное публичное право [0]
Международное частное право [0]
Международные отношения [0]
Менеджмент [0]
Металлургия [0]
Москвоведение [0]
Музыка [1196]
Муниципальное право [0]
Налоги, налогообложение [0]
Наука и техника [0]
Начертательная геометрия [0]
Оккультизм и уфология [0]
Остальные рефераты [0]
Педагогика [6116]
Политология [2684]
Право [0]
Право, юриспруденция [0]
Предпринимательство [0]
Промышленность, производство [0]
Психология [6212]
психология, педагогика [3888]
Радиоэлектроника [0]
Реклама [910]
Религия и мифология [0]
Риторика [27]
Сексология [0]
Социология [0]
Статистика [0]
Страхование [117]
Строительные науки [0]
Строительство [0]
Схемотехника [0]
Таможенная система [0]
Теория государства и права [0]
Теория организации [0]
Теплотехника [0]
Технология [0]
Товароведение [21]
Транспорт [0]
Трудовое право [0]
Туризм [0]
Уголовное право и процесс [0]
Управление [0]
Управленческие науки [0]
Физика [2737]
Физкультура и спорт [3226]
Философия [0]
Финансовые науки [0]
Финансы [0]
Фотография [0]
Химия [1714]
Хозяйственное право [0]
Цифровые устройства [34]
Экологическое право [0]
Экология [1778]
Экономика [0]
Экономико-математическое моделирование [0]
Экономическая география [0]
Экономическая теория [0]
Этика [0]
Юриспруденция [0]
Языковедение [0]
Языкознание, филология [1017]
Новости
Чего не хватает сайту?
500
Статистика
Зарегистрировано на сайте:
Всего: 51655


Онлайн всего: 2
Гостей: 2
Пользователей: 0
Яндекс.Метрика
Рейтинг@Mail.ru

База рефератов


Главная » Файлы » База рефератов » Математика

Кластерный анализ и метод горной кластеризации


Гость, для того чтобы скачать БЕСПЛАТНО ПОЛНУЮ ВЕРСИЮ РЕФЕРАТА, Вам нужно кликнуть по любой ссылке после слова оплачиваемая реклама.
13 Апр 2013, 23:41
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

КЕМЕРОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Математический факультет

Кафедра АИТК

Реферат на тему:

«Кластерный анализ и метод горной кластеризации»

студента 5 курса, М-063 группы

Баранова Семёна Фёдоровича

Специальность – 010501 –

«Прикладная математика и информатика»

Руководитель:

Р.Ю.Замараев

Кемерово 2010


Содержание

Цель работы

1. Происхождение метода анализа

2. Решаемая данным методом задача

3. Возможная область применения

4. Математическое описание метода

5. Пример использования метода на реальных данных

Заключение

Используемая литература


Цель работы

Целью данной самостоятельной работы является ознакомление с основными методами анализа, изучение одного из методов кластерного анализа на выбор автора работы, а также применение метода на реальных данных в каком-либо математическом пакете.

Требования к работе:

1. Самостоятельная работа оформляется в виде реферата;

2. Работа должна содержать следующие обязательные пункты:

· происхождение метода анализа (автор, базовый метод);

· решаемая данным методом задача (тип снимаемой неопределенности);

· возможная область применения в различных предметных областях;

· пример использования метода на реальных данных (выдаются преподавателем);

3. Пример реализуется в удобном математическом пакете (Matlab, Mathcad, Mathematica) в виде макроса или рабочего листа с иллюстрациями;

4. Работа сдается в печатном и электронном виде.


1 Происхождение метода анализа

Существует множество методов кластеризации, которые можно классифицировать на четкие и нечеткие. Четкие методы кластеризации разбивают исходное множество объектов X на несколько непересекающихся подмножеств. При этом любой объект из X принадлежит только одному кластеру. Нечеткие методы кластеризации позволяют одному и тому же объекту принадлежать одновременно нескольким (или даже всем) кластерам, но с различной степенью. Нечеткая кластеризация во многих ситуациях более "естественна", чем четкая, например, для объектов, расположенных на границе кластеров.

Методы кластеризации также классифицируются по тому, определено ли количество кластеров заранее или нет. В последнем случае количество кластеров определяется в ходе выполнения алгоритма на основе распределения исходных данных.

Метод горной кластеризации предложен Р. Ягером и Д. Филевым в 1993 г. Кластеризация по горному методу не является нечеткой, однако, ее часто используют при синтезе нечетких правил из данных. Особенностью метода является отсутствие необходимости задания количества кластеров до начала работы алгоритма.

На первом шаге горной кластеризации определяют точки, которые могут быть центрами кластеров. На втором шаге для каждой такой точки рассчитывается значение потенциала, показывающего возможность формирования кластера в ее окрестности. Чем плотнее расположены объекты в окрестности потенциального центра кластера, тем выше значение его потенциала. После этого итерационно выбираются центры кластеров среди точек с максимальными потенциалами.


2 Решаемая данным методом задача

Метод горной кластеризации в Matlab позволяет найти центры кластеров, т.е. координаты центров скопления объектов, задаваемых исходными данными. Также можно получить радиусы кластеров после выполнения алгоритма.

3 Возможная область применения в различных предметных областях

Техника кластеризации применяется в самых разнообразных областях. Например, в области медицины кластеризация заболеваний, лечения заболеваний или симптомов заболеваний приводит к широко используемым таксономиям. В области психиатрии правильная диагностика кластеров симптомов, таких как паранойя, шизофрения и т.д., является решающей для успешной терапии. В археологии с помощью кластерного анализа исследователи пытаются установить таксономии каменных орудий, похоронных объектов и т.д. Известны широкие применения кластерного анализа в маркетинговых исследованиях. В области нечеткой математики, когда необходимо создать нечеткую базу знаний (входные величины связать с выходными с помощью нечетких правил). В общем, всякий раз, когда необходимо классифицировать "горы" информации к пригодным для дальнейшей обработки группам, кластерный анализ оказывается весьма полезным и эффективным.

4 Математическое описание метода

На первом шаге необходимо сформировать потенциальные центры кластеров. Для алгоритма горной кластеризации число потенциальных центров кластеров (Q) должно быть конечным. Ими могут быть объекты кластеризации (строчки матрицы ), тогда . Второй способ выбора потенциальных центров кластеров состоит в дискретизации пространства входных признаков. Для этого диапазоны изменения входных признаков разбивают на несколько интервалов. Проводя через точки разбиения прямые, параллельные координатным осям, получаем "решеточный" гиперкуб. Узлы этой решетки и будут соответствовать центрам потенциальных кластеров. Обозначим через  - количество значений, которые могут принимать центры кластеров по -й координате ( ). Тогда количество возможных кластеров будет равно: $IMAGE6$.

На втором шаге алгоритма рассчитывается потенциал центров кластеров по следующей формуле:

$IMAGE7$, $IMAGE8$,

где $IMAGE9$ - потенциальный центр h-го кластера;

$IMAGE10$ - положительная константа

$IMAGE11$ - расстояние между потенциальным центром кластера ( $IMAGE12$) и объектом кластеризации ( $IMAGE13$). В евклидовом пространстве это расстояние рассчитывается по формуле:

$IMAGE14$.

В случае, когда объекты кластеризации заданы двумя признаками (n=2), графическое изображение распределения потенциала будет представлять собой поверхность, напоминающую горный рельеф. Отсюда и название - горный метод кластеризации.

На третьем шаге алгоритма в качестве центров кластеров выбирают координаты "горных" вершин. Для этого, центром первого кластера назначают точку с наибольшим потенциалом. Обычно, наивысшая вершина окружена несколькими достаточно высокими пиками. Поэтому назначение центром следующего кластера точки с максимальным потенциалом среди оставшихся вершин привело бы к выделению большого числа близко расположенных центров кластеров. Чтобы выбрать следующий центр кластера необходимо вначале исключить влияние только что найденного кластера. Для этого значения потенциала для оставшихся возможных центров кластеров пересчитывается следующим образом: от текущих значений потенциала вычитают вклад центра только что найденного кластера (поэтому кластеризацию по этому методу иногда называют субтрактивной). Перерасчет потенциала происходит по формуле:

$IMAGE15$,

где $IMAGE16$ - потенциал на 1-й итерации;

$IMAGE17$ - потенциал на 2-й итерации;

$IMAGE18$ - центр первого найденного кластера:

$IMAGE19$;

$IMAGE20$ - положительная константа.

Центр второго кластера определяется по максимальному значению обновленного потенциала:

$IMAGE21$.

Затем снова пересчитывается значение потенциалов:

$IMAGE22$.


Итерационная процедура пересчета потенциалов и выделения центров кластеров продолжается до тех пор, пока максимальное значение потенциала превышает некоторый порог.

5 Пример использования метода на реальных данных

Для реализации метода горной кластеризации на реальных данных по показателям 3(Atomic-radius-emp), 7(Electron-affinity) и 14(Electronegativity-AllredRochow) автором был использован математический пакет Matlab версии 7.10.0(R2010a), в который были импортированы данные из таблицы MS Excel с помощью надстройки Spreadsheet Link EX 3.1.1. Вызов встроенной в Matlab функции кластеризации subclust() и создания фигуры для отображения получившихся результатов записаны в скрипте Cluster.m:

$IMAGE23$

Результаты:

$IMAGE24$

В командном окне Matlab выводятся координаты трех кластеров и их радиусы:

centers =

155.0000 41.1000 1.2200

135.0000 118.4000 1.7500

220.0000 48.4000 0.9100

sigmas =

27.5772 37.0170 0.5834


Заключение

В итоге анализа методом горной кластеризации по параметрам 3, 7 и 14 исходных данных выделились три кластера, дисперсия элементов довольно высока. Таким образом, можно выявить три группы элементов, имеющих одни и те же свойства.


Используемая литература

1. Гайдышев И. Анализ и обработка данных: специальный справочник – СПб: Питер, 2001.

2. www.exponenta.ru

***** Скачайте бесплатно полную версию реферата !!! *****
Категория: Математика | Добавил: Lerka
Просмотров: 332 | Загрузок: 6 | Рейтинг: 0.0/0 | Жаловаться на материал
Всего комментариев: 0
html-cсылка на публикацию
BB-cсылка на публикацию
Прямая ссылка на публикацию
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Профиль
Суббота
04 Янв 2025
07:10


Вы из группы: Гости
Вы уже дней на сайте
У вас: непрочитанных сообщений
Добавить статью
Прочитать сообщения
Регистрация
Вход
Улучшенный поиск
Поиск по сайту Поиск по всему интернету
Наши партнеры
Интересное
Популярное статьи
Портфолио ученика начальной школы
УХОД ЗА ВОЛОСАМИ ОЧЕНЬ ПРОСТ — ХОЧУ Я ЭТИМ ПОДЕЛИТ...
Диктанты 2 класс
Детство Л.Н. Толстого
Библиографический обзор литературы о музыке
Авторская программа элективного курса "Практи...
Контрольная работа по теме «Углеводороды»
Поиск
Учительский портал
Используются технологии uCoz