Разработка комплекса программ для кластерного анализа регионов Сибирского федерального округа Исполнитель: Пилиненская Анна Александровна Научный руководитель: Лазеева Мария Петровна Экономический потенциал Уровень жизни населения Трудовой потенциал Финансовый потенциал Уровень образования населения Методы многомерного анализа Кластерный анализ Факторный анализ Дискриминантный.
Download ReportTranscript Разработка комплекса программ для кластерного анализа регионов Сибирского федерального округа Исполнитель: Пилиненская Анна Александровна Научный руководитель: Лазеева Мария Петровна Экономический потенциал Уровень жизни населения Трудовой потенциал Финансовый потенциал Уровень образования населения Методы многомерного анализа Кластерный анализ Факторный анализ Дискриминантный.
Slide 1
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 2
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 3
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 4
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 5
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 6
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 7
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 8
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 9
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 10
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 11
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 12
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 13
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 2
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 3
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 4
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 5
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 6
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 7
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 8
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 9
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 10
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 11
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 12
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13
Slide 13
Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
Экономический
потенциал
Уровень
жизни
населения
Трудовой
потенциал
Финансовый
потенциал
Уровень
образования
населения
2
Методы многомерного анализа
Кластерный анализ
Факторный анализ
Дискриминантный анализ
3
Кластерный анализ
Cluster – с англ. гроздь, скопление
Достоинства:
разбиение по набору признаков, а не по одному
параметру;
нет ограничений на вид рассматриваемых
объектов;
резкое сокращение большого объема
информации;
возможность использовать анализ циклически.
Недостатки:
возможны определенные искажения данных.
4
Методы кластерного анализа
Методы кластерного анализа
Иерархические
Агломеративные
Неиерархические
Дивизимные
5
Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G
Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6
Однородность объектов
k
( xi , x j )
( x ie x je )
2
e 1
k
BE ( x i , x e )
e
( x ie x je )
e 1
k
H ( xi , x j )
e 1
x ie x je
2
Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7
Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:
экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.
8
Задачи дипломной работы
Составить выборку для анализа.
Разработать программный комплекс
реализующий методы кластерного
анализа.
Провести анализ выборки с помощью
программного комплекса.
9
Интерфейс и функциональные возможности
10
Результаты работы
11
Результаты работы
12
Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа
Спасибо за внимание!
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна
13