Разработка комплекса программ для кластерного анализа регионов Сибирского федерального округа Исполнитель: Пилиненская Анна Александровна Научный руководитель: Лазеева Мария Петровна Экономический потенциал Уровень жизни населения Трудовой потенциал Финансовый потенциал Уровень образования населения Методы многомерного анализа  Кластерный анализ  Факторный анализ  Дискриминантный.

Download Report

Transcript Разработка комплекса программ для кластерного анализа регионов Сибирского федерального округа Исполнитель: Пилиненская Анна Александровна Научный руководитель: Лазеева Мария Петровна Экономический потенциал Уровень жизни населения Трудовой потенциал Финансовый потенциал Уровень образования населения Методы многомерного анализа  Кластерный анализ  Факторный анализ  Дискриминантный.

Slide 1

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 2

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 3

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 4

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 5

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 6

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 7

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 8

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 9

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 10

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 11

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 12

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13


Slide 13

Разработка комплекса
программ для
кластерного анализа
регионов Сибирского
федерального округа
Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

Экономический
потенциал

Уровень
жизни
населения

Трудовой
потенциал

Финансовый
потенциал

Уровень
образования
населения

2

Методы многомерного анализа

 Кластерный анализ
 Факторный анализ
 Дискриминантный анализ

3

Кластерный анализ
Cluster – с англ. гроздь, скопление

Достоинства:
 разбиение по набору признаков, а не по одному
параметру;
 нет ограничений на вид рассматриваемых
объектов;
 резкое сокращение большого объема
информации;
 возможность использовать анализ циклически.

Недостатки:
 возможны определенные искажения данных.
4

Методы кластерного анализа

Методы кластерного анализа

Иерархические

Агломеративные

Неиерархические

Дивизимные

5

Постановка задачи кластерного анализа
Имеется:
G={G1,G2,…,Gn } – множество
объектов совокупности X,
X ={X1,X2,…,Xn } – множество
векторов измерений, описывающих
множество G

Задача:
Разбить множество объектов G на
m кластеров Q1,Q2,…,Qm, так, чтобы
каждый объект Gj принадлежал
только одному кластеру Qm
6

Однородность объектов

k

 ( xi , x j ) 



( x ie  x je )

2

e 1

k

 BE ( x i , x e ) 



e

( x ie  x je )

e 1

k

 H ( xi , x j ) 



e 1

x ie  x je

2

Обычное евклидово расстояние, где хie, xje–
величина е-ой компоненты у i-го (j-го)
объекта (е=1,2,...,к, i,j=1,2,...,n).
Взвешенное евклидово расстояние, где ωe–
вес каждой компоненты x вектора
наблюдений X.
Хеммингово расстояние равно числу
несовпадений значений соответствующих
признаков, в рассматриваемых i-м и j-м
объектах.
7

Цель дипломной работы
Необходимо разработать приложение, позволяющее
классифицировать регионы Сибирского
федерального округа по нескольким признакам:







экономический потенциал;
трудовой потенциал;
финансовый потенциал;
научно-образовательный потенциал;
уровень жизни населения.

8

Задачи дипломной работы

 Составить выборку для анализа.
 Разработать программный комплекс
реализующий методы кластерного
анализа.

 Провести анализ выборки с помощью
программного комплекса.
9

Интерфейс и функциональные возможности

10

Результаты работы

11

Результаты работы

12

Разработка комплекса программ для
кластерного анализа регионов
Сибирского федерального округа

Спасибо за внимание!

Исполнитель: Пилиненская Анна Александровна
Научный руководитель: Лазеева Мария Петровна

13