Total Solution
Download
Report
Transcript Total Solution
Построение процесса
управления
операционными ИТ
рисками
Иван Ермаков
EMC Consulting
Russia & CIS
21 ноября
Минск
© Корпорация EMC, 2012 г. Все права защищены.
1
Содержание
• Роль ИТ в современной финансовой
организации
• Методология управление ИТ рисками на
примере реализованного проекта
• Достигнутые результаты
© Корпорация EMC, 2012 г. Все права защищены.
2
Роль ИТ в современной финансовой
организации
• « … банк это ит- провайдер с банковской
лицензией …»
• Тенденции
• Автоматизация бизнес-процессов
• рост значимости электронных каналов
взаимодействия с клиентами
• быстрое развитие сервисов
самообслуживания
• Развитие Интернет – банков
© Корпорация EMC, 2012 г. Все права защищены.
3
Риск профиль банка
• Риск профиль банка
– Операционные риски – 15 – 30%.
• Эксперты: 30 – 70% операционных рисков приходится
на ИТ риски.
• ИТ риски должны рассматриваться наравне с
остальными видами риска.
• Управление ИТ рисками позволяет достичь значимых
для Бизнеса результатов (рейтинг, страховые тарифы,
резервирование средств)
© Корпорация EMC, 2012 г. Все права защищены.
4
Риски, связанные с ИТ
• Операционные
• Выполнение требований регуляторов
• Финансовые
– Инвестиции в ИТ
© Корпорация EMC, 2012 г. Все права защищены.
5
BIA & IT RA
• Business Impact Analysis
– Понимание влияния и стоимости простоя
информационных систем
– Параметры восстановления – директивный срок и
допустимый диапазон потери данных
• Анализ ИТ рисков
– Сопоставление требований к бизнес-приложениям
и возможностей ИТ инфраструктуры
• Выстроили процесс постоянно контроля ИТ рисков с
участием эксперта ЕМС
© Корпорация EMC, 2012 г. Все права защищены.
6
Стоимость простоя –
На примере сбоя 13 марта 2012 (9:38–10:00)
Потери_доходов +
Потери_от_снижения_произво
дительности_труда +
недополученные_будущие_дох
оды =
598 000 руб. + 350 000 руб. + 1
1 200 000 руб. = 2 193 000 руб.
$ Impact
Общие_потери:
Minutes
© Корпорация EMC, 2012 г. Все права защищены.
Time
Days
7
Анализ технических рисков в ИТ
Обследование инфраструктуры на соответствие требованиям
BCDR)
•На основе BIA предложить требования к архитектуре
технических решений в зависимости от класса
критичности.
•Провести анализ соответствия текущих архитектур
эталонным и выявить расхождения.
Class Application / Application protection Online data protection Offline data protection People backup
system name
(backup)
Processes &
procedures
DC & Infrastructure Vendor support
arrangements
MC
Основная БД
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
CS
MC
Тарификатор
#1
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
MC
Тарификатор
#2
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BC
Тарификатор
#3
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BO
БД системы
Server hw description
Online data protection
Data backup practice & Peolple arrangement
Process arrangement & DC arrangement
None
© Корпорация EMC, 2012 г. Все права защищены.
8
Методология
• Disaster avoidance
– Защита оперативных данных и приложений
• Понимание архитектуры ИТ сервисов
– Контроль изменение и управление проектами
– Взаимоотношение с вендорами и провайдерами
услуг
– Процессу управления ИТ
– ЦОД
• Risk response
– Планы аварийного восстановления
– СРК
© Корпорация EMC, 2012 г. Все права защищены.
9
Пример анализа на наличие единичных
точек отказа (SPOF)
Data Center 01
APP-01
APP-02
APP-03
Data Center 02
Clustered application servers
DB Cluster
FS Node 01
FS Node 02
UID
1
2
3
READY
1
ALARM
POWER
POWER
SUPPLY
SUPPLY
MESSAGE
9
9
7
7
8
8
3
3
4
4
1
1
1
1
3
3
2
2
MIRROR
5
5
HP
ProLiant
DL380 G7
4
1
5
UID
1
POWER
POWER
CAP
CAP
DIMMS
2
2
5
5
4
4
FANS
4
3
4
3
POWER
POWER
SUPPLY
SUPPLY
9
9
2
6
3
7
4
8
99
8
8
1
1
PROC
PROC
2
2
2
1
7
7
6
6
ONLINE
AMP
SPARE
STATUS
2
2
6
6
OVER
OVER
TEMP
TEMP
2
POWER
POWER
SUPPLY
SUPPLY
5
5
6
6
PROC
PROC
FANS
PUSH
77
88
1
1
33
44
3
11
11
33
22
MIRROR
5
5
HP
ProLiant
DL380 G7
4
1
5
POWER
POWER
CAP
CAP
DIMMS
22
55
44
77
66
ONLINE
AMP
SPARE
STATUS
22
6
6
OVER
OVER
TEMP
TEMP
2
POWER
POWER
SUPPLY
SUPPLY
55
66
PROC
PROC
FANS
FANS
4
3
4
3
99
2
6
3
7
4
8
88
11
PROC
PROC
2
2
1
1
HP StorageWorks XP24000 Disk Array
Cabinet Number
HKP
hp StorageWorks
enterprise systems library
48V
hp Integrity Superdome
hp StorageWorks
enterprise systems library
GSP
Remote
Attention
MacroSrv-2
UID
1
2
11
POWER
POWER
SUPPLY
SUPPLY
99
77
88
33
44
SD2
3
11
11
33
22
MIRROR
5
5
HP
ProLiant
DL380 G7
4
1
5
2
6
POWER
POWER
CAP
CAP
DIMMS
22
55
44
77
66
ONLINE
AMP
SPARE
STATUS
2
2
6
6
OVER
OVER
TEMP
TEMP
22
POWER
POWER
SUPPLY
SUPPLY
55
66
PROC
PROC
FANS
FANS
4
3
4
3
99
88
1
1
PROC
PROC
2
2
1
1
3
7
4
8
License
Key
XP24000
Tape backup
Continuous
Access
6 links
32 links
FibreChannel
switches
FibreChannel
switches
12 links
8 links
6 links
SAN
FibreChannel
switches
8 links
Tape backup
Data Center 03
16 links
READY
ALARM
MESSAGE
hp St or ageWor ks xp12000 di sk ar r ay
PUSH
Cabinet Number
Cabinet Number
HKP
HKP
48V
hp Integrity Superdome
GSP
48V
hp Integrity Superdome
GSP
Remote
Remote
Attention
Attention
Class Application / Application protection Online data protection Offline data protection People backup
system name
(backup)
MacroSrv-2
UID
1
2
1
1
POWER
POWER
SUPPLY
SUPPLY
SD0
SD1
XP12000
9
9
7
7
8
8
3
3
4
4
1
1
3
1
1
3
3
2
2
MIRROR
5
5
FANS
4
3
4
3
4
5
5
4
4
7
7
6
6
1
5
2
6
3
7
4
8
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
CS
MC
Тарификатор
#1
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
MC
Тарификатор
#2
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BC
Тарификатор
#3
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BO
БД системы
HelpDesk
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
None
BO
HelpDesk Apps Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
нет
HP
ProLiant
DL380 G7
9
9
8
8
1
1
PROC
PROC
2
2
1
1
License
Key
BIS-01
BIS-02
© Корпорация EMC, 2012 г. Все права защищены.
DC & Infrastructure Vendor support
arrangements
Основная БД
POWER
POWER
CAP
CAP
DIMMS
2
2
ONLINE
AMP
SPARE
STATUS
2
2
6
6
OVER
OVER
TEMP
TEMP
2
2
POWER
POWER
SUPPLY
SUPPLY
5
5
6
6
PROC
PROC
FANS
Processes &
procedures
MC
10
Пример целевой архитектуры
© Корпорация EMC, 2012 г. Все права защищены.
11
Пример целевой архитектуры
Primary server
Primary DC
Business Copy
Copy #1
Primary VOLs
On-line application
data
Snapshots
LAN
LAN
Data backup srv #1
Data backup srv #2
Copy #2
COMPAQ
StorageWorks MSL 5026
Direct Attach
COMPAQ
StorageWorks MSL 5026
Copy 4 & 4'
Disk volumes
Fast recovery
copy
COMPAQ
StorageWorks MSL 5026
Remote
DC
Daily data vaulting:
Two identical copies
on removable media
Copy #3
© Корпорация EMC, 2012 г. Все права защищены.
12
Выделенный ИТ Архитектор
Работа над планомерном снижением рисков
незапланированного простоя в инфраструктуре
(disaster avoidance)
Обладает экспертизой в смежных областях,
включая области сопряжения технологий
различных вендоров
Экспертиза проектов (снижение проектных
рисков)
Взаимодействие с архитекторами Банка
© Корпорация EMC, 2012 г. Все права защищены.
13
Основная БД
ИБС
1
• Функции,
задействованные в
сквозном бизнеспроцессе.
• Здесь «функция» =
«информационная
система».
© Корпорация EMC, 2012 г. Все права защищены.
2
3
-
Core: Гл. Книга, Шлюз ВТС, …
.
Core Banking: МБР, Отчетность, РКО, …
4
Securities: Core
Депозитарий,
Дов. Упр.
5
Securities: Front-,
Back- Office
Retail
Loans
14
Разработка карт первичного
реагирования и диагностики – резюме
1.1.1.
• Карты особенно удобны для использования
при аварийном восстановлении:
– Простой и понятный формат;
– Наглядные диаграммы для типовых действий;
– Примеры системных команд.
• Гарант успешного реагирования на сбои.
Отказ процессорной ячейки (Cell)
Система
Событие
Способ обнаружения
Сервер SuperDome SD01 и SD02
Отказ ячейки (cell)
Временное отсутствие связи с сервером;
Временное отсутствие возможности
интерактивного взаимодействия (telnet, ssh,
MP>CO);
Временное прекращение работы приложения;
Сообщения от системы наблюдения за состоянием
комплекса;
Сообщения от пользователей системы;
Индикатор “Attention” на двери центрального
шкафа;
Индикатор “Cell Power” на Cell power board;
Индикатор “HB” (Heart Beat) на Cell power board;
Вывод команды mstm
1.1.1.
Отказ платы PCI
Вывод команды cfg2html
Вывод команды ioscan
Система
Сервер SuperDome
SD01 и SD02
MP>VFP>Partition#
Событие
Отказ платы PCI.MP>SL>SEL
Индикатор
“Attention” на двери центрального
Способ обнаружения
MP>CM>PS>B
шкафа;
MP>CM>PS>C>Cell#
Индикатор
на плате PCI; CELL
EFI>SHELL>INFO
Вывод команды
mstm
Автоматическое
открытие заявки через RSP.
команды cfg2html
Оценка влияния на Вывод
Неисправность
уровня 1.
команды
ioscan
бизнес-приложение Вывод
При отказе
процессорной
ячейки (cell) происходит
MP>SL>SEL
перегрузка раздела.
Входящее
сообщение
–q
Влияние на другие HP-UX>olrad
После перезагрузки,
раздел продолжает функционировать
–fn количеством процессорных ячеек (cells).
компоненты данной HP-UX>ioscan
с уменьшенным
EFI>SHELL>reconnect -r
системы
Способ устранения EFI>SHELL>devices
Ремонт процессорной ячейки (cell).
Требуется останов EFI>SHELL>io
Нет.
Автоматическое
открытие заявки через RSP.
сервиса для
Системы автоматизированного
Монитор доступности БИС /
Источник?
мониторинга оборудования
сообщения пользователей
устранения
Оценка влияния
на проблемы?
Неисправность
уровня 3.
бизнес-приложение
Исполнитель Отказ платы
HP,PCI
партнёры.
ведет к снижению производительности
восстановительных
подключения сервера к одной из сетей, также возможна
Отказ критический для
работ
потеря
путей до загрузочных дисков.
сервиса?
Проверка состояния селлов через MP CLI,
Влияние наКонтроль
другие успешности
При отказе платы
PCI устройства,
подключенные
только
команды
MP>CM>PS>B
и MP>CM>PS>C>Cell#
восстановительных
компоненты данной
через неисправную
плату,команды
становятся
Нет
Результат
EFIнедоступны.
CLI, efi>shell>info cell с Да
работ
системы
нужным количеством ячеек (cells). Да
Способ устранения
Замена
карты PCI.
Результат команды
parstatus с нужным
Снижение
Да
надежности?
количеством ячеек (cells) в разделе
Требуется останов
Нет.
сервиса для
устранения проблемы?
Исполнитель
восстановительных
работ
Контроль успешности
восстановительных
работ
Сбор данных для
анализа
Регистрация события
© Корпорация EMC, 2012 г. Все права защищены.
Сервис
доступен?
Нет
Нет
HP, партнеры.
4
3
2
1
HP-UX>ioscan –fn
HP-UX>olrad –q
Сбор log-ов с MP, команда MP>SL>FPL>k>d. Отсылка
log-ов в HP.
Регистрация произошедшего события во внутренних
системах учета и контроля Заказчика.
15
Эффект от программы
Повышение производительность труда
– ИТ подразделение
– Функциональные подразделения
Снижение аварийности (на 48%)
Повышение доступности
Снижение проектных рисков
Успешное прохождение Банком аудита системы
BCM
© Корпорация EMC, 2012 г. Все права защищены.
16
Портфель услуг ЕМС
BIA, CoD
Анализ ИТ рисков
BCDR и DRP
Резидентные сервисы
© Корпорация EMC, 2012 г. Все права защищены.
17