Total Solution

Download Report

Transcript Total Solution

Построение процесса
управления
операционными ИТ
рисками
Иван Ермаков
EMC Consulting
Russia & CIS
21 ноября
Минск
© Корпорация EMC, 2012 г. Все права защищены.
1
Содержание
• Роль ИТ в современной финансовой
организации
• Методология управление ИТ рисками на
примере реализованного проекта
• Достигнутые результаты
© Корпорация EMC, 2012 г. Все права защищены.
2
Роль ИТ в современной финансовой
организации
• « … банк это ит- провайдер с банковской
лицензией …»
• Тенденции
• Автоматизация бизнес-процессов
• рост значимости электронных каналов
взаимодействия с клиентами
• быстрое развитие сервисов
самообслуживания
• Развитие Интернет – банков
© Корпорация EMC, 2012 г. Все права защищены.
3
Риск профиль банка
• Риск профиль банка
– Операционные риски – 15 – 30%.
• Эксперты: 30 – 70% операционных рисков приходится
на ИТ риски.
• ИТ риски должны рассматриваться наравне с
остальными видами риска.
• Управление ИТ рисками позволяет достичь значимых
для Бизнеса результатов (рейтинг, страховые тарифы,
резервирование средств)
© Корпорация EMC, 2012 г. Все права защищены.
4
Риски, связанные с ИТ
• Операционные
• Выполнение требований регуляторов
• Финансовые
– Инвестиции в ИТ
© Корпорация EMC, 2012 г. Все права защищены.
5
BIA & IT RA
• Business Impact Analysis
– Понимание влияния и стоимости простоя
информационных систем
– Параметры восстановления – директивный срок и
допустимый диапазон потери данных
• Анализ ИТ рисков
– Сопоставление требований к бизнес-приложениям
и возможностей ИТ инфраструктуры
• Выстроили процесс постоянно контроля ИТ рисков с
участием эксперта ЕМС
© Корпорация EMC, 2012 г. Все права защищены.
6
Стоимость простоя –
На примере сбоя 13 марта 2012 (9:38–10:00)
Потери_доходов +
Потери_от_снижения_произво
дительности_труда +
недополученные_будущие_дох
оды =
598 000 руб. + 350 000 руб. + 1
1 200 000 руб. = 2 193 000 руб.
$ Impact
Общие_потери:
Minutes
© Корпорация EMC, 2012 г. Все права защищены.
Time
Days
7
Анализ технических рисков в ИТ
Обследование инфраструктуры на соответствие требованиям
BCDR)
•На основе BIA предложить требования к архитектуре
технических решений в зависимости от класса
критичности.
•Провести анализ соответствия текущих архитектур
эталонным и выявить расхождения.
Class Application / Application protection Online data protection Offline data protection People backup
system name
(backup)
Processes &
procedures
DC & Infrastructure Vendor support
arrangements
MC
Основная БД
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
CS
MC
Тарификатор
#1
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
MC
Тарификатор
#2
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BC
Тарификатор
#3
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BO
БД системы
Server hw description
Online data protection
Data backup practice & Peolple arrangement
Process arrangement & DC arrangement
None
© Корпорация EMC, 2012 г. Все права защищены.
8
Методология
• Disaster avoidance
– Защита оперативных данных и приложений
• Понимание архитектуры ИТ сервисов
– Контроль изменение и управление проектами
– Взаимоотношение с вендорами и провайдерами
услуг
– Процессу управления ИТ
– ЦОД
• Risk response
– Планы аварийного восстановления
– СРК
© Корпорация EMC, 2012 г. Все права защищены.
9
Пример анализа на наличие единичных
точек отказа (SPOF)
Data Center 01
APP-01
APP-02
APP-03
Data Center 02
Clustered application servers
DB Cluster
FS Node 01
FS Node 02
UID
1
2
3
READY
1
ALARM
POWER
POWER
SUPPLY
SUPPLY
MESSAGE
9
9
7
7
8
8
3
3
4
4
1
1
1
1
3
3
2
2
MIRROR
5
5
HP
ProLiant
DL380 G7
4
1
5
UID
1
POWER
POWER
CAP
CAP
DIMMS
2
2
5
5
4
4
FANS
4
3
4
3
POWER
POWER
SUPPLY
SUPPLY
9
9
2
6
3
7
4
8
99
8
8
1
1
PROC
PROC
2
2
2
1
7
7
6
6
ONLINE
AMP
SPARE
STATUS
2
2
6
6
OVER
OVER
TEMP
TEMP
2
POWER
POWER
SUPPLY
SUPPLY
5
5
6
6
PROC
PROC
FANS
PUSH
77
88
1
1
33
44
3
11
11
33
22
MIRROR
5
5
HP
ProLiant
DL380 G7
4
1
5
POWER
POWER
CAP
CAP
DIMMS
22
55
44
77
66
ONLINE
AMP
SPARE
STATUS
22
6
6
OVER
OVER
TEMP
TEMP
2
POWER
POWER
SUPPLY
SUPPLY
55
66
PROC
PROC
FANS
FANS
4
3
4
3
99
2
6
3
7
4
8
88
11
PROC
PROC
2
2
1
1
HP StorageWorks XP24000 Disk Array
Cabinet Number
HKP
hp StorageWorks
enterprise systems library
48V
hp Integrity Superdome
hp StorageWorks
enterprise systems library
GSP
Remote
Attention
MacroSrv-2
UID
1
2
11
POWER
POWER
SUPPLY
SUPPLY
99
77
88
33
44
SD2
3
11
11
33
22
MIRROR
5
5
HP
ProLiant
DL380 G7
4
1
5
2
6
POWER
POWER
CAP
CAP
DIMMS
22
55
44
77
66
ONLINE
AMP
SPARE
STATUS
2
2
6
6
OVER
OVER
TEMP
TEMP
22
POWER
POWER
SUPPLY
SUPPLY
55
66
PROC
PROC
FANS
FANS
4
3
4
3
99
88
1
1
PROC
PROC
2
2
1
1
3
7
4
8
License
Key
XP24000
Tape backup
Continuous
Access
6 links
32 links
FibreChannel
switches
FibreChannel
switches
12 links
8 links
6 links
SAN
FibreChannel
switches
8 links
Tape backup
Data Center 03
16 links
READY
ALARM
MESSAGE
hp St or ageWor ks xp12000 di sk ar r ay
PUSH
Cabinet Number
Cabinet Number
HKP
HKP
48V
hp Integrity Superdome
GSP
48V
hp Integrity Superdome
GSP
Remote
Remote
Attention
Attention
Class Application / Application protection Online data protection Offline data protection People backup
system name
(backup)
MacroSrv-2
UID
1
2
1
1
POWER
POWER
SUPPLY
SUPPLY
SD0
SD1
XP12000
9
9
7
7
8
8
3
3
4
4
1
1
3
1
1
3
3
2
2
MIRROR
5
5
FANS
4
3
4
3
4
5
5
4
4
7
7
6
6
1
5
2
6
3
7
4
8
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
CS
MC
Тарификатор
#1
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
MC
Тарификатор
#2
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BC
Тарификатор
#3
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
PBS
BO
БД системы
HelpDesk
Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
None
BO
HelpDesk Apps Server hw description
Online data protection
descirption
Data backup practice & Peolple arrangement
arrangement desciprion description
Process arrangement & DC arrangement
culture description
description
нет
HP
ProLiant
DL380 G7
9
9
8
8
1
1
PROC
PROC
2
2
1
1
License
Key
BIS-01
BIS-02
© Корпорация EMC, 2012 г. Все права защищены.
DC & Infrastructure Vendor support
arrangements
Основная БД
POWER
POWER
CAP
CAP
DIMMS
2
2
ONLINE
AMP
SPARE
STATUS
2
2
6
6
OVER
OVER
TEMP
TEMP
2
2
POWER
POWER
SUPPLY
SUPPLY
5
5
6
6
PROC
PROC
FANS
Processes &
procedures
MC
10
Пример целевой архитектуры
© Корпорация EMC, 2012 г. Все права защищены.
11
Пример целевой архитектуры
Primary server
Primary DC
Business Copy
Copy #1
Primary VOLs
On-line application
data
Snapshots
LAN
LAN
Data backup srv #1
Data backup srv #2
Copy #2
COMPAQ
StorageWorks MSL 5026
Direct Attach
COMPAQ
StorageWorks MSL 5026
Copy 4 & 4'
Disk volumes
Fast recovery
copy
COMPAQ
StorageWorks MSL 5026
Remote
DC
Daily data vaulting:
Two identical copies
on removable media
Copy #3
© Корпорация EMC, 2012 г. Все права защищены.
12
Выделенный ИТ Архитектор
 Работа над планомерном снижением рисков
незапланированного простоя в инфраструктуре
(disaster avoidance)
 Обладает экспертизой в смежных областях,
включая области сопряжения технологий
различных вендоров
 Экспертиза проектов (снижение проектных
рисков)
 Взаимодействие с архитекторами Банка
© Корпорация EMC, 2012 г. Все права защищены.
13
Основная БД
ИБС
1
• Функции,
задействованные в
сквозном бизнеспроцессе.
• Здесь «функция» =
«информационная
система».
© Корпорация EMC, 2012 г. Все права защищены.
2
3
-
Core: Гл. Книга, Шлюз ВТС, …
.
Core Banking: МБР, Отчетность, РКО, …
4
Securities: Core
Депозитарий,
Дов. Упр.
5
Securities: Front-,
Back- Office
Retail
Loans
14
Разработка карт первичного
реагирования и диагностики – резюме
1.1.1.
• Карты особенно удобны для использования
при аварийном восстановлении:
– Простой и понятный формат;
– Наглядные диаграммы для типовых действий;
– Примеры системных команд.
• Гарант успешного реагирования на сбои.
Отказ процессорной ячейки (Cell)
Система
Событие
Способ обнаружения
Сервер SuperDome SD01 и SD02
Отказ ячейки (cell)
 Временное отсутствие связи с сервером;
 Временное отсутствие возможности
интерактивного взаимодействия (telnet, ssh,
MP>CO);
 Временное прекращение работы приложения;
 Сообщения от системы наблюдения за состоянием
комплекса;
 Сообщения от пользователей системы;
 Индикатор “Attention” на двери центрального
шкафа;
 Индикатор “Cell Power” на Cell power board;
 Индикатор “HB” (Heart Beat) на Cell power board;
 Вывод команды mstm
1.1.1.
Отказ платы PCI
 Вывод команды cfg2html
 Вывод команды ioscan
Система
Сервер SuperDome
SD01 и SD02
 MP>VFP>Partition#
Событие
Отказ платы PCI.MP>SL>SEL
 Индикатор
“Attention” на двери центрального
Способ обнаружения
 MP>CM>PS>B
шкафа;
 MP>CM>PS>C>Cell#
 Индикатор
на плате PCI; CELL
 EFI>SHELL>INFO
 Вывод команды
mstm
Автоматическое
открытие заявки через RSP.
команды cfg2html
Оценка влияния на Вывод
Неисправность
уровня 1.
команды
ioscan
бизнес-приложение Вывод
При отказе
процессорной
ячейки (cell) происходит
 MP>SL>SEL
перегрузка раздела.
Входящее
сообщение
–q
Влияние на другие  HP-UX>olrad
После перезагрузки,
раздел продолжает функционировать
–fn количеством процессорных ячеек (cells).
компоненты данной HP-UX>ioscan
с уменьшенным
 EFI>SHELL>reconnect -r
системы
Способ устранения EFI>SHELL>devices
Ремонт процессорной ячейки (cell).
Требуется останов  EFI>SHELL>io
Нет.
 Автоматическое
открытие заявки через RSP.
сервиса для
Системы автоматизированного
Монитор доступности БИС /
Источник?
мониторинга оборудования
сообщения пользователей
устранения
Оценка влияния
на проблемы?
Неисправность
уровня 3.
бизнес-приложение
Исполнитель Отказ платы
HP,PCI
партнёры.
ведет к снижению производительности
восстановительных
подключения сервера к одной из сетей, также возможна
Отказ критический для
работ
потеря
путей до загрузочных дисков.
сервиса?
 Проверка состояния селлов через MP CLI,
Влияние наКонтроль
другие успешности
При отказе платы
PCI устройства,
подключенные
только
команды
MP>CM>PS>B
и MP>CM>PS>C>Cell#
восстановительных
компоненты данной
через неисправную
плату,команды
становятся
Нет
 Результат
EFIнедоступны.
CLI, efi>shell>info cell с Да
работ
системы
нужным количеством ячеек (cells). Да
Способ устранения
Замена
карты PCI.
Результат команды
parstatus с нужным
Снижение
Да
надежности?
количеством ячеек (cells) в разделе
Требуется останов
Нет.
сервиса для
устранения проблемы?
Исполнитель
восстановительных
работ
Контроль успешности
восстановительных
работ
Сбор данных для
анализа
Регистрация события
© Корпорация EMC, 2012 г. Все права защищены.
Сервис
доступен?
Нет
Нет
HP, партнеры.
4


3
2
1
HP-UX>ioscan –fn
HP-UX>olrad –q
Сбор log-ов с MP, команда MP>SL>FPL>k>d. Отсылка
log-ов в HP.
Регистрация произошедшего события во внутренних
системах учета и контроля Заказчика.
15
Эффект от программы
 Повышение производительность труда
– ИТ подразделение
– Функциональные подразделения
 Снижение аварийности (на 48%)
 Повышение доступности
 Снижение проектных рисков
 Успешное прохождение Банком аудита системы
BCM
© Корпорация EMC, 2012 г. Все права защищены.
16
Портфель услуг ЕМС
 BIA, CoD
 Анализ ИТ рисков
 BCDR и DRP
 Резидентные сервисы
© Корпорация EMC, 2012 г. Все права защищены.
17