Last ned presentasjonen

Download Report

Transcript Last ned presentasjonen

Det enkle er
ofte
det beste
Arne Sødal
Fagansvarlig
[email protected]
Nortura - Norges ledende
merkevareleverandør innen kjøtt og egg.
• Garanterer et mangfold av kvalitetsprodukter med likeverdige tilbud i hele
landet.
• Omsetter for ca 17 milliarder kroner.
• 5 100 årsverk innen ulik industrivirksomhet i 34 kommuner over hele landet.
• Organisert som et samvirke
• Eies av 17 800 norske bønder.
Norge rundt med Nortura!
Nøkkeltall 2010
Hovedkontor
•
Ca. 17 milliarder kroner i
årsomsetning
•
Lanserte 128 nye produkter
til norske forbrukere
•
Årsproduksjon på nesten
223 000 tonn slakt og
39 000 tonn egg
•
Industrivirksomhet i 34
kommuner og 15 fylker
•
5 790 årsverk
•
Eid av 17 800 bønder
organisert i et samvirke
Norge rundt med Matiq!
Nøkkeltall
Trondheim
Hovedkontor
•
Ca. 220 millioner kroner i
årsomsetning
•
Leverer årlig 100 – 110.000
prosjekttimer til Nortura
•
Årsproduksjon på over
100 prosjekter
•
God innsikt i Norturas
verdiskapende prosesser
•
88 medarbeidere
•
100% eid av Nortura
Bakgrunn AIX / Oracle (for 4 år siden)
1. Dagens situasjon
- hvor står vi i dag?
• Kartlegging
• Rutiner / dokumentasjon?
• Tilgjengeligheten til tjenestene (HA)?
• Katastrofeløsning (DR)?
• Krav til maximum nedetid ved feil (RTO)
• Krav til minimum datatap ved feil (RPO)
Bakgrunn AIX / Oracle (for 4 år siden)
2. Ambisjoner
• Avbruddsfri drift
• HA/DR - RPO/RTO
• Gjør ting mye enklere
- hvor vil vi i fremtiden?
Bakgrunn AIX / Oracle (for 4 år siden)
3. Tiltaksliste
• Masse arbeid
• Masse tid
• Investeringer
- hvordan kommer vi oss dit?
Bakgrunn AIX / Oracle (for 4 år siden)
4. Erfaringer i dag
- bekreftelse på suksess?
HA – High Availability
• Når komponenter i IT infrastrukturen feiler / stopper
• enten planlagt eller ikke planlagt
• HW eller SW
• Tjenesten for brukere vil ikke bli berørt
• eller blir berørt i liten grad
• HA ivaretas innad i ett datasenter
DR – Disaster Recovery
• Stort utfall som berører flere eller alle komponenter på en lokasjon
(mer enn bare IT)
• All IT-tjeneste er utilgjengelig
• Oppstart / recovery i datasenter 2
• Management nivå
• IT-tjeneste tilgjengelig i løpet av timer / dager
• Må påregne tap av data
• DR ivaretas mellom 2 datasenter
RPO
•
RPO – Recovery Point Objective
• Mengde data / transaksjonslogger som virksomhet tåler å
tape
• Virksomheten må bestemme RPO-verdien – ikke
teknologien
RTO
• RTO – Recovery Time Objective
• Tiden det tar før brukere kan jobbe igjen etter stopp av ITtjenesten
• Eksempel 30 minutter: Tjenesten kan være nede i max 30
minutter uten alvorlig omfang for virksomheten
• Virksomheten må bestemme RTO-verdien – ikke teknologien
1. Dagens situasjon – hvor står vi i dag?
• Kartlegging
• HA
• Komplekse tilpasninger
• Fungerte ikke
• DR
• Komplekse tilpasninger
• Ingen / ufullstendig / ikke testet
• Mangel på øvelser
• RPO
• Minimum datatap
• Økonomisk konsekvens i etterkant
• RTO
• Minimum nedetid
• Økonomisk konsekvens i etterkant
Building Cluster Systems
WTS 1 - 60
APS 1 – file01
AOS [1 - 10 ]
Batch [1 - 10 ]
Interconnect
Oracle Instance 1
BATCH
+ Appl app (/u03)
Interconnect
Oracle Instance 2
USERS
Interconnect
Oracle Instance 3
USERS
Oracle
Database
Oracle Instance 4
USERS
Reorganisering SAN-disker
BSIS1
BSFO1
FSFO1
FSIS1
GVFO1
NNFO1
NKFO1
FSIS1
GVFO2
•
•
•
•
•
28 databaser
40 SAN-LUN’s
4427 databasefiler
Utvider der det plass…
Logisk feil på 1 SAN-LUN kunne ødelegge 16 databaser…
2. Ambisjoner – hvor vil vi i fremtiden?
• Business needs vs costs and complexity
• RPO = no data loss – eller så nære 0 som mulig
• RTO = så liten som mulig
• Avbruddsfri drift med enkle prinsipper
•
•
•
•
•
•
•
•
•
Færrest mulige enheter – vertikal vs. horisontal
Synkron speiling innad i datasenter
Kopiering/replikering mellom datasenter
Tjenester skal være tilgjengelige dersom utfall av ett
datasenter
Tilstrekkelig kapasitet i ett datasenter
Redundans i komponenter innad i datasenter
Teknisk vedlikehold kan utføres utenfor servicevindu
HA innad i datasenter
DR på tvers av datasenter
• Gjenbruk av tankemåter, kompetanse og prinsipp
• Keep it simple
3. Tiltak – hvordan kommer vi oss dit?
• Avbruddsfri drift med enkle prinsipper
• Design
• Masse planlegging
• RPO - forretningens forventninger
• RTO – forretningens forventninger
• Masse tid og arbeid
• Fokus
• Investeringer
• Støtte i forretningen
• Felles tankesett i alle fagområder
• Stol på HW
• Stol på SW
• Hold graden av kompleksitet nede
• Lag enkle prosedyrer for DR
Tiltak AIX / Oracle
•
•
•
•
•
•
•
2 uker dimensjonering
3 ukers levering
1 uke montering
1 uke kabling
1 uke partisjonering
1 uke dokumentering
Opplæring
• Rutiner
• Prosedyrer
• Keep it simple
• 4 uker migrering
• Max nedetid mindre enn ett døgn for
det største miljøet under migrering
• Export 9 timer
• Import 5 timer
fra mange små til 2 store
Oracle Dataguard
Oracle10
Read-Only
Oracle 11
LAN
p595
Apply Lag=0-2sek
Maximum Performance
Async Log Ship
p595
failover/switchover 11G
Apply Lag=0-15sek
Maximum Performance
Async Log Ship
failover/switchover 10G
SAN
DS8300
DS8300
Oracle failover
Oracle10
Read-Only
Oracle 11
LAN
p595
p595
ALTER DATABASE
COMMIT TO
SWITCHOVER TO
PRIMARY
5 MIN PR DATABASE
Recovery Time Objective=5min
Recovery Point Objective=max 2sek
ALTER DATABASE
COMMIT TO
SWITCHOVER TO
PRIMARY
SAN
DS8300
DS8300
Oracle switchover
Oracle10
Read-Only
Oracle11
LAN
p595
p595
ALTER DATABASE
COMMIT TO
SWITCHOVER TO
PRIMARY
ALTER DATABASE
COMMIT TO
SWITCHOVER TO
PHYSICAL
STANDBY
7 MIN PR DATABASE
ALTER DATABASE
COMMIT TO
SWITCHOVER TO
PHYSICAL
STANDBY
ALTER DATABASE
COMMIT TO
SWITCHOVER TO
PRIMARY
SAN
DS8300
DS8300
HW migrering 2012
LAN
p770
p595
p595
SAN
DS8300
DS8300
4. Erfaringer i dag
• Standardisering og gjenbruk
• Samme teknologi
•
•
•
•
•
•
•
•
…men forskjellige skaleringer
Enklere administrasjon
Sentral administrasjon
Klare og enkle prosedyrer ved failover
Forenklet hverdag for IT-ansatte
Fra reaktivt til proaktivt arbeid
Stabile tjenester
Reduksjon i management, økning i Infrastruktur
• 3 -> 1,5 AIX
3 -> 1,5 Oracle
• Redusert arbeidsbelastning
• Lavere lisenskost ved konsolidering
• CPU pools
• Samme core cpu lisensiering som før
>5X increase in performance per watt over POWER6+
>10X increase in performance per watt since POWER5+
rPerf per KWatt *
>10 years of changing the server landscape
POWER4 POWER4+ POWER5 POWER5+ POWER6 POWER6+ POWER7 POWER7+
570
p670
Power 570 Power 570 Power 780 Power 780
p670
570
1.9 GHz
1.5 GHz
1.65 GHz
4.7 GHz
4.2 GHz
3.8 GHz
3.7 GHz
1.1 GHz
KWatts: 6.7 KWatts: 6.7 KWatts: 5.2 KWatts: 5.2 KWatts: 5.6 KWatts: 5.6 KWatts: 6.9 KWatts: 7.7
* rPerf values used, CPW would be similar
4. Erfaringer i dag
• Solitaire Interglobal
• 43.000 customer sites running Windows, Linux and AIX
?
Arne Sødal – Matiq – 07/11 2012