Transcript Curs 3
Curs 3
Pregătirea datelor pentru analiză în SAS
1
Procesul de analiză: de la datele de bază la
rezultate
Pregătirea datelor
Surse de date
Modelare analitică
Rezultate şi Acţiuni
Surse de date
diferite
Interclasare,
Denormalizare
Modelare,
Estimarea
parametrilor
Folosirea
rezultatelor
Modele
relaţionale,
Scheme stea
Variabile
derivate
Predicţii,
Clasificări,
Clusteri
Crearea de
profile
Transpuneri,
Agregregări
Disponibilitatea
datelor
2
+
Pregătire
adecvată
Interpretare
+
Modelare
eficientă
=
Rezultate
bune
Sistemele software care procesează date
Sistemele operaţionale
3
Sistemele pentru depozite
de date
Se adresează conducerii
departamentelor funcţionale.
Constituie o bază pentru procesul
decizional de la diferite nivele ale
conducerii.
Conţin date curente, primare
privind tranzacţiile. Corectitudinea
acestor date este foarte
importantă.
Conţine date istorice. Acestea pot
fi disponibile ca atare sau pot fi
create pornind de la fişierele
istorice de log asociate tabelelor.
Au o orientare tranzacţională.
Furnizează date pentru raportare,
monitorizare şi analiză.
Intrări pentru tabela analitică din perspectivă logică
4
Pregătirea datelor
Interogările SAS pot fi folosite pentru:
Selectarea rândurilor pornind de la una sau mai multe
condiţii
Selectarea, ordonarea şi sortarea coloanelor
Definirea de variabile calculate
Joncţiunea tabelelor prin diferite metode
Înlocuirea valorilor datelor
Gruparea şi agregarea datelor
Specificarea unui parametru pentru interogare
5
Instrumentul Query Builder
Query Builder este folosit pentru a extrage date din una sau
mai multe tabele, conform cerinţelor utilizatorului.
6
Query Builder: Select Data
Tab-ul select este folosit pentru a selecta care coloane
sunt incluse şi care vor fi rolurile lor în interogare.
7
Selectarea coloanelor
Implicit, interogarea este goală. Trebuie adăugate coloane în
tab-ul Select Data.
Modificaţi
proprietăţile
unei coloane
8
Filtrarea câmpurilor
Procesul prin care se specifică ce câmpuri să se regăsescă
în interogare.
9
Setările unui filtru
Atunci când o coloană este inclusă în tab-ul Filter Data, se
deschide caseta de dialog New Filter.
Selectaţi
tipul de
comparaţie
Introduceţi
valoarea sau
valorile de
comparat.
10
Editorul de expresii avansate: Funcţii
Descrierea
funcţiei
Selectaţi tipul de
funcţie, funcţia şi
coloanele
11
Editorul de expresii avansate: Operatori
Operator
In a list of values
Between
Is null | Is missing
Sounds like
Contains
Matches pattern
12
Exemplu
judet IN ("DB","IL")
venit BETWEEN 1200 2000
Realizează un test pentru valorile lipsă
nume =* "smith"
găseşte "Smythe", "Smith"
tara contains "US"
găseşte "USA", "RUSIA"
Semnul procent (%) înlocuieşte oricâte caractere.
Semnul underscore (_) înlocuieşte un caracter.
nume like “R_D%"
găseşte “RADULESCU", “RADU", “RODICA"
Editorul de expresii avansate: Date
2) Selectaţi
valorile care
trebuie incluse
în expresii
13
1) Selectaţi o
coloană pentru a
vizualiza valorile.
Combinarea filtrelor
Implicit, filtrele multiple sunt combinate folosind operatorul
AND. Aceste setări pot fi modificate.
14
Calcularea unei noi coloane
Există trei modalităţi de creare a unei coloane calculate
într-o interogare.
Selectaţi metoda
folosită pentru a
calcula coloana
15
Coloane agregate
Efectuarea unei funcţii de agregare pe oricare dintre
coloanele interogrării.
16
Recodificarea unei coloane
Coloana care este
recodificată
17
Specificarea valorilor care se înlocuiesc
Se pot înlocui valori punctuale, domenii de valori sau se
pot specifica condiţii care vor fi transformate în clauze
CASE ale limbajului SQL.
18
Specificarea valorilor care se înlocuiesc
Asignarea
valorii pentru
celelalte
cazuri
Tipul de date
pentru noua
coloană
19
Folosirea noii coloane recodificate
Noua coloană recodificată este automat inclusă în tab-ul
Select Data. Poate fi folosită în crearea de filtre sau
pentru sortarea datelor.
20
Crearea unei coloane calculate
Expresia de
calcul
21
Joncţiunea tabelelor
23
Rândurile care au
corespondent
Tipuri de Joncţiuni
Numai rândurile care au corespondent (implicit în SAS
Enterprise Guide)
A
inner join
Toate rândurile din una sau ambele tabele plus
rândurile care au corespondent
A
B
Toate rândurile din A
left outer join
24
B
A
B
A
B
Toate rândurile din A şi B
Toate rândurile din B
full outer join
right outer join
Fereastra de Joncţiuni
1) Selectaţi JoinTables
pentru a accesa fereastra în
care putem seta joncţiunile
2) Specificaţi modul în care se
leagă tabelele
25
Modificarea tipului de joncţiune
Criteriul de joncţiune poate
fi modificat pentru a include
şi câmpurile care nu au
corespondent.
26
Recapitulare: Numai rândurile care au corespundent
27
Includerea rândurilor fără corespondent
28
Toate rândurile
referitoare la Clienţi
şi Comenzi
Includerea rândurilor fără corespondent
29
Toate rândurile din
tabela Clienţilor
Includerea rândurilor fără corespondent
30
Toate rândurile din
tabela Comenzilor
Izolarea rândurilor care nu au corespondent
Interogarea pote include şi un filtru pentru a izola câmpurile
care nu au corespondent din una sau ambele tabele.
Comenzi plasate de clienţi care nu există în
tabela Clienţilor.
31
Folosirea rezultatelor interogărilor în prelucrări
Tabelele rezultate din
interogări pot folosi ca
surse de date pentru
prelucrări ulterioare.
32
Setarea opţiunilor interogărilor
Selectaţi un tip de
rezultat
33
Formate de rezultate pentru interogări
Format de
rezultat
Caracteristici ale Rezultatele interogării
datelor
Data table
poate fi utilizată în alte - tabelă statică
scopuri
- se pot realiza prelucrări
- rezultatele nu sunt
actualizate
întotdeuna actualizată - viziune dinamică a datelor
- se pot realiza prelucrări
- rezultatele sunt actualizate
formatat pentru
- raport în formatul HTML,
prezentare
PDF, RTF text sau SAS
- rezultatele nu sunt
actualizate
- nu se pot realiza prelucrări
Data view
Raport
34