Transcript link

CONTENUTI DEL CORSO
Metodi Quantitativi come Strumenti di supporto alle
decisioni nel Marketing
•
Contenuti del corso:
• Data Mining: Introduzione a SAS EM
•
I modelli predittivi:
•
Gli Alberi Decisionali
•
La Regressione
•
Le Reti Neurali
•
Criteri di scelta del Modello
•
Generalizzazione dei risultati
Particolare enfasi sugli aspetti operativi piuttosto che teorici ….
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
0
CONTENUTI DEL CORSO
Modalità Esame
•
Frequentanti: nel corso delle lezioni verranno svolte alcune esercitazioni,
nell’ultima lezione si svolgerà un’esercitazione congiunta in aula
Registrazione in occasione delle date prefissate
•
Non Frequentanti: esame orale nelle date prefissate.
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
1
CONTENUTI DEL CORSO
Certified Predictive Modeler Using SAS Enterprise Miner
•
•
•
•
•
•
•
Riservata ai Frequentanti con esito all’esame >= 27/30
Si svolgerà presso il SAS Institute di Milano, via Darwin (definire data Giugno o
Settembre)
2 incontri integrativi di esercitazione in SAS (definire date il lunedì o il venerdì)
Conoscenza dell’inglese scritto: il test è condotto in inglese su computer
collegati alla sede SAS di Cary (USA)
Conoscenza pregressa, non superficiale, di Enterprise Miner di SAS
Conoscenza dei modelli statistici utilizzati nel Data Mining.
Materiale di supporto:
•
•
•
Slide del corso
Manuale in pdf
Accedere al corso ed all’utilizzo di SAS On demand : vedi file ISTRUZIONI DI
INSTALLAZIONE E UTILIZZO SODA - Studenti – LIUC.pdf
Tutti coloro che otterranno la certificazione SAS , avranno la possibilità di effettuare colloqui, essere
costantemente informati sulle opportunità presso SAS o, clienti e Partner SAS, oltre che a figurare
nell’elenco pubblico di coloro che hanno ottenuto la certificazione SAS
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
2
INDICE DELL’INCONTRO
Contestualizziamo ……
Il SISTEMA INFORMATIVO DI MARKETING “..è una struttura
integrata ed interagente di persone, attrezzature e procedure
finalizzata a raccogliere, classificare, analizzare, valutare e distribuire
informazioni pertinenti, tempestive ed accurate nella prospettiva del
management impegnato nei processi decisionali”
…. offre sostegno ai processi di decision-making, che vengono
attivati, in presenza di condizioni ambientali e competitive
caratterizzate da elevata incertezza
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
3
IL DATA MINING
Estrazione complessa di informazioni implicite,
precedentemente sconosciute e potenzialmente utili dai dati
Esplorazione e analisi, per mezzo di sistemi
automatici e semi-automatici, di grandi quantità
di dati al fine di scoprire pattern significativi
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
4
IL PROCESSO DI DATA MINING
Unipd.it
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
5
APPLICAZIONI
Unipd.it
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
6
I DATI …. breve ripasso ….
I dati sono composti da OGGETTI (record, caso, elemento, osservazione, soggetto ….) descritti attraverso una
serie di ATTRIBUTI (variabili, caratteristiche, ….)
E’ indispensabile conoscere il TIPO di attributo per sapere quale operazione effettuare. Il modo più semplice
consiste nel considerare quale OPERATORE ha senso applicare ai diversi valori che l’attributo può assumere,
così da individuare 4 tipi di attributi cui corrispondono altrettante OPERATORI STATISTICI
 Diversità = 
NOMINALE
MODA - CONNESSIONE
 Ordinamento > <  
ORDINALE
MEDIANA - PERCENTILI
 Additiva + -
INTERVALLO
MEDIA – VARIANZA – CORRELAZIONE
 Moltiplicativa * /
RAPPORTO
MEDIA GEOMETRICA – ARMONICA
Infine possiamo classificare gli ATTRIBUTI anche come
DISCRETO
ha un numero FINITO di modalità
CONTINUO
ha un numero INFINITO di valori
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
7
SAS ENTERPRISE MINER
Si tratta di un’interfaccia “grafica” che permette l’utilizzo delle principali
procedure SAS per il data Mining
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
8
SAS ENTERPRISE MINER
1) Menu bar and shortcut buttons
8) SEMMA & tools palette
2) Project panel
7) Node
3) Properties
panel
6) Process
flow
5) Diagram
workspace
4) Help
panel
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
9
SAMPLE TAB
• Append Unisce dataset derivati da due differenti percorsi
• Data Partition Partiziona il dataset, esempio Traning e Validation
• File Import Importazione file
• Filter Seleziona parte del dataset
• Input Data Creazione di datset attraverso imputazione diretta dei dati
• Merge Unisce osservazioni derivanti da 2 o più dataset
• Sample Campionamento del dataset
• Time Series Converte dati “trasazionali” in serie storiche
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
10
EXPLORER TAB
item che tendono a presentarsi in
• Association Evidenziare
associazione
• Cluster Algoritmi di Cluster Analysis
• DMDB DataMining DataBase, statistiche riassuntive
• Graph Explore Creazione di grafici
• Market Basket Identifica le regole di associazione
• Multiplot Analisi grafica per Database molto grandi
• Path Analysis Analisi Web Log Data o analisi di sequenze
• SOM/Kohonen Particolare Algoritmo di Cluster Analysis
• StatExplore Analisi esplorativa delle variabili
• Variable Clustering Selezione delle variabili (collinearietà)
• Variable Selection Selezione variabili in funzione della rilevanza
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
11
MODIFY TAB
• Drop Esclusione di variabili dal datset creato
• Impute Sostituzione e gestione valori missing
• Interactive Binning Strumento interattivo di categorizzazione
• Principal Components Riduzione delle variabili
• Replacement Riassegnare o consolidare variabili categoria
• Rules Builder Creazione di regole in base a prob. a priori
le variabili per aumentarne
• Transform Variables Trasformare
l’efficacia predittiva
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
12
MODEL TAB
• AutoNeural Configurazione automatica di rete neurale
• Decision Tree Modelli ad Albero
• Dmine Regression Regressione con dipendente binaria
• DMNeural Modelli non Lineari
• Ensemble Integra i risultati derivanti da più modelli
• Gradient Boosting
• Least Angle Regression Selezione delle variabili e fitting
la classificazione di oggetti basandosi sulle caratteristiche
• MBR per
degli oggetti vicini a quello considerato
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
13
MODEL TAB
• Model Import Importare modelli creati non in SAS EM
• Neural Network Creazione di Reti Neurali
• Partial Least Squares Modelli Regressivi con predittori correlati
• Regression Creazione di Modelli Regressivi
• Rule Induction Eventi rari
variabili taget discrete e continue: esempio compra
• Two Stage Con
Non compra e quanto compra
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
14
ASSESS TAB
• Cutoff Minimizzazione falsi negativi/positivi
• Decisions
• Model ComparisonComparazione tra più modelli
• Score Gestione del codice di scoring ottenuto
• Segment Profile Analisi dei segmenti individuati
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
15
UTILITY TAB
• Control Point
• End Groups
• Ext Demo
• Metadata Modifica colonne metadati
• Reporter
• SAS Code Inserire un codice Sas
• Start Groups
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
16
Quiz
I nodi appartenenti al tab ‘Sample’ modificano il numero delle colonne dei
dati mentre quelli del tab ‘Modify’ cambiano il numero delle righe.
 Vero
 Falso
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
17
Quiz – Risposta corretta
I nodi appartenenti al tab ‘Sample’ modificano il numero delle colonne dei
dati mentre quelli del tab ‘Modify’ cambiano il numero delle righe.
 Vero
 Falso
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
18
SVILUPPO DI UN PROGETTO CON SAS EM
Select cases
Extract input data
Validate input data
Analytic workflow
Define analytic objective
Repair input data
Transform input data
Apply analysis
Generate deployment methods
Integrate deployment
Gather results
Assess observed results
Refine analytic objective
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
19
Come creare un progetto in SAS EM
Projects
Libraries
and
Diagrams
Process
Flows
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
Nodes
20
Come creare un progetto in SAS EM
Projects
Libraries
and
Diagrams
Process
Flows
Nodes
ASSEGNARE E
CONFERMARE
NOME E
“PERCORSO”
Projects
Libraries
and
Diagrams
Process
Flows
Nodes
Projects
Libraries
and
Diagrams
Process
Flows
Nodes
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
21
I ruoli del dataset di origine
I dataset di origine sono collocati nel riquadro di progetto. Quando un dataset è selezionato, nel
riquadro delle Proprietà sono mostrate le relative proprietà tra cui il ‘Ruolo’ del dataset.
Il ruolo di un dataset determina il modo in cui il medesimo dataset verrà utilizzato in tutto il
diagramma di flusso di processo.
I ruoli selezionabili sono:
Dati Grezzi (Raw -Default) — utilizzato per assegnare dati di input standard ad un nodo.
Training (Train) — utilizzato per eseguire i modelli iniziali.
Validazione (Validate) — utilizzato di default per confrontare ed implementare il fine-tuning dei
modelli su una seconda partizione del dataset di input
Test — utilizzato per effettuare un controllo finale e non distorto della performance del modello
calibrato nei dataset di training e di validazione.
Score — utilizzato per applicare il modello definitivo su un nuovo dataset.
Transazione— utilizzato nei nodi di Serie Storiche e di Path Analisys.
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
22
I ruoli delle variabili
I ruoli delle variabili definiscono il modo in cui le variabili verranno utilizzate nel processo di
modellizzazione.
Per cambiare tali ruoli occorre selezionare un valore nel menù a tendina ‘Ruolo’ all’interno della tabella
delle variabili.
I principali ruoli selezionabili sono:
Classificazione — è generato automaticamente da un nodo di modellizzazione e contiene la
predizione relativa ad una variabile target categorica.
ID— indicatore che identifica ogni singola osservazione. Viene automaticamente esclusa nei modelli.
Input — identifica i predittori per una variabile target (variabile indipendente).
Etichetta (Label) — rappresenta le etichette delle variabili.
Previsione (Prediction) — contiene i valori stimati del target.
Rifiutata (Rejected) — variabile esclusa dall’analisi. In caso in cui una variabile risultasse non
importante, il ruolo di ‘Rifiutata’ la escluderebbe dall’analisi.
Residuo — variabile che contiene i residui.
Segmento — identifica i segmenti generati dal nodo di Cluster o di Text Mining.
Sequence — rappresenta l’ID temporale del nodo ‘Associazioni’
Target — variabile dipendente o variabile di risposta.
Time ID — è la variabile che contiene l’identificatore di tempo. In genere è un formato SAS date, time
o datetime ed è indispensabile nel nodo di Serie Storiche.
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
23
I livelli di misurazione delle variabili
I livelli di misurazione delle variabili determinano la tipologia di strumenti di trattamento
variabili e di Data Mining che verranno utilizzati. Per cambiare tali livelli occorre selezionare un
valore nel menù a tendina ‘Livello’ all’interno della tabella delle variabili.
I livelli selezionabili sono:
Binario — contiene due valori discreti (ad esempio, Acquisto: Sì, No).
Continuo (Interval) — contiene valori che variano all’interno di un range di valori continui range
(ad esempio, età: 1, 32, 34, 36, 50, 56, 80, ...., 90).
Nominale — contiene un numero discreto di valori senza un ordine logico (ad esempio, Partito:
Democratico, Repubblicano, altro ).
Ordinale — contiene un numero discreto di valori con un ordine logico (ad esempio, Votazione: A,
B, C, D, F).
Unario — contiene un unico valore discreto.
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
24
Quiz
Un dataset di origine in SAS Enterprise Miner differisce da un file di dati
grezzo per i metadati generati relativi al dataset di origine. Quali metadati
vengono creati?
a.
Ruoli delle variabili
b.
Livelli di misurazione
c.
Ruolo del dataset
d.
Tutti i metadati sopra
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
25
Quiz
Un dataset di origine in SAS Enterprise Miner differisce da un file di dati
grezzo per i metadati generati relativi al dataset di origine. Quali metadati
vengono creati?
a.
Ruoli delle variabili
b.
Livelli di misurazione
c.
Ruolo del dataset
d.
Tutti i metadati sopra
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
26
Demo Charity Direct Mail
Obiettivo di analisi:
Un organizzazione di veterani è alla ricerca di contributi continuativi da donatori
discontinui.
Occorre osservare il comportamento dei donatori discontinui rispetto a
campagne di sollecito alla donazione per predire il loro comportamento futuro.
Note:
Sollecitando soltanto i donatori più probabili permetterebbe di limitare i costi di
sollecito.
L’organizzazione ha nel proprio database 3.5 milioni di donatori classificati in base
alla rispondenza a campagne di sollecito.
La classe dei donatori discontinui ha effettuato la loro più recente donazione tra i
12 e i 24 mesi fa.
L’organizzazione necessita di effettuare un ranking dei donatori discontinui basato
sulla rispondenza alla campagna di sollecito effettuata l’anno scorso al fine di
selezionare chi sollecitare o ignorare nella successiva campagna.
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
...
27
Demo Charity Direct Mail
Caratteristiche dei dati:

Estrazione relativa ai dati della campagna precedente

Tasso di risposta osservato uguale a circa 5%

Campione bilanciato tra rispondenti e non
Step del processo di creazione del ranking:

Specificazione del dataset di origine

Setting dei metadati delle colonne

Finalizzazione delle specifiche del dataset di origine
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
...
28
Come creare un progetto in SAS EM: inserire dati
Selezionare la fonte dei dati
Selezionare il file “pva97nk.sas7bdat”, si tratta di una file di donatori
rispetto al quale si vuole approfondire la propensione ad aderire a
determinate campagne
Qualificare le colonne del Metadata
Analizzare il ruolo di ciascuna variabile
Definire la scala di misurazione di ciascuna variabile
Ruolo del data sete all’interno del progetto
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
29
Come creare un progetto in SAS EM
①
Il sistema per default assegna il livello di misurazione e la tipologia di
variabile, potrebbero esserci delle discrepanze rispetto alla realtà:
ANALIZZARE IL DATABASE CON L’OPZIONE ADVANCED
③
②
NB: tale opzione NON è attività per default, se la si attiva si
possono lasciare i parametri immutati o cambiarli
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
30
Come creare un progetto in SAS EM
Input
Input
Input
Input
Measurement
Level
Interval
Nominal
Nominal
Binary
Description
Age
Demographic Cluster
Gender
Home Owner
Input
Interval
Median Home Value Region
Input
Input
Input
Input
Interval
Interval
Interval
Interval
Median Income Region
Percent Veterans Region
Gift Amount Average 36 Months
Gift Amount Average All Months
GiftAvgCard36
Input
Interval
Gift Amount Average Card 36 Months
GiftAvgLast
GiftCnt36
GiftCntAll
GiftCntCard36
GiftCntCardAll
GiftTimeFirst
GiftTimeLast
ID
PromCnt12
PromCnt36
PromCntAll
PromCntCard12
PromCntCard36
PromCntCardAll
StatusCat96NK
StatusCatStarAll
TARGET_B
TARGET_D
Input
Input
Input
Input
Input
Input
Input
ID
Input
Input
Input
Input
Input
Input
Input
Input
Target
Rejected
Interval
Interval
Interval
Interval
Interval
Interval
Interval
Nominal
Interval
Interval
Interval
Interval
Interval
Interval
Nominal
Binary
Binary
Interval
Gift Amount Last
Gift Count 36 Months
Gift Count All Months
Gift Count Card 36 Months
Gift Count Card All Months
Time Since First Gift
Time Since Last Gift
Control Number
Promotion Count 12 Months
Promotion Count 36 Months
Promotion Count All Months
Promotion Count Card 12 Months
Promotion Count Card 36 Months
Promotion Count Card All Months
Status Category 96NK
Status Category Star All Months
Target Gift Flag
Target Gift Amount
Name
DemAge
DemCluster
DemGender
DemHomeOwner
DemMedHomeValu
e
DemMedIncome
DemPctVeterans
GiftAvg36
GiftAvgAll
Model
Role
Troppi valori
diversi
Troppo
pochi
valori
diversi
Prima di modificare manualmente ciascuna variabile è possibile
modificare Advanced Advisor Options
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
31
Come creare un progetto in SAS EM
Per default:
 Rifiutate le variabili con oltre 50% di missing
 Definisce come variabili Nominali con meno di
20 modalità
 Rifiuta le variabili categoria con più di 20
modalità
Il database che consideriamo ha diverse variabili
discrete con meno di 20 modalità ma che NON
devono essere definite come Nominali
1) Solo le variabili numeriche binarie verranno
considerate variabili categoria
2) Solo le variabili categoria con più di 100 modalità
verranno rifiutate
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
32
Come creare un progetto in SAS EM
①
②
1) Solo le variabili numeriche binarie verranno
considerate variabili categoria
2) Solo le variabili categoria con più di 100 modalità
verranno rifiutate
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
33
Come creare un progetto in SAS EM
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
34
Come creare un progetto in SAS EM
Per la nostra analisi la variabile target è solo il
TARGET_B quindi “rejected” la variabile TARGET_D
Si tratta della fase più time consuming del processo ma nello stesso tempo la più
critica:
a) Includere solo le variabili che si intende utilizzare nel processo di modellazione
rispetto a tutte quelle disponibili nel database
b) Per le variabili che non sono semplicemente di Input, utilizzare nomi di variabili
che iniziano con il ruolo previsto. Ad esempio, una variabile ID dovrebbe iniziare
con ID e una variabile obiettivo dovrebbe iniziare con obiettivo.
c) Variabili Input che devono avere un livello di misurazione Nominale dovrebbero
avere un tipo di dati Carattere.
d) Variabili Input che devono essere Intervalli devono avere un tipo di dati Numerico.
e) Personalizzare il Metadata Advisor fissando un Conteggio di Classe Livello uguale a
2 (solo variabili numeriche binarie verranno considerate variabili categoria) e
Livelli di Scarto posti uguali al numero maggiore della modalità massima
(conteggio livello) delle vostre variabili Input nominali (nel nostro caso 100)
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
35
Come creare un progetto in SAS EM
Si proceda con la fase successiva, in questo caso è
opportuno NON selezionare SI, opzione attraverso la
quale sarebbe possibile immettere informazioni sul
costo o sul profitto di ogni possibile decisione,
probabilità a priori e funzione di costo.
Riprenderemo tale aspetto più avanti, infatti è possibile
modificare tali informazioni anche attraverso il pannello
delle caratteristiche del nodo
Analogamente NON si definisca un campione delle
osservazioni
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
36
Come creare un progetto in SAS EM
Infine è possibile personalizzare con nomi e note le caratteristiche del database
Al termine vengono riassunte le principali caratteristiche del file
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
37
Esplorare il database
Il modo più semplice per analizzare il file è evidenziarlo
e con il tasto destro del mouse selezionare Explore
Vengono riassunte le principali statistiche
e mostrate 2.000 osservazioni casuali del
file
E’ possibile modificare l’ampiezza del
campione
L’ampiezza del campione è possibile
modificarla anche dal menù principale:
Options, Prefereces
NB:E’ necessario modificare il codice di
avvio del progetto per per file >30.000
obs
Comando
%global EM_EXPLOREOBS_MAX;
%let EM_EXPLOREOBS_MAX=50000;
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
38
Esplorare il database
Per un’analisi più approfondita è possibile creare alcuni grafici (Actions  Plot)relativamente alle variabili
inserite nel database, per esempio un istogramma per la variabile DEMAGE o torta per la variabile TARGET
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
39
Esplorare il database
E’ possibile modificare (tasto destro Graph Properties) le caratteristiche del grafico: numero degli
istogrammi, “zummare” sul grafico
Per esempio porre 87
(valore massimo della
variabile Età) il Number of
X Bins
Provare a Zummare
muovendo il mouse dopo
aver cliccato
Select
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
Per ripristinare la scala
40
Esplorare il database
Non tutte le osservazioni sono riportate nell’istogramma
della variabile età, tasto destro Graph Properties,
selezionare Show Missing Bin
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
41
Esplorare il database
E’ possibile affiancare
tutte le informazioni
relative al database,
informazioni che sono
tra loro
INTERCONNESSE
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
42
Modificare database
Proviamo
a
necessità
di
variazioni
considerare
operare
sulla
la
delle
variabile
DemMedIncome, in particolare
vogliamo specificare che valori
inferiori
a
1
devono
essere
considerati missing
Modify 
Replacement(Sostituzione)
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
43
Modificare database
Il nodo prevede come opzioni:
 Quali variabili vuoi cambiare
 A quali condizioni
 Quali sono i nuovi
(Replacement Value)
valori
Il nodo Replacement per default
modifica
i
valori
delle
variabili
continue che sono oltre 3 volte la
standard deviation dalla media,
volendo
condizione
personalizzare
porremo
tale
Default
Limits Method a None
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
44
Modificare database
Consideriamo le proprietà del nodo Replacement, operando su una variabile continua dobbiamo
porre
1) Specificare quali valori assegniamo alla sostituzione, Replacement Value, nel nostro caso valore
missing
2) Indicare su quale variabile vogliamo operare Replacement Editor (delle variabili continue)
3) Selezionare la variabile
1
2
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
3
45
Modificare database
 Generare riepilogo delle variabili per «leggere» i dati dal DB
 Porre il limite inferiore (nel nostro caso =1)
 Applicare il filtro
 La parte in giallo è quella che NON subirà modifiche
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
46
Modificare database
Eseguire il nodo e verificare i
risultati da cui si evidenzia che sono
state effettuate 2.357 modifiche
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
47
Modificare database
Si analizzi ora il database modificato (Exported data nelle proprietà del nodo REPLACEMENT)
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
48
Modificare database
Scorendo a destra il la tabella dei dati si evidenzia una nuova colonna Replacement:
DemMedIncome, che differisce da DemMedIncome per le osservazioni minori di 1 che risultano
a Missing
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
49
Modificare database
Proviamo a inserire un nuovo diagramma. Inseriamo un nodo di Statistiche Esplorative ed
eseguiamolo solo con riferimento alla variabile GiftTimeLast, otteniamo media=18.00217 e
std=4.073549. Se inseriamo un nodo Sostituzione e lo eseguiamo con tutte le opzioni a default
cosa succede alle osservazioni della variabile GiftTimeLast?
Metodi Quantitativi per il Marketing – Anno Accademico 2014-2015 LIUC
50