Aula -Unidade 3 - Faculdade de Matemática

Download Report

Transcript Aula -Unidade 3 - Faculdade de Matemática

UNIVERSIDADE FEDERAL DE UBERLÂNDIA
FACULDADE DE MATEMÁTICA
PROJETO PIBEG
Unidade III
Ajuste de curvas
0011 0010
12
45
Sumário:
1 – Introdução
2 – Quadrados Mínimos (Caso discreto – Modelo linear)
3 – Quadrados Mínimos (Caso discreto – Modelo não linear)
3.1 – Teste de alinhamento
4 – Quadrados Mínimos (Caso contínuo)
0011 0010
12
45
1 – Introdução
0011 0010
12
45
 Em geral, experimentos em laboratório geram um conjunto de
dados que devem ser analisados com o objetivo de determinar
certas propriedades do processo em análise.
14
12
10
8
6
4
2
0
1
1.5
2
2.5
3
3.5
4
4.5
5
 Obter uma função matemática que represente (ou que ajuste)
estes dados, permite fazer simulações do processo, reduzindo
assim repetições de experimentos que podem ter um custo alto.
0011 0010
12
45
 Nesta unidade será estudado uma das técnicas mais utilizadas
para se ajustar dados, conhecida com Método dos Quadrados
Mínimos (MQM).
0011 0010
12
45
2 – Quadrados Mínimos
Caso discreto - Modelo linear
0011 0010
12
45
 Seja uma tabela de pontos (xi, yi), i = 0, 1,..., m, xi  [a, b].
O problema de ajuste de curvas consiste em escolher n funções
g1, g2,..., gn contínuas e linearmente independentes em [a, b] e
obter n constantes a1, a2,...,an tais que:
j(xk) = a1g1(xk) + a2g2(xk) +...+ angn(xk)
seja uma boa aproximação para os pontos y(xk), ou seja, jk ≈ yk.
 Este é um modelo linear porque a função j(x) utilizada no
ajuste dos pontos é linear nos parâmetros aj, embora as funções
gj(x) possam ser não-lineares (ex.: ex, 1 + x2, ln(x) ).
0011 0010
12
45
 A escolha das funções gj(x) pode ser feita observando
o gráfico dos pontos tabelados,
chamado de diagrama de dispersão,
Através do qual podemos observar o tipo de curva
que melhor se ajusta aos dados.
0011 0010
12
45
Exemplo 1: Considere a seguinte tabela de pontos.
xk
0.1
0.2
0.5
0.7
0.8
0.9
1.1
1.23 1.35
1.5
1.7
1.8
yk
0.19 0.36 0.75 0.91 0.96 0.99 0.99 0.94 0.87 0.75 0.51 0.35
1
A análise do diagrama de dispersão
mostra que a função que procuramos
se comporta como uma parábola.
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
2
Logo poderíamos escolher as funções g1(x) = 1, g2(x) = x e g3(x) = x2,
pois j(x) = a1g1(x) + a2g2(x) + a3g3(x) representa uma família de
parábolas, e com a escolha adequada dos aj teremos aquela que
melhor se ajusta aos pontos.
0011 0010
12
45
 Para obter a curva que melhor se ajusta a função tabelada a idéia
é impor que o desvio em relação à função aproximada seja o menor
possível, ou seja:
dk = |yk – j(xk)|
1.5
j(x)
1
yk
dk
0.5
0
-0.5
d2
d1
-1
0011 0010
-1.5
-2
d3
-1.5
-1
-0.5
0
0.5
1
1.5
2
12
45
 O Método dos Quadrados Mínimos consiste em escolher aj de
tal forma que a soma dos quadrados dos desvios seja mínima:
2
 d    y k  j ( xk )  
m
k 1
2
k
m
k 1
2
 d    yk  a1 g1 ( xk )  a 2 g 2 ( xk )    a n g n ( xk )
m
k 1
2
k
m
k 1
isto é, encontrar os parâmetros aj que minimizam a função:
j ( xk )


F (a1 , a 2 ,...,a n )   [ yk  (a1 g1 ( xk )  ...  a n g n ( xk ))]2
m
k 1
0011 0010
12
45
 A função F é uma função quadrática que satisfaz F(a) ≥ 0 a  R m.
Isto é, uma função limitada inferiormente e portanto tem um ponto
de mínimo.
 O ponto crítico de F(a) é encontrado igualando seu gradiente a
zero:
F
a j
0
j  1, 2,...,n.
(a1 ,...,a n )
Desta forma temos:
m
2  [yk – a1g1(xk) - a2g2(xk) – ... – angn(xk)](-gj(xk)) = 0
k 1
0011 0010
12
45
 A equação anterior pode ser reescrita como:
m
 k1 g1(xk)g1(xk)


 a1 

m
 k1 g1(xk)g2(xk)



 a1 

m
m

m

y g (x )
 k1 g2(xk)g1(xk)  a 2    k1 gn(xk)g1(xk)  a n  k1 k 1 k




m


g
(x
)g
(x
)
 k 1 1 k n k  a1 


m
k1 g2(xk)g2(xk)


m
 a 2    k1 gn(xk)g2(xk)


m

 a n  k1 yk g2(xk)

m

m
 k1 g2(xk)gn(xk)  a 2    k1 gn(xk)gn(xk)



m

 a n  k1 yk gn(xk)

 Assim, para obter aj temos que resolver o seguinte sistema:
 A11

 A21
A
 31

A
 n1
A12 A13  A1n 

A22 A23  A2 n 
A32 A33  A3n 

  

An 2 An 3  Ann 
0011 0010
 a1   b1 
   
 a 2   b2 
a    b 
 3  3
   
a   b 
 n  n
onde,
m
Aij   gi(xk)gj(xk)
k 1
m
bi   yk gi(xk)
k 1
Observação
12
45
 No exemplo anterior ajustamos os dados a uma parábola, mas
outras funções bases poderiam ser usadas.
 Como exemplo, poderíamos pensar que os dados representam
o primeiro meio período de uma função senoidal.
 E neste caso poderíamos tomar j(x) = a1 + a2sen( 2 x). Afinal
qual seria a melhor escolha?
 A soma dos quadrados dos desvios em cada ponto tabelado
fornece uma medida que pode ser usada como parâmetro de
comparação entre ajustes diferentes.
n
d   [ yk  j ( xk )] 2
k 1
0011 0010
12
45
Aplicando o Método dos Quadrados Mínimos para o caso da
função senoidal, obtém-se:

j ( x)  0.0136 1.0193sen
2

x

1.1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0011 0010
0
0.5
1
1.5
2
12
45
Calculando a soma dos quadrados dos desvios para cada caso:
12
Parábola:
Sr  [ y( xk )  j ( xk )]2 0.00011
k 1
Senóide:
12
Sr  [ y( xk )  j ( xk )]2 0.02835
k 1
Portanto, para este caso, o melhor ajuste foi obtido usando a
parábola.
0011 0010
12
45
2.1 – Coeficiente de correlação (r)
 Fornece uma medida do percentual de pontos bem ajustados:.
St  S r
r 
St
2
onde,
m
2
S t   ( yk  ym 
m
k 1
ym 
 yk
k 1
m
2
S r   ( yk  ji 
m
k 1
0011 0010
12
45
3 – Quadrados Mínimos
Caso discreto - Modelo não linear
0011 0010
12
45
 Existem casos, onde o diagrama de dispersão de uma função
indica que os dados devem ser ajustados por uma função que não
é linear com relação aos parâmetros aj.
Como exemplo, considere os seguintes dados:
xk
-1.0
yk
-0.5
0
0.5
1
1.5
2.0
2.5
3
0.157 0.234 0.350 0.522 0.778 1.162 1.733 2.586 3.858
4
Observando o diagrama podemos
considerar que os dados tem um
comportamento exponencial, que
nos sugere o seguinte ajuste:
3.5
3
2.5
2
j ( x)  a1ea x
2
1.5
1
0.5
0
-1
-0.5
0011 0010
0
0.5
1
1.5
2
2.5
3
12
45
 Para aplicar o Método dos Quadrados Mínimos torna-se
necessário efetuar uma linearização do problema.
 A linearização da função escolhida para ajustar os pontos
anteriores deve ser feita da seguinte forma:
j ( x)  a1ea x 
2
z  ln(j ( x)) 
z  ln a1  a 2 x
Fazendo b1 = lna1 e b2 = a2 o problema consiste em ajustar os
dados de z pela reta:
z(x) = b1 + b2x
0011 0010
12
45
Para isso devemos construir uma nova tabela com os dados de
zk = ln(yk) = b1 + b2x.
xk
-1.0
-0.5
0
0.5
yk
0.166
0.189
0.250
0.600
1
1.5
2.0
2.5
3
0.800 1.200 1.800 2.640 3.700
zk = ln(yk) -1.796 -1.666 -1.386 -0.511 -0.223 0.182 0.588 0.971 1.308
9
F ( b1 , b 2 )   [ z ( xk )  ( b1  b 2 xk )] 2
k 1
 9 (1) 9 x   b1   9 z 
 k
 k 
k1

   k 1
k 1
9
9


 9
2 
  xk  xk   b 2    z k xk 
k 1
 k 1

 k 1

Resolvendo o sistema anterior obtemos a seguinte solução:
b1 = -1.114
b2 = 0.832
0011 0010
12
45
Desta forma os valores de aj são dados por:
a1  e b  0.328
a 2  b 2  0.832
1
Portanto temos:
j ( x)  a1ea x  0.328e0.832 x
2
5
4
3
2
1
0011 0010
0
-2
-1
0
1
2
3
4
12
45
Para calcular o coeficiente de correlação escrevemos a seguinte
tabela:
9
y
y
k 1
k
9
 1.2606
yk
(yk – y )2
jk
(yk - jk)2
0,166
1,1980
0,1427
0,0005
0,189
1,1482
0,2164
0,0007
0,25
1,0212
0,3280
0,0061
0,6
0,4363
0,4972
0,0106
0,8
0,2121
0,7537
0,0021
1,2
0,0037
1,1425
0,0033
1,8
0,2910
1,7320
0,0046
2,64
1,9029
2,6255
0,0002
3,7
5,9509
3,9799
0,0783
∑
12,1644
0,1066
2
St   ( yk  ym   12.1644
9
k 1
2
S r   ( yk  ji   0.1066
9
k 1
0011 0010

r2 
St  S r 12.1644 0.1066

 0,9912
St
12.1644
r  0.9956
12
45
 Linearização de algumas curvas:
• Curva Hiperbólica
y
1
a1  a 2 x
 z  a1  a 2 x
onde z  1
y
• Curva Exponencial
y  a1 (a 2 ) x
 z  b1  b2 x onde z  ln(y) , b1  ln(a1 ) , b2  ln(a 2 )
• Curva Geométrica
a
y  a1 ( x 
 ln( y)  ln(a1 )  a 2 ln(x) onde z  ln ( y), t  ln ( x),
2
z  b1  b 2 t
0011 0010
b1  ln(a1 ), b 2  a 2
12
45
3.1 – Teste de Alinhamento
 Uma vez escolhida uma função não linear em a1, a2,..., an
para ajustar uma função dada, uma forma de verificarmos se a
escolha feita foi razoável é aplicarmos o teste de alinhamento,
que consiste em:
i) fazer a “linearização” da função não linear escolhida;
ii) fazer o diagrama de dispersão dos novos dados;
iii) se os pontos do diagrama (ii) estiverem alinhados, isto
significará que a escolha da função foi adequada.
0011 0010
12
45
Exemplo 4: Considere a função dada pela tabela:
xk
-8
-6
-4
-2
0
2
4
yk
30
10
9
6
5
4
4
Qual das funções a) y ( x) 
1
a  bx
ou
b) y( x)  ab
x
ajustaria melhor os dados da tabela?
Em primeiro lugar devemos linearizar as funções:
1
De y ( x) 
, obtemos :
a  bx
z1 ( x)  a  bx
De y( x)  abt , obtemos:
z2 ( x)  ln a  x ln b
0011 0010
xk
-8
-6
-4
-2
0
2
4
z1=1/y 0.03 0.10 0.11 0.17 0.20 0.25 0.25
k
xk
-8
-6
-4
-2
0
12
45
2
4
z2=ln(yk 3.40 2.30 2.20 1.79 1.61 1.39 1.39
)
Fazendo o diagrama de dispersão para cada função:
z1  a  bx
z2  ln a  x ln b
0.35
3.5
0.3
3
0.25
2.5
0.2
0.15
2
0.1
1.5
0.05
0
-8
-6
-4
-2
0
2
4
1
-8
-6
-4
-2
0
2
4
Vemos que os dados de z1 = a + bx se aproximam mais de uma reta.
Assim, devemos escolher y  1 a  bx para ajustar os dados.
0011 0010
12
45
4 – Quadrados Mínimos
Caso contínuo
0011 0010
12
45
 No caso contínuo temos uma função f(x) dada num intervalo
[a, b] e não mais uma tabela de pontos.
 O procedimento é análogo ao caso discreto. Escolhidas as funções
bases gj devemos determinar a função j(xk) = a1g1(xk) + a2g2(xk) +...
+ angn(xk) de modo que o desvio seja mínimo, onde:
b
d   ( f ( x)  j ( x)  dx
2
a
 Neste caso os aj também são determinados pela resolução de um
sistema, onde os elementos Aij são obtidos por intermédio do
produto interno entre as funções gi(x) e gj(x).
b
Aij   g i ( x) g j ( x)dx
a
12
45
 E os elementos bi pelo produto interno entre f(x) e gj(x), ou seja:
b
bi   f ( x) g j ( x)dx
0011 0010
a