Aprendizagem Indutiva - Departamento de Sistemas e Computação
Download
Report
Transcript Aprendizagem Indutiva - Departamento de Sistemas e Computação
Universidade Federal de Campina Grande
Departamento de Sistemas e Computação
Curso de Bacharelado em Ciência da Computação
Inteligência Artificial I
Aprendizagem
(Parte I)
Prof.a Joseana Macêdo Fechine
[email protected]
Carga Horária: 60 horas
DSC/CCT/UFC
G
Aprendizagem
Tópicos
Aprendizagem – Conceitos Básicos
2
DSC/CCT/UFCG
Aprendizagem
“Aprendizagem é o processo pelo qual uma
entidade adquire conhecimento”. Rich, 1983.
“Aprendizagem é uma forma de inferência que
objetiva começar com informações sobre o
domínio e então, estendê-las de alguma forma”.
Ginsberg, 1993.
Para Russel e Norvig: "Aprender significa se
comportar melhor ao adquirir experiência. Todo
aprendizado aprende a representação de uma
função."
3
DSC/CCT/UFCG
Aprendizagem
Processos
aquisição de novos conhecimentos;
desenvolvimento de técnicas motoras e cognitivas
por meio de instrução ou prática;
generalização de conhecimentos adquiridos;
representação do conhecimento;
descoberta de novos fatos/teorias.
4
DSC/CCT/UFCG
Aprendizagem
Objetivos
eliminação do elemento humano no processo de
aquisição de conhecimento;
desenvolvimento de teorias gerais de aprendizagem;
ensino assistido por computador.
5
DSC/CCT/UFCG
Agente de aprendizagem
Elemento de desempenho: decide que ações
executar.
Elemento de aprendizagem: modifica o elemento
de desempenho para que este tome decisões
melhores.
O projeto é afetado por três questões importantes:
Os componentes que devem ser aprendidos;
A realimentação que estará disponível para aprender
esses componentes;
A representação que será usada para os componentes.
6
DSC/CCT/UFCG
Aprendizagem
Aprendizagem (realimentação - feedback):
Aprendizagem supervisionada
Aprendizagem não supervisionada
Aprendizagem por reforço
7
DSC/CCT/UFCG
Aprendizagem
Aprendizagem Supervisionada:
Ocorre nas situações em que é possível perceber tanto as
entradas como as saídas;
Freqüentemente as saídas são fornecidas por um
supervisor(especialista) humano;
Envolve aprendizagem de uma função a partir de exemplos
de suas entradas e saídas.
Aprendizagem Não-Supervisionada:
Envolve a aprendizagem de padrões na entrada, quando não
são fornecidos valores de saída específicos.
Aprendizagem por Reforço:
DSC/CCT/UFCG
O agente deve aprender a partir do reforço (recompensa).
8
Aprendizagem
Tipos
Segundo Ginsberg(1993), aprendizagem pode ser
dividida em:
Aprendizagem por Descoberta;
Aprendizagem por Generalização;
Aprendizagem
Dedutiva;
Aprendizagem Indutiva
9
DSC/CCT/UFCG
Aprendizagem
DSC/CCT/UFCG
Por Descoberta: é uma forma restrita de
aprendizado em que uma entidade adquire
conhecimento, sem o auxílio de alguém que já o
possua.
Exemplos de Sistemas computacionais de
descoberta
AM - sistema para modelagem de aspectos da pesquisa
em Matemática Elementar, descobrindo novos conceitos
guiado por uma grande gama de heurísticas;
BACON – modelo de descoberta dirigida por dados;
GLAUBER – sistema para descoberta de leis qualitativas
em Química;
BOOLE – gera conhecimentos científicos simbolizáveis.
10
Aprendizagem
Aprendizagem Dedutiva: Aprendizagem de
novas informações que são conseqüências
válidas de algo já conhecido.
Aprendizagem Indutiva: Inferência indutiva de
fatos providos por um professor ou ambiente.
O estudo e modelagem desta forma de
aprendizagem é um dos tópicos centrais de
aprendizagem de máquina.
Em aprendizagem indutiva, um programa aprende a
classificar objetos baseados nos rótulos que lhe são
apresentados.
Deve tentar recuperar a função desconhecida ou uma
aproximação.
11
DSC/CCT/UFCG
Aprendizagem indutiva
Dada uma coleção de exemplos de f, retornar uma
função h que se aproxime de f.
A função h é chamada hipótese
Não é fácil saber se uma h específica é uma boa
aproximação de f
Uma boa h irá generalizar bem – prever
corretamente exemplos ainda não vistos
Esse é o problema fundamental da indução
12
DSC/CCT/UFCG
Aprendizagem Indutiva
Atividade de um agente =
função f (percepção) ação
Idéia:
aprender, a partir de exemplos (x,f(x)),
representação de uma função h que aproxima f
Métodos
redes neurais, algoritmos genéticos, etc.
13
DSC/CCT/UFCG
Aprendizagem Indutiva
Exemplo: Ajustar uma função de uma única variável
a alguns pontos de dados
Exemplos são pares (x, f(x)) de números reais
14
DSC/CCT/UFCG
Aprendizagem Indutiva
Exemplo:
15
DSC/CCT/UFCG
Aprendizagem Indutiva
Exemplo:
16
DSC/CCT/UFCG
Aprendizagem Indutiva
Exemplo:
17
DSC/CCT/UFCG
Aprendizagem Indutiva
Exemplo:
A verdadeira f é desconhecida, mas existem muitas opções para h. Sem contar
com mais conhecimento, não há razão que nos faça preferir uma das opções.
DSC/CCT/UFCG
18
Aprendizagem
Aprendizagem Indutiva - Estratégia de controle
Botton-up (dirigido a dados) - processam os eventos de
entrada um de cada vez, generalizando gradualmente o
conjunto corrente de descrições até que uma generalização
conjuntiva seja computada;
Direção: bottom-up (específico geral)
Top-down (dirigida a modelo) - conjunto de possíveis
generalizações na tentativa de encontrar as melhores
hipóteses que satisfaçam certos requerimentos;
Direção: top-down (geral específico)
Mista
19
DSC/CCT/UFCG
Questões: on-line x off-line
Aprender de uma vez ou aos poucos?
Incremental (on-line): atualiza hipótese a cada
novo exemplo
mais flexível, ... porém
ordem de apresentação é importante (backtracking)
é difícil revisar as crenças
não incremental (off-line): gera h a partir de
todo conjunto de exemplos
mais eficiente e prática
mais usado!
20
DSC/CCT/UFCG
Modelo do Agente Aprendiz
(on-line)
Agente
t+1
sensores
ambiente
t
crítico
avaliação
trocas
elemento
ator
elemento de
conhecimento aprendizagem
objetivos de
aprendizagem
efetuadores
Gerador de
problemas
21
DSC/CCT/UFCG
Algoritmo de
Aprendizagem
exemplos
conhecimento
ambiente
Uso
Treinamento
Modelo do Agente Aprendiz
(off-line)
sensores
elemento
ator
efetuadores
22
DSC/CCT/UFCG
Por que a aprendizagem
funciona?
“É quase certo que qualquer hipótese que esteja seriamente
errada será "desmascarada" com alta probabilidade após um
pequeno número de exemplos, por que fará uma previsão
incorreta. Desse modo, qualquer hipótese que seja consistente
com um conjunto bastante grande de exemplos de treinamento
terá pouca probabilidade de estar seriamente errada: isto é, ela
deve estar provavelmente aproximadamente correta
(aprendizagem PAC).
Para tanto, os conjuntos de treinamento e teste devem ser
extraídos ao acaso e de forma independente da população de
exemplos com a mesma distribuição de probabilidade suposição de hipótese de estacionariedade.”
(Russel e Norvig)
23
DSC/CCT/UFCG