O problema de ajuste de curvas
Introdução ao ajuste de curvas pelo método de quadrados mínimos
Vamos lá?
Em ciências experimentais é comum desejar-se conhecer uma função através de observações. Por exemplo, como será que varia a concentração de um nutriente do leite, a medida que o tempo passa? Para isso, a concentração do nutriente é medida em vários momentos, dando origem a uma coleção de pontos amostrados da função. A técnica de ajuste de curvas por quadrados mínimos permite estimar a função a partir da coleção de amostras. Nesta aula, vamos entender melhor o que é o problema de quadrados mínimos e de onde vem esse nome.
- 1
- 2
- 3
Nos problemas de ajuste de curvas geralmente temos...
No ajuste de curvas queremos estimar uma função contínua que...
Que medida usamos para quantificar a qualidade de uma curva ajustada?
O gráfico do video exibe 160 pontos amostrados de uma função. Imagine que esses pontos foram obtidos experimentalmente e, por isso, as medidas estão contaminadas com erro experimental. Nosso objetivo é obter uma aproximação para a função que deu origem aos dados.
Mesmo não podendo confiar individualmente em nenhum dos valores amostrados, ainda é possível inferir a partir dessa nuvem de pontos o comportamento esperado da função.
Como as medidas estão contaminadas com erro, não faz sentido exigir que a função aproximada reproduza exatamente os valores amostrados.
O ajuste de curva pode ser formulado, genericamente, com o problema de encontrar a função que melhor ajusta os pontos amostrados.
Para poder de fato trabalhar esse problema será preciso descrevê-lo de forma bem mais precisa. Dois aspectos merecem mais cuidado na definição do problema. Em primeiro lugar, procurar uma função é algo muito geral. Será necessário especificar qual tipo de função estamos procurando. Trataremos este ponto com mais detalhes em outra aula. O segundo aspecto que precisa ser bem descrito é sobre o sentido do termo melhor ajuste.
Vários critérios podem ser propostos para definir a qualidade do ajuste dos dados por uma função.
Suponha que as medidas foram tomadas exatamente em $x_1,\ldots,x_m,$ ou seja, no conjunto de pontos amostrados não há erro amostral na ordenadas do pontos, mas apenas nas abscissas. Um possível critério para quantificar a qualidade do ajuste seria somar os desvios entre o valor amostrado (pontos destacados no gráfico) e o valor predito pelo função $\phi.$ Nesse sentido a função que melhor ajusta os dados seria aquela cuja soma de desvios verticais fosse a menor possível. A medida a ser minimizada seria então uma soma de módulos (ou valores absolutos). Apesar de ser um critério válido, como a função módulo não é diferenciável, não poderemos utilizar as ferramentas de Cálculo Diferencial para resolver esse problema de minimização. Por isto, é comum adotar como medida de qualidade do ajuste, não a soma dos desvios em módulo, mas sim a soma dos quadrados do desvios, ficando assim com uma função diferenciável para ser minimizada.
Antes de tentar formalizar o método de determinação da curva de melhor ajuste, na próxima aula trabalharemos em um exemplo concreto.
1. Em sua área, pense em situações onde o método de ajuste de curvas por quadrados mínimos pode ser útil.
2. Se $\{(x_1,y_1), (x_2,y_2),\ldots,(x_m,y_m)\}$ é o conjunto de pontos amostrados, e $\phi$ é a função ajustada. Quais das alternativas abaixo podem ser utilizadas para medir a qualidade do ajuste?
- $\displaystyle{\sum_{i=1}^m (\phi(x_i) - y_i)}$
- $\displaystyle{\sum_{i=1}^m |\phi(x_i) - y_i|}$
- $\displaystyle{\sum_{i=1}^m (\phi(x_i) - y_i)^2}$
- $\displaystyle{\left[\sum_{i=1}^m |\phi(x_i) - y_i|\right]^2}$
A alternativa (a) não seria uma boa escolha, pois erros positivos seriam compensados por erros negativos. A alternativa (b) pode ser utilizada para medir ajuste entre curvas, porém não é diferenciável. Essa falta de diferenciabilidade dificulta a análise de qualidade do ajuste. A alternativa (c) é o critério efetivamente utilizado no ajuste de curva pelo método de quadrados mínimos. A alternativa (d) é equivalente à (b), no sentido que o ajuste ótimo para em uma delas também é ótima na outra.
3. Para cada conjunto de pontos, exibidos nos gráficos abaixo, tente imaginar como poderia ser uma função que os ajuste. Será que em todos os caso a curva de melhor ajuste fornecerá um bom ajuste?