AJUSTE-DE-CURVAS.docx

10
AJUSTE DE CURVAS En la práctica dos o más variables suelen relacionarse de alguna manera, como lo hacen la talla y el peso, la masa y el volumen, entre otras relaciones. En muchos casos es conveniente encontrar las relaciones entre las variables y si son posibles las expresiones matemáticas que describen tal relación. Si la relación no es evidente o directa, entonces es necesario hacer aproximaciones o estimaciones a partir de los datos. Esto se puede lograr usando el diagrama de dispersión (nube de puntos) que consiste en graficar N pares ordenados (X , Y) , correspondientes a valores relacionados de las variables en consideración, en un sistema rectangular. En un diagrama de dispersión es posible observar una curva suave que se aproxime a los datos, esa curva puede ser lineal o no lineal y se conoce como la curva aproximante y se concluye que la relación es lineal o no lineal dependiendo de las características de la curva. El problema de encontrar curvas aproximantes se llama ajuste de curvas.

Transcript of AJUSTE-DE-CURVAS.docx

Page 1: AJUSTE-DE-CURVAS.docx

AJUSTE DE CURVAS

En la práctica dos o más variables suelen relacionarse de alguna

manera, como lo hacen la talla y el peso, la masa y el volumen, entre otras

relaciones. En muchos casos es conveniente encontrar las relaciones entre

las variables y si son posibles las expresiones matemáticas que describen

tal relación. Si la relación no es evidente o directa, entonces es necesario

hacer aproximaciones o estimaciones a partir de los datos. Esto se puede

lograr usando el diagrama de dispersión (nube de puntos) que consiste en

graficar N pares ordenados (X , Y) , correspondientes a valores

relacionados de las variables en consideración, en un sistema rectangular.

En un diagrama de dispersión es posible observar una curva suave que se

aproxime a los datos, esa curva puede ser lineal o no lineal y se conoce

como la curva aproximante y se concluye que la relación es lineal o no

lineal dependiendo de las características de la curva. El problema de

encontrar curvas aproximantes se llama ajuste de curvas.

REGRESION LINEAL

También se conoce como Aproximación por Mínimos Cuadrados. El Método consiste en hallar una línea recta que pase entre el conjunto de datos dados. La expresión de una línea recta es: y = a x + b

El análisis de regresión lineal, en general, nos permite obtener una función lineal de una o más variables independientes o predictoras (x1, x2,... xk) a partir de la cual explicar o predecir el valor de una variable dependiente o criterio (Y).

Page 2: AJUSTE-DE-CURVAS.docx

y = a x + b + E

Y es la variable a predecir;a y b son parámetros desconocidos a estimar; y E es el error que cometemos en la predicción de los parámetros.

Quedando definido el error como:

E = y - a x - b

El error (o Residuo) es la diferencia entre el valor real de y, y el valor aproximado. Para obtener la mejor línea a través de los puntos, se debe minimizar la suma de los errores residuales:

∑i=1

n

E i=∑i=1

n

( y i−b−ax i)

Pero esta estrategia, y otras más, son inadecuadas. La mejor estrategia consiste en minimizar la suma de los cuadrados de los residuos (Si):

Si=∑i=1

n

Ei2=∑

i=1

n

( y i−b−ax i)2

Si=∑i=1

n

( y i−b−axi)2

Para hallar a y b, se deriva la ecuación con respecto a cada coeficiente:

∂S i∂b

=−2∑i=1

n

( y i−b−ax i)

∂S i∂a

=−2∑i=1

n

( y i−b−ax i)x i

Igualando las derivadas a cero:

0=∑ y i−¿∑ b−∑ axi ¿

0=∑ x i y i−¿∑ b xi−∑ ax i2¿

Hallamos las ecuaciones normales. Y se resuelve a través de un sistema de ecuaciones:

Page 3: AJUSTE-DE-CURVAS.docx

a=n∑ xi y i−∑ x i∑ y i

n∑ x i2−(∑ x)

2

b= y a x

Error Estándar de la Aproximación

Cuantifica la dispersión alrededor de la línea de dispersión:

Sy / x=√ srn−2

Sy / x: medida de dispersión

Donde el subíndice yx

designa que el error es para un valor predicho de “y” y

corresponde a un valor particular de “x”

Si: sr=∑( y i−f (xi))2

st=∑ ( y i− y )2

La eficiencia del ajuste se cuantifica con el Coeficiente de Determinación:

r2=St−SrS t

r2: Coeficiente de determinación

Y con el Coeficiente de Correlación:

r=√ St−SrS t

ALGORITMO DE REGRESION LINEAL

1. Copiamos nuestra nube de puntos.

2. Calculamos, la suma de todos los x, la suma de todos los y , la suma de la multiplicación de los x*y, la resta de los y con la media aritmética de y elevada al cuadrado.

3. Encontramos el a y el b con la siguiente formula:

Page 4: AJUSTE-DE-CURVAS.docx

a=n∑ xi y i−∑ x i∑ y i

n∑ x i2−(∑ x)

2

b= y a x

4. Se calcula los parámetros de regresión lineal

Sy / x=√ srn−2

sr=∑( y i−f (xi))2

r2=St−SrS t

r=√ St−SrS t

5. Si r2 es igual a 1 entonces el ajuste es 100 % variable , si r2 es igual a cero entonces el ajuste no presenta mejorías

EJEMPLO: Ajuste a un modelo de regresión lineal

X 2 3 5 7 8

Y 14 20 32 42 44

Solución

Programa en maple:

X Y XY X^22 14 28 43 20 60 95 32 160 257 42 294 498 44 352 6425 152 894 151

N= 5A= 5.1538461

5B= 4.6307692

3Y= 5.1538461

5X + 4.6307692

3

Page 5: AJUSTE-DE-CURVAS.docx

restart; n : colocamos el numero de valores with(LinearAlgebra); with(plots)

X := [valores de x]; Y := [valores de y]; Promediox := evalf((sum(X[i], i = 1 .. n))/n); Promedioy := evalf((sum(Y[i], i = 1 .. n))/n); a1 := evalf((n*(sum(X[i]*Y[i], i = 1 .. n))-(sum(X[i], i = 1 .. n)).(sum(Y[i], i = 1 ..

n)))/(n*(sum(X[i]^2, i = 1 .. n))-(sum(X[i], i = 1 .. n))^2)); a0 := evalf(Promedioy-a1*Promediox); a := plot(X, Y, style = point, symbol = diamond, color = blue); b := implicitplot(y = a1*x+a0, x = intervalos que alcanza la grafica, y = intervalos

que alcanza la grafica); display(a, b); f := unapply(a1.x+a0, x); E := [seq(abs(Y[i]-f(X[i])), i = 1 .. n)];

SR := evalf(sum((Y[i]-f(X[i]))^2, i = 1 .. n)); ST := evalf(sum((Y[i]-Promedioy)^2, i = 1 .. n)); SY := evalf(sqrt(ST/(n-1))); S(y/x) := evalf(sqrt(SR/(n-2))); r2 := (ST-SR)/ST; r := sqrt(r2);

Mínimos cuadrados.mw

Page 6: AJUSTE-DE-CURVAS.docx

REGRESION POTENCIAL

Este modelo de regresión es una alternativa cuando el modelo lineal no logra un coeficiente de determinación apropiado, o cuando el fenómeno en estudio tiene un comportamiento que puede considerarse potencial o logarítmico. La forma más simple de tratar de establecer la tendencia es a través de un diagrama de dispersión o nube de puntos, tal como la siguiente:

Este modelo también es conocido como potencial, Cobb-Douglas de primer grado o exponencial inverso.

La función que define el modelo es la siguiente:

y i=ax ib E

y i : Variable dependiente, en la i-ésima observación

a, b: Parámetros de la ecuación, que generalmente son desconocidos E: Error asociado al modelo x i : Valor de la í-esima observación de la variable independiente

Al sustituir los parámetros por estimadores, el modelo adopta la siguiente forma:

y i=ax ib

La ecuación se transforma aplicando logaritmos de ambos lados, con lo cual se convierte a una forma lineal:

log y i=log (ax ib)

log y i=loga+log x ib

log y i=loga+b∗log x i

y¿=a¿+b x¿

Page 7: AJUSTE-DE-CURVAS.docx

Observamos que ahora obtenemos un modelo de regresión lineal, donde

b=n∑ x¿ y¿−∑ x¿∑ y¿

n∑ x¿ 2−(∑ x¿)2

a¿= y¿ bx¿

Al encontrar los valores de a y b reemplazamos en el modelo de regresión potencial:

y i=ax ib

ALGORITMO DE LA REGRESION POTENCIAL

Escribimos nuestra nube de puntos Linealizo mi ecuación al tipo potencial.

y=a2 xb2

log y=b2 log x+ log a2

Calculo mi nube de puntos, con mi nueva regresión.

POTENCIAL

log y log y

Ahora obtengo una nueva nube de puntos, con la cual usare mi regresión

lineal, explicada anteriormente.

Encuentro mi curva, que se ajusta con la nube de puntos.

Ejemplo ilustrativo: ajuste a una función potencial

Page 8: AJUSTE-DE-CURVAS.docx

n= 5a= 1.99019655b= 0.09887661

b=100.09887661

b=¿1.25567316

La ecuación: y=1.25567316 x0.09887661

X Y

1 1,25

2 5

3 11,25

4 20

5 30,5

x y logx logy logx*logy (logx)^21 1.25 0 0.09691001 0 02 5 0.30103 0.69897 0.21041094 0.090619063 11.25 0.47712125 1.05115252 0.50152721 0.227644694 20 0.60205999 1.30103 0.78329811 0.362476235 30.5 0.69897 1.48429984 1.03748107 0.48855907

15 68 2.07918125 4.63236237 2.53271732 1.16929905