Que es una serie de tiempo¶
Una serie temporal es una sucesión de datos medidos en determinados momentos y ordenados cronológicamente.
En los negocios se encuentran muchos ejemplos de series temporales. Ejemplos de series temporales es el registro del precio de cierre de las acciones de cada día de la bolsa de valores de Colombia (BVC). Otra serie temporal suele ser las ventas diarias, semanales o mensuales en almacenes o grandes superficies como Exito, SAO, etc.
En sectores de la banca existe un gran uso de técnicas y herramientas para analizar series temporales. La herramienta mas popular para análisis de series temporales es sin duda Microsoft Excel. Por medio de filtros avanzados, tablas y gráficos dinámicos se pueden construir magníficos Cuadros de Mando (Dashboards) para impresionar a los tomadores de decisiones en la empresa. SAS (Statistical Analysis Software) es otra de las herramientas de pago para realizar un análisis de este tipo de datos.
Estas y muchas herramientas son de pago, A continuación mostraré una forma de realizar análisis de series temporales con Python, un lenguaje de código abierto especialmente usado para análisis de datos, ciencia de datos, machine learning entre otros.
Se analizará el valor del precio de cierre de la compañía Ecopetrol S.A. El conjunto de datos para este proyecto será extraído de la pagina de Yahoo Finance
Se empezará importando las librerías necesarias para procesar los datos:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
A continuación, se crea un objeto llamado dataset en el cuál vamos a almacenar los datos
precios =pd.read_csv("https://query1.finance.yahoo.com/v7/finance/download/EC?period1=1425772800&period2=1457395200&interval=1d&events=history")
Echemos un vistazo rápido a los 7 primeros datos de contiene nuestro objeto precios:
precios.head(7)
Como podemos observar la columna Date contiene la fecha en que se generó el registro. La columna Open contine el precio de apertura de la acción, es decir, el precio al cuál empezó a cotizarse la acción.
Miremos ahora un poco más a fondo nuestro conjunto de datos:
precios.info()
Para tener en cuenta estadísticos descriptivos como la media y desviacion estandar podemos hacer uso de la siguiente línea.
precios.describe()
podemos notar que la media del precio de cierre ajustado en el ultimo año es de 10.79 dólares. El valor mínimo ha sido 5.36 dolares y el valor máximo fué de 17.54 dólares
Para tener un conjunto de datos limpio debemos cerciorarnos que no haya valores nulos o NaN (NaN: Not a Number) en nuestros datos. el sigiente código nos permite observar que no hay valores nulos en nuestro conjunto de datos.
precios.isnull().sum()
Analicemos la gráfica de el precio de cierre ajustado:
plot = precios['Adj Close'].plot(figsize=(12, 8))
Un analista técnico podría notar que el precio acaba de romper una linea de tendencia fuerte a la baja y que ha tenido impulso fuerte hacia arriba en la última semana.
No hay comentarios:
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.