Cuantos datos históricos se necesitan para realizar un pronóstico?

La respuesta a esta pregunta es NO EXISTE UNA CANTIDAD MÍNIMA O MÁXIMA DE DATOS HISTÓRICOS para ejecutar un proceso de pronósticos.

La cantidad ideal de datos históricos para realizar un proceso de pronósticos puede variar según el tipo de pronóstico a utilizar y la complejidad del fenómeno a analizar. En términos generales, contar con un conjunto de datos extenso y representativo puede mejorar la asertividad del proceso de pronóstico. Sin embargo, la calidad de los datos y la estabilidad de condiciones externas también son factores que determinan el número de datos a analizar.

En algunos casos, modelos predictivos pueden requerir grandes cantidades de datos, mientras que en otros, un conjunto más pequeño pero “bien seleccionado” podría ser suficiente. Es esencial evaluar cada situación de manera específica.

Cuando nos referimos a la complejidad de los fenómenos, hacemos énfasis a fenómenos como: el crecimiento económico, el %PIB, el consumo per cápita, el precio del dólar, el clima, la demanda de un producto, etc.

Por ejemplo, para pronosticar la demanda, es recomendable trabajar por lo menos con 24 periodos mensuales, este número de periodos proporciona una visión más completa de los patrones estacionales, tendenciales y cíclicos, sin embargo, la elección del número de datos dependerá de la naturaleza del producto, la variabilidad de la demanda y la disponibilidad de datos relevantes, además, considerar factores externos como cambios en el mercado o eventos especiales puede ser crucial para ajustar y mejorar la predicción.

Es relevante tener en cuenta los siguientes aspectos para determinar el número de datos históricos:

La naturaleza del producto y su ciclo de vida influyen en la cantidad de datos, si se desconoce en qué etapa del ciclo de vida se encuentra y usted toma los datos históricos desde su lanzamiento, el modelo de pronóstico puede incurrir en sesgo debido a que los valores de los datos de la etapa de lanzamiento son menores a los valores de los datos en la etapa de madurez o viceversa.

Cuantos más ciclos estacionales puedas identificar en tus datos, mejor podrás entender la naturaleza y la regularidad de las estacionalidades. Un conjunto de datos más extenso que abarque múltiples ciclos estacionales proporcionará una base más sólida para prever patrones futuros. Si estás tratando con estacionalidades a nivel mensual, anual, trimestral, etc., necesitarás suficientes datos en cada período para capturar la variación estacional de manera efectiva, estacionalidades como: navidad, san Valentín, halloween, vacaciones, escolar, fiestas patronales y nacionales, entre otros, marcan un patrón de comportamiento en un conjunto de datos y para que un modelo de pronóstico identifique ese patrón se requerirán como mínimo 24 datos históricos mensuales.

Uno de los retos más apremiantes en la planeación de demanda es cuando se enfrenta a una serie de datos con una alta variabilidad con coeficientes de variación por encima del 1.0, en casos muy específicos con coeficientes por encima de 0.5 se vuelve complejo pronosticar, en algunos casos, la variabilidad puede deberse a factores a corto plazo que no afectan las tendencias a largo plazo. Para situaciones de alta variabilidad no se recomienda utilizar menos de 12 datos históricos debido a que el modelo no lograría identificar si la variabilidad de los datos es temporal o es recurrente, para este tipo de series de tiempo es recomendable analizar 36 datos históricos mensuales o más, después ir descartando aquellos datos o periodos que generan la distorsión o variabilidad.

En situaciones con alta variabilidad, puede ser más apropiado proporcionar datos o grupo de datos en forma de rangos o en intervalos de tiempo en lugar de valores puntuales (agregar a nivel de periodo).

Eventos económicos, competencia o cambios regulatorios pueden afectar la demanda. En mercados que han experimentado cambios en el pasado, es beneficioso contar con un historial significativo de datos recomendable mayor a 36 registros. Esto permite analizar cómo el mercado ha respondido a situaciones similares en el pasado y puede proporcionar insights valiosos para prever futuros cambios.

En algunos casos, especialmente cuando se anticipan cambios rápidos, la integración de datos en tiempo real puede ser esencial. Esto permite ajustar los pronósticos de manera dinámica a medida que evolucionan las condiciones del mercado, Asegúrese de tener datos que reflejen los aspectos clave del mercado que se verán afectados por los cambios anticipados. Esto podría incluir datos de ventas, comportamiento del consumidor, tendencias económicas, entre otros.

Dependiendo de la velocidad con la que se esperan los cambios, puede ser necesario trabajar con datos más frecuentes (mayor granularidad) para capturar los cambios a corto plazo.

De nada sirve contar con un extenso conjunto de datos, si los datos no reflejan la realidad de lo ocurrido, es mejor trabajar con pocos datos pero consistentes. Los modelos de pronóstico dependen en gran medida de la calidad de los datos de entrada. Si los datos contienen errores, sesgos o están incompletos, los modelos generarán pronósticos inexactos.

La confiabilidad de los datos se refiere a su consistencia y estabilidad a lo largo del tiempo. Los datos inconsistentes o que varían significativamente pueden afectar la capacidad de los modelos de pronósticos, al igual que la falta de datos o datos incompletos puede llevar a lagunas en la información.

Los datos deben ser íntegros haciendo referencia a su calidad. Los errores en la entrada de datos, duplicaciones o inconsistencias pueden afectar la confiabilidad de los resultados, la implementación de prácticas sólidas de gestión de datos, como la limpieza regular de datos, la validación y la actualización constante.

Este intervalo, también conocido como frecuencia temporal, se refiere a la distancia entre puntos de datos sucesivos, comúnmente conocido como “granularidad”.

La granularidad del tiempo se refiere a cuán detallada es la información temporal. Puedes tener intervalos de tiempo diarios, horarios, mensuales, anuales, etc. La elección de la granularidad debe adaptarse a la naturaleza del problema y a la disponibilidad de datos. La elección del intervalo de tiempo también está vinculada a la capacidad de recopilar y procesar datos. Intervalos de tiempo más cortos pueden requerir más recursos y capacidad de procesamiento.

Dependiendo de la granularidad escogida así mismo seria el número de datos a analizar, por ejemplo realizar la estimación de la frecuencia de la parada del bus, para este caso la granularidad es a nivel de “hora” y en un día obtendrás unos 18 a 20 registros y en el mes obtendrás 600 registros aproximadamente dependiendo de la franja horaria que tenga establecido el sistema de transporte urbano.

La cantidad de datos necesarios para realizar un pronóstico cuando existen efectos externos depende de la naturaleza de esos efectos y de la complejidad del sistema que estás tratando de modelar. Comienza identificando y comprendiendo los efectos externos que podrían influir en tus resultados. Esto podría incluir factores como eventos climáticos, cambios en las regulaciones gubernamentales, fluctuaciones económicas, pandemias u otros eventos imprevistos.

Reúne datos históricos que estén directamente relacionados con los efectos externos que podrían afectar tus pronósticos. Estos datos te ayudarán a comprender cómo el sistema ha respondido en el pasado a situaciones similares, recopila datos contextuales que puedan ayudar a explicar y comprender la interacción entre los factores externos y tus variables de interés. Esto puede incluir datos demográficos, datos geográficos, etc.

Dada la incertidumbre asociada con los efectos externos, considera utilizar técnicas de modelado de escenarios. Esto implica desarrollar varios escenarios posibles basados ​​en diferentes condiciones externas y evaluar cómo cada escenario afectaría tus pronósticos, en situaciones donde los efectos externos son complejos y difíciles de modelar, la colaboración con expertos en el campo puede ser valiosa. La experiencia humana puede proporcionar perspectivas que los modelos puramente cuantitativos podrían pasar por alto.

Los modelos de pronóstico desempeñan un papel crucial al analizar y entender patrones pasados, proporcionando una interpretación de lo que ha ocurrido en un determinado conjunto de datos. Sin embargo, es esencial destacar que estos modelos interpretan eventos históricos y patrones pasados, no anticipan de manera directa lo que ocurrirá en el futuro. Su función principal radica en identificar tendencias, estacionalidades y relaciones en datos previos para informar sobre posibles escenarios futuros. La interpretación de datos históricos permite a los modelos ofrecer perspectivas valiosas sobre cómo ciertos factores han influido en el pasado, brindando así una base para realizar proyecciones y pronósticos. No obstante, la incertidumbre inherente a eventos futuros significa que los modelos de pronóstico deben ser utilizados con cautela y considerados como herramientas de apoyo, con la comprensión de que no pueden predecir de manera infalible lo que sucederá en el futuro.

Acerca de JOSÉ ANDRÉS ROSAS

Ingeniero Industrial, Especialista en Gerencia de Logística, Máster en Ingeniería Industrial y Especialista en métodos cuantitativos de predicción y pronósticos, docente de hora cátedra en postgrados en temas de Planeación, Compras, Inventarios y Almacenamiento. Expositor, conferencista, asesor y consultor empresarial.

correo electroníco: joserosassoluciones@hotmail.com

Read More

PATRONES DE COMPORTAMIENTO DE DEMANDA – SERIES DE TIEMPO

Uno de los principales retos para las cadenas de abastecimiento en las organizaciones es lograr controlar e identificar los patrones de comportamiento de la demanda, por lo que es importante tener claro y definido cual es el comportamiento del mercado y el ciclo de vida del producto para determinar dichos patrones.

Un patrón de comportamiento suele conocerse cuando la serie histórica de ventas (serie de tiempo) presenta de manera repetida una o varias características o cualidades similares a lo largo de un intervalo de tiempo, por lo general se supone (al menos los más conocidos) que son cuatro (4) los componentes que se combinan para dar forma a una serie de tiempo, estos son: tendencial, cíclico, estacional y errático.

La habilidad que tenga un profesional de planeación en la interpretación de patrones de comportamiento en las series de tiempo le permitirá (en teoría) primero, ahorrar tiempo en la elección del modelo de pronóstico más adecuado, segundo, ser más asertivo en los resultados de la estimación, recordemos, que el uso adecuado de herramientas de estimación brindará una ventaja competitiva a las organizaciones comprendiendo la mejor manera de anticiparse a las necesidades de abastecimiento de materiales, materias primas o suministros.

En una manera secuencial pero sencilla iremos avanzando en el conocimiento de los diferentes patrones de comportamiento existentes en una serie histórica de ventas (series de tiempo) .

SERIE DE TIEMPO

Es una secuencia de observaciones que describen la evolución de un fenómeno o variable sobre intervalos de tiempo regulares (diario, semanal, quincenal, mensual, bimensual, semestral, anual, entre otras), por ejemplo:

  • La producción mensual de una planta de manufactura
  • La demanda diaria de un producto
  • Las tasas mensuales de desempleo
  • La población anual de un país, entre otras

Una serie de tiempo se puede dividir en dos familias, en continuas e intermitentes, estas dos familias serán nuestros primeros patrones de comportamiento.

CONTINUA: Se presenta cuando se obtiene la demanda de manera ininterrumpida periodo a periodo, puede sonar un poco obvio y en ocasiones algunos autores omiten este patron (porque se asume que una serie de tiempo debe ser continua, mas adelante veremos que no), pero que en la realidad permite identificar en procesos de estimación que en periodos futuros se presentarán eventos de demanda.

Supongamos que contamos con un almacén que comercializa productos de papelería y se encuentra ubicado cerca a las oficinas de abogados de la localidad, el producto principal del almacén son las libretas de apuntes donde mensualmente (sin falta) se presenta demanda de este producto, este patrón ininterrumpido nos da una alerta como profesionales de planeación que debemos garantizar inventario todos los meses o que debamos generar órdenes de compra todos los meses dado el caso.

INTERMITENTE: Algunos autores la nombran como patrón irregular, se presenta cuando la demanda se obtiene de manera interrumpida, con valores de cero (0) o valores nulos en algunos periodos de tiempo y no es por falta de datos o error en la captura de los datos sino por la naturaleza propia de la demanda. En este caso a diferencia del patrón continuo, se torna un poco mas complejo los resultados de estimación debido a que el profesional de planeación debera analizar dos tipos de variables, la primera que consta en estimar si se presentará o no el evento de demanda y la segunda en que cantidad se presentará la demanda.

Un claro ejemplo de este patrón se presenta en la demanda de algunos productos propios de industrias del sector militar, aviación, aeroespacial, automotriz, alta tecnología, electronica, clinicas y hospitales de alta complejidad.


Ahora, nos detendremos a analizar los patrones de comportamiento en las series de tiempoCONTINUAS, en esta familia nos podemos encontrar el siguiente conjunto de patrones:

  • Constante (Constant)
  • Tendencia (Trend)
  • Cíclico (Cyclic)
  • Estacional (Seasonal)
  • Estacional con tendencia (Seasonal trend)
  • Errático (Erratic)

PATRÓN CONSTANTE (CONSTANT): También conocido por algunos autores como patrón regular, en algunos países de América Latina se le suele llamar patrón estacionario (diferente a estacional), se presenta cuando las observaciones se encuentran en equilibrio alrededor de la media, tanto la media como la varianza son constantes, las variaciones en las observaciones son pocas a lo largo del tiempo, el análisis visual de la serie de tiempo es con frecuencia suficiente para evaluar lo constante o regular de la serie de tiempo, en econometría se conoce como I(0) cointegración de orden cero, aplicando algunos elementos del EDA (Exploratory Data Analysis) se logra identificar este tipo de patrón. https://www.joserosas.com.co/analisis-exploratorio-de-datos-en-planeacion-de-demanda/

A continuación, veremos una serie de tiempo con patrón de comportamiento constante, regular o estacionaria. Se comparten los datos del consumo de combustible de un vehículo que realiza la ruta empresarial de trabajadores de una empresa de la localidad.

PATRÓN CON TENDENCIA (TREND): Representada por el crecimiento o decrecimiento consistente de los datos en la serie de tiempo. Al igual que el patrón constante el análisis visual de la serie de tiempo es con frecuencia suficiente para evaluar el grado de inclinación y la dirección de la tendencia, de igual manera podemos evaluar la ecuación de la recta y = ax + b donde “a” representa la pendiente de la recta, la cual puede tomar valores negativos, positivos o cero según dado el caso.

A continuación, como ejemplo, se comparten los datos de los ingresos operacionales de un almacén que comercializa repuestos de motocicletas.

La linea de tendencia (color rojo) muestra como los datos crecen en el tiempo, para reforzar la hipótesis nos apoyamos en el valor de la pendiente “a” que es igual a 3356,2 (positivo) lo que indica un crecimiento.

PATRÓN CÍCLICO (CYCLIC): Cuando la serie de tiempo presenta un patrón con tendencia, es posible encontrar un patrón adicional que consiste en secuencias de datos que se presentan de manera alternante por encima y por debajo de la linea de tendencia de manera constante durante un intervalo prolongado de tiempo (superior a 6 periodos con el fin de reafirmar la hipótesis del ciclo).

A continuación, presentamos un ejemplo con el número de motocicletas vendidas en Colombia durante el año 2022, en el grafico se puede observar explícitamente una tendencia creciente en la demanda de motocicletas y como en un lapso de 12 periodos se presentan dos ciclos.

PATRÓN ESTACIONAL (SEASONAL): Una serie de tiempo es estacional cuando podemos observar en ella un patrón sistemático repetido en intervalos de tiempo iguales (cada año, cada mes, etc). El análisis visual de la serie de tiempo es con frecuencia suficiente para evaluar la estacionalidad de la serie de tiempo, adicional al grafico visual, se encuentra elementos del EDA como la función de autocorrelación (ACF) que nos permite encontrar el nivel de autocorrelación de los datos y en qué retardos denominados periodos (k) se produce.

Existen muchos ejemplos de series de tiempo con comportamiento estacional. El hecho de que las vacaciones laborales se concentren en los meses de verano condiciona los valores de muchas series. Un claro ejemplo es el de las series relacionadas con el turismo, tales como la cantidad mensual de reservas hoteleras, número de pasajeros que viajan en avión por mes, etc.

La pauta sistemática que caracteriza la estacionalidad no tiene por qué ser anual, algunas series tienen una estacionalidad cuyo periodo es mensual, semanal o incluso un diario. Un ejemplo de una serie de tiempo estacional diaria podría ser el de las ventas por horas de un producto en una tienda minorista, es altamente probable que cada día se repita un patrón de comportamiento muy similar; habrá horas pico con gran número de ventas y otras horas valle en las que apenas hay gente y por lo tanto se registran un número menor de ventas.

A continuación, observaremos una serie de tiempo que involucra datos de los pasajeros movilizados por la compañía aérea United Airlines durante los años 2009 al 2013, en esta serie se observa claramente que hay un patrón similar que se repite año tras año, con evidentes aumentos en el número de pasajeros en los meses de verano (julio – agosto) y decrementos más moderados en los meses correspondientes a enero y febrero.

PATRÓN ESTACIONAL CON TENDENCIA (SEASONAL TREND): Cuando la serie de tiempo presenta un patrón estacional, es posible encontrar un patrón tendencial en las observaciones que consiste en secuencias de datos que se presentan de manera creciente o decreciente de manera constante. A continuación, podemos observar el ejemplo de la empresa UNITED AIRLINES cuando aperturó nuevas rutas hacia destinos en el mar caribe, se puede evidenciar que existe el patrón estacional pero han ido creciendo en pasajeros movilizados en los 5 años siguientes.

PATRÓN ERRÁTICO (ERRATIC): Existen series de tiempo que siendo continuas no presentan algunos de los patrones anteriormente mencionados, los datos no tienen alguna logíca matematica o racional que permita entender lo sucedido, pero que despues de sucedida cada observación existe una explicacion para ello, explicaciones como ciertos sucesos a veces impredecibles como huelgas, pandemias, cambios de clima (sequías, inundaciones o terremotos), elecciones, conflictos armados o la aprobación de asuntos legislativos, pueden causar la irregularidad en una variable.

Estadísticamente se puede identificar este patrón cuando obtenemos el resultado de un elemento del EDA que es el coeficiente de variación (CV), algunos autores definen que un CV >= 1.0 la serie de tiempo se consideraría como errática.

Un ejemplo de este caso son las variaciones observadas en la serie histórica de la demanda de papel higieníco en una empresa Peruana, atribuidas a especulaciones debido a la pandemia ocurrida en el 2020, se pueden detallar periodo a periodo datos que no cumplen ningún patrón con picos pronunciados como el mes de marzo donde la población salió a abastecerse de inventario de papel, a partir de ese momento la serie de tiempo presenta valores erráticos con valores muy bajos que pudieron presentarse por el desabastecimiento de inventario.


En este segundo bloque hablaremos de aquellas demandas que en ciertos periodos se presentan y en otros periodos no se presentan, a esta demanda la denominaremos demanda INTERMITENTE, en esta familia se encuentran indentificados dos tipos de patrones:

  • Grumosa (Lumpy)
  • Agrupada (Clumpled)

PATRÓN GRUMOSO (LUMPY): Se considera un patrón de demanda grumoso cuando las observaciones presentan intermitencia, pero cuando ocurre una observación se presenta con gran variabilidad. A continuación veremos el ejemplo de las exportación de armas y municiones en miles de dolares de la industria Colombiana de enero 2021 a febrero del 2023. Debido a que Colombia no es un país altamente exportador de armas, con frecuencia se observaran periodos en la serie de tiempo donde el valor es cero (0) o nulo (9 periodos de 26), pero cuando ocurren observaciones los datos pueden variar entre 20 mil dolares hasta 4.1 millones de dolares.

PATRÓN AGRUPADO (CLUMPED): Se considera un patrón de demanda agrupado cuando las observaciones presentan intermitencia, pero cuando ocurre una observación se presenta de manera constante. A continuación, veremos un ejemplo del consumo de un dispositivo medico utilizado en un procedimiento de angiografía en una institución de salud en Colombia. El producto es un CATETER DE ANGIOGRAFIA CON BALÓN DE 5mm, el cual están diseñados para ayudar a reducir las complicaciones de los pacientes durante los procedimientos de angiografía pulmonar y la angiografía femoral, su consumo se comporta de una manera intermitente con 12 periodos sin consumo, pero cuando ocurre la observación se presenta un consumo de 1 o 2 unidades por periodo.


Resumén Visual

En el grafíco 9, podemos visualizar a manera de resumen como se dividien los diferentes patrones de demanda conocidos por el momento, seguramente con el uso de redes neuronales o de inteligencia artificial iremos conociendo otros tipo de patrones

Ampliación y extenciones

En un proximo artículo publicaremos cual modelo de pronóstico usar de acuerdo al patrón de comportamiento de la serie de tiempo (emparejamiento o match), analizaremos diferentes aspectos como los resultados del error de estimación durante la etapa de entrenamiento del modelo de pronóstico, con cuantos datos de la serie de tiempo se deben emplear al momento de estimar la demanda, identificación de valores atípicos “outliers” como desorientadores de patrones, entre otros temas.

Webgrafia y Bases de datos ejemplos

https://hopelchen.tecnm.mx/principal/sylabus/fpdb/recursos/r128023.PDF

http://www.editorialdigitaltecdemonterrey.com/materialadicional/id196/cap1/patrones_tiempo.pdf

https://m.riunet.upv.es/bitstream/handle/10251/8322/tesisUPV3050.pdf?sequence=1&isAllowed=y

https://www.dane.gov.co/index.php/estadisticas-por-tema/comercio-internacional/exportaciones

https://www.dane.gov.co/index.php/estadisticas-por-tema/comercio-interno/encuesta-mensual-de-comercio-emc

Acerca de JOSÉ ANDRÉS ROSAS

Ingeniero Industrial, Especialista en Gerencia de Logística, Máster en Ingeniería Industrial y Especialista en métodos cuantitativos de predicción y pronósticos, docente de hora cátedra en postgrados en temas de Planeación, Compras, Inventarios y Almacenamiento. Expositor, conferencista, asesor y consultor empresarial.

correo electroníco: joserosassoluciones@hotmail.com

Read More
WhatsApp chat