Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 51 de 71
Journal of Scientific and Technological Research Industrial
Machine Learning para mejorar la toma de decisiones en una farmacia
hospitalaria de Lima, 2025
Machine Learning to improve decision-making in a hospital pharmacy in Lima, 2025
Ronald Raúl Fuentes Acuña
Universidad Nacional Federico Villarreal, Perú
2023044431@unfv.edu.pe
Resumen
El objetivo principal de la investigación fue determinar cómo el uso de machine learning
contribuye a mejorar los procesos de toma de decisiones en una farmacia hospitalaria de Lima
durante el año 2025. Este estudio es del tipo aplicada desde un enfoque cuantitativo y de nivel
descriptivo, empleando un diseño preexperimental. La población estuvo conformada por datos
históricos de ventas de medicamentos, considerándose una muestra representativa para el análisis
mediante técnicas de series temporales. En cuanto al procedimiento, se aplicaron modelos
ARIMA, previa evaluación de criterios de estacionariedad, autocorrelación y estacionalidad, y
su validación se realizó mediante métricas de error como RMSE y MAE. Los resultados
evidenciaron una mejora significativa en la precisión de la predicción de la demanda de
medicamentos, así como en el control de inventarios, reduciendo los niveles de
desabastecimiento y sobre stock. Asimismo, las pruebas de hipótesis evidenciaron un valor sig.
menor a 0.05 bajo un nivel de confianza del 95%. Se concluye que la implementación de modelos
de machine learning basados en series temporales es efectiva para optimizar la gestión
farmacéutica hospitalaria, mejorando la eficiencia operativa y la calidad de la toma de decisiones,
siempre que se cuente con una adecuada gestión de datos y soporte institucional.
Palabras claves: Machine Learning, ARIMA, Predicción de demanda, Toma de decisiones,
Farmacia hospitalaria.
Abstract
The main objective of this research was to determine how the use of machine learning contributes
to improving decision-making processes in a hospital pharmacy in Lima during the year 2025.
The study was classified as applied, with a quantitative and descriptive approach, employing a
pre-experimental single-group design with pretestposttest measurements, which allowed the
evaluation of the impact of the analytical proposal. The population consisted of historical
medication sales data, considering a representative sample for analysis through time series
techniques. Regarding the procedure, ARIMA models were applied after evaluating stationarity,
autocorrelation, and seasonality criteria, and their validation was carried out using error metrics
such as RMSE and MAE. The results showed a significant improvement in the accuracy of
medication demand forecasting, as well as in inventory control, reducing stockouts and overstock
levels. Likewise, hypothesis testing showed significance values of p < 0.05, with a 95%
confidence level, confirming statistically significant differences between the pretest and posttest.
It is concluded that the implementation of machine learning models based on time series is
effective in optimizing hospital pharmaceutical management, improving operational efficiency
and the quality of decision-making, provided that adequate data management and institutional
support are ensured.
Keywords: Machine Learning, ARIMA, Demand Forecasting, Make decisions, Hospital
Pharmacy.
Publicado: 2026-04-16
Aceptado: 2026-04-15
Recibido: 2026-02-27
Open Access
Article scientific
https://doi.org/10.47422/jstri.v7i1.75
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 52 de 71
Journal of Scientific and Technological Research Industrial
Introducción
La gestión eficiente de los medicamentos en las farmacias
hospitalarias constituye un componente crítico dentro del
sistema de salud, ya que, de la adecuada planificación,
control y toma de decisiones depende tanto la eficiencia
operativa de las instituciones como la continuidad de los
tratamientos y la seguridad del paciente (Manrique, 2025).
Sin embargo, en diversos hospitales de Lima, este proceso
presenta importantes limitaciones, asociadas al incremento
de la demanda asistencial y la alta variabilidad en el
consumo de medicamentos (Vásquez, 2025).
En este contexto, la toma de decisiones en la gestión de
medicamentos continúa sustentándose en criterios
empíricos y experiencia del personal, lo cual resulta
insuficiente frente a escenarios caracterizados por grandes
volúmenes de datos. La ausencia de herramientas
tecnológicas avanzadas limita la capacidad de analizar esta
información de manera integral y de anticiparse a
problemas de abastecimiento (Lazo y Moreano, 2021). A
pesar del avance de las Tecnologías de la Información y, en
particular, de las técnicas de machine learning, muchas
farmacias hospitalarias aún no han incorporado estas
herramientas de manera sistemática, evidenciando una
brecha entre la disponibilidad de datos y su uso efectivo
para la toma de decisiones (Madariaga, 2021). En
consecuencia, surge la necesidad de implementar modelos
predictivos que permitan analizar patrones de consumo y
mejorar la calidad de la información para la toma de
decisiones (González y Delgado, 2024).
En la práctica, los sistemas de información no son
analizados de manera integral y ello puede impedir la
detección de patrones o anticipación de situaciones críticas
como quiebres de stock (Mendoza y Salazar, 2022). Como
consecuencia, se generan deficiencias operativas
recurrentes, tales como desabastecimientos de
medicamentos esenciales, retrasos en la reposición y
dificultades en la planificación presupuestaria (Cortés,
2022).
En este sentido, el desarrollo de técnicas de machine
learning representa una oportunidad para optimizar la
gestión de medicamentos mediante el análisis inteligente.
No obstante, su adopción en el contexto de las farmacias
hospitalarias de Lima aún es limitada, lo que evidencia la
necesidad de investigaciones aplicadas que demuestren su
efectividad en escenarios reales (Inga et al., 2023). Por ello,
se plantea como problema general determinar en qué
medida el uso de machine learning contribuye a mejorar los
procesos de toma de decisiones en una farmacia
hospitalaria de Lima durante el año 2025, con objetivos
específicos orientados a incrementar la precisión en la
predicción de la demanda, mejorar el control de
inventarios, reducir los desabastecimientos y sobre stock, y
elevar la calidad de la información utilizada en la gestión
farmacéutica.
Diversos estudios internacionales y nacionales respaldan la
pertinencia de abordar esta problemática mediante modelos
predictivos y técnicas de ML. Investigaciones como las de
(Shen, 2024) evidencian mejoras significativas en la
eficiencia de la cadena de suministro mediante la
implementación de modelos basados en IA. Mientras que
en otro estudio se demostró que la capacidad de los
modelos predictivos para anticipar desabastecimientos es
aceptable (Pall, 2023). De manera similar, estudios como
los de (Tri, 2024) y (Fourkiotis, 2024) destacaron el
desempeño superior de algoritmos avanzados en la
predicción de la demanda farmacéutica. En el ámbito
nacional, investigaciones como las de (Quispe, 2021),
(Ramos, 2022) y (Salazar, 2023) evidenciaron mejoras
significativas en la gestión farmacéutica tras la
implementación de modelos de ML, los cuales redujeron
los errores de predicción, o mejoraron la calidad de la
información para la toma de decisiones.
La justificación del estudio se sustenta en tres dimensiones:
teórica, práctica y metodológica. Desde el punto de vista
teórico, la investigación contribuye al desarrollo del
conocimiento científico. En el ámbito práctico, responde a
la necesidad de mejorar los procesos de gestión de
medicamentos proporcionando una herramienta
tecnológica que mejora la calidad del servicio. Finalmente,
desde la perspectiva metodológica, se justifica como una
investigación aplicada con enfoque cuantitativo y diseño
preexperimental orientada a evaluar el impacto de de la
solución propuesta.
Marco Teórico
2.1. Gestión de medicamentos en la farmacia hospitalaria
La farmacia hospitalaria constituye una unidad clínico
administrativa encargada de garantizar la selección,
adquisición, almacenamiento, distribución y uso racional
de los medicamentos dentro de una institución de salud
(Soha, 2024). Su adecuada gestión es fundamental para
asegurar la continuidad de los tratamientos y la eficiencia
en el uso de los recursos económicos. En este contexto, la
gestión de medicamentos involucra procesos críticos como
la planificación de la demanda, el control de inventarios y
la reducción de pérdidas por vencimiento.
2.2. Toma de decisiones en la gestión farmacéutica
hospitalaria
Esta estuvo sustentada tradicionalmente en la experiencia
del personal, el análisis de registros históricos y el uso de
métodos estadísticos básicos (Leixiao, 2024). No obstante,
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 53 de 71
Journal of Scientific and Technological Research Industrial
este enfoque resulta limitado frente a la complejidad actual
del entorno hospitalario.
2.3. Sistemas de información y analítica de datos en salud
Estos permiten el registro y almacenamiento de grandes
volúmenes de datos relacionados con prescripciones
médicas, dispensación y consumo de medicamentos
(Abrar, 2026). En este sentido, la analítica de datos en salud
busca transformar dichos registros en información útil para
la toma de decisiones (Madhumathi, 2025).
2.4. Machine Learning en la gestión de medicamentos
Esta es una rama de la IA que permite a los sistemas
aprender a partir de datos históricos e identificar patrones
o generar predicciones sin necesidad de programación
(Bharech et al., 2025). Sus principales enfoques incluyen el
aprendizaje supervisado, no supervisado y por refuerzo
(Recupito, 2025).
2.5. Beneficios del uso de Machine Learning en el sector
salud
Algunos de estos beneficios son: la mejora en la precisión
de la toma de decisiones, la optimización de inventarios
(Bader, 2025). Asimismo, estas tecnologías permiten
adoptar un enfoque proactivo (Babic et al., 2025).
2.6. Deep Learning y su aplicación en la predicción de
demanda
El deep learning es una subárea de la IA basada en redes
neuronales profundas que permiten modelar relaciones
complejas y no lineales en grandes volúmenes de datos
(Paramesha et al., 2025). A diferencia de los modelos
tradicionales, el DL aprende representaciones jerárquicas
de los datos de forma automática (Tran et al., 2025). En el
ámbito hospitalario, ha demostrado un alto desempeño en
tareas de predicción y análisis de series temporales (Wei et
al., 2025).
2.7. Transformación digital en el sector salud
Esto implica la incorporación de tecnologías digitales para
mejorar procesos, servicios y modelos de gestión (Tu y He,
2025). En el sector salud, este proceso busca optimizar la
eficiencia operativa y la calidad de la atención (George y
Antoaneta, 2025). La adopción de machine learning en la
farmacia hospitalaria forma parte de esta transformación,
al permitir una gestión basada en datos.
2.8. Calidad del servicio en salud
La calidad del servicio en salud se refiere a la capacidad de
las instituciones para satisfacer las necesidades de los
pacientes de manera oportuna, segura y eficiente (Jaafar et
al., 2024). En este contexto, la disponibilidad de
medicamentos constituye un componente crítico porque
puede afectar directamente la continuidad de los
tratamientos (Kenyon, 2025).
2.9. Analítica predictiva aplicada a la gestión de inventarios
La analítica predictiva integra modelos estadísticos
avanzados y técnicas de ML (Kwon et al., 2021). Esto
contribuye a reducir pérdidas económicas y garantizar la
continuidad del tratamiento (Zhang et al., 2022).
2.10. Toma de decisiones basada en datos (DDDM)
Esta se fundamenta en el uso sistemático de información
analizada para orientar decisiones organizacionales
(Provost & Fawcett, 2021). En el sector salud, este enfoque
permite mejorar la planificación y el control de procesos
(Raghupathi & Raghupathi, 2020).
2.11. Modelos predictivos en la planificación farmacéutica
Estos permiten analizar múltiples variables y establecer
relaciones complejas en los datos, superando las
limitaciones de los métodos tradicionales (Zhang et al.,
2022). En la farmacia hospitalaria, estos modelos facilitan
la planificación de compras o la reducción de eventos
críticos (Fourkiotis & Tsadiras, 2024).
2.12. Gestión de riesgos operativos mediante inteligencia
artificial
Esta gestión permite identificar y mitigar riesgos
operativos mediante el análisis predictivo y la detección de
anomalías en grandes volúmenes de datos (Wang et al.,
2023). En la farmacia hospitalaria, esto se traduce en la
capacidad de anticipar desabastecimientos y mejorar la
resiliencia operativa (González-Pérez et al., 2024).
2.13. Interoperabilidad de sistemas en entornos
hospitalarios
Esta permite la integración de sistemas clínicos,
administrativos y farmacéuticos, facilitando el acceso a
datos confiables y actualizados (Raghupathi & Raghupathi,
2020).
2.14. Impacto del Machine Learning en la eficiencia del
servicio farmacéutico
El uso de ML ha demostrado mejorar indicadores clave
como la rotación de inventarios, los tiempos de reposición
y la reducción de pérdidas económicas (González-Pérez et
al., 2024). Asimismo, ML contribuye a mejorar la calidad
de la información (Kwon et al., 2021).
2.15. Gobernanza de datos en el sector salud
La gobernanza de datos comprende el conjunto de políticas
y procesos que garantizan la calidad, seguridad y uso
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 54 de 71
Journal of Scientific and Technological Research Industrial
adecuado de la información (Abouelmehdi et al., 2021). En
el ámbito hospitalario, una adecuada gestión de datos es
esencial para asegurar la confiabilidad de los modelos de
ML (Dash et al., 2021).
2.16. Ética en el uso de inteligencia artificial en salud
Estos desafíos pueden estar relacionados con la
transparencia, la privacidad y la responsabilidad en la toma
de decisiones automatizada (Floridi et al., 2021). En la
farmacia hospitalaria, los modelos deben ser explicables y
auditables, garantizando decisiones responsables y seguras
(Morley et al., 2020).
2.17. Calidad y preparación de datos
La calidad de los datos es un factor crítico en el desempeño
de los modelos de ML. Datos incompletos o inconsistentes
pueden afectar la precisión de las predicciones (Batini et
al., 2022). Por ello, es necesario realizar procesos de
limpieza, transformación y validación antes de su uso
(Shmueli et al., 2021).
2.18. Madurez digital en organizaciones hospitalarias
La madurez digital se refiere al nivel de integración de
tecnologías en los procesos organizacionales (Kane et al.,
2021). En farmacias hospitalarias, una mayor madurez
digital mejora su sostenibilidad (Vial, 2021).
2.19. Aceptación tecnológica del personal de salud
Esta aceptación depende de la percepción de utilidad y
facilidad de uso por parte de los usuarios (Davis, 1989). En
el entorno hospitalario, la aceptación del personal es clave
para el éxito del ML y por ello es necesario las
capacitaciones (Venkatesh et al., 2022).
2.20. Sostenibilidad y mejora continua en la gestión
farmacéutica
El uso de ML permite la mejora continua mediante la
evaluación constante del desempeño y la actualización de
modelos con nuevos datos, contribuyendo a una gestión
más resiliente y eficiente (Porter & Lee, 2021).
Resultados
3.2.1. Estadísticas descriptivas de la demanda de
medicamentos
Se calcularon medidas estadísticas básicas para cada
categoría terapéutica del conjunto de datos. Estas medidas
permitieron evaluar la variabilidad de la demanda y
detectar diferencias entre los distintos grupos de
medicamentos.
Figura 1. Estadísticas descriptivas de las variables
mensuales del estudio
A partir de la anterior figura se evidencia que los valores
mínimos y máximos registraron rangos amplios en ciertas
variables. Por ejemplo, la columna ‘N02BE’ presentó un
valor mínimo de 0 y un máximo de 1856.82, mientras que
la columna ‘N05C’ se mantuvo en un rango más reducido,
entre 0 y 50.
Además, los percentiles 25, 50 y 75 permitieron observar
la distribución de los datos, mostrando que la mitad de las
observaciones se concentró en valores intermedios, con
algunas variables como la columna ‘R03’ alcanzando un
75% de los datos por debajo de 216 y otras como la
columna ‘M01AE’ en 128.23.
En general, este análisis proporcionó información inicial
sobre la tendencia central, dispersión y rango de las
variables mensuales, lo cual fue fundamental para la
comprensión exploratoria de los datos y la planificación de
análisis posteriores.
3.2.2. Análisis de patrones temporales
3.2.2.1. Visualización de series temporales por categoría
ATC
Se graficaron las series temporales correspondientes a cada
categoría para analizar la evolución histórica de la demanda
de medicamentos. Los gráficos permitieron identificar
tendencias generales, estacionalidad, quiebres estructurales
y posibles valores atípicos en los datos de consumo
mensual. A continuación, se describen los principales
patrones observados para cada categoría:
1. M01AB Anti-inflamatorios derivados del ácido
acético
La serie mostró una tendencia creciente moderada
durante los primeros años, con picos de demanda
intermitentes.
Se observó un quiebre temporal alrededor del año de
2023, en esta se evidenció una caída abrupta en la
dispensación seguida de una recuperación gradual.
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 55 de 71
Journal of Scientific and Technological Research Industrial
Figura 2. Serie temporal mensual de la demanda de
M01AB (antiinflamatorios de ácido acético)
2. M01AE Antiinflamatorios derivados del ácido
propiónico
La serie evidenció variabilidad durante los meses de
manera considerable, en esta serie se manifestó con
varios picos agudos de demanda. Se detectaron
quiebres similares a la gráfica de “M01AB” en 2023 y
picos de consumo inusuales en 2025, esto reflejó
episodios de alta rotación que podrían relacionarse con
estacionalidad o necesidades específicas de pacientes.
Figura 3. Serie temporal mensual de la demanda de
M01AE (anti-inflamatorios ácidos propiónicos)
3. N02BA Analgésicos derivados del ácido salicílico
La demanda mostró tendencia estable, pero con
variaciones puntuales. Esta dinámica sugiere que el
consumo se mantiene constante en general.
Figura 4. Serie temporal mensual de la demanda de
N02BA (analgésicos ácido salicílico)
4. N02BE Analgésicos pirazolonas
La serie presentó gran amplitud en los valores de venta,
con picos altos y caídas abruptas, mostrando alta
volatilidad. Se identificaron ciclos de consumo
recurrentes y quiebres en 2023.
Figura 5. Serie temporal mensual de la demanda de
N02BE (analgésicos pirazolonas)
5. N05B Ansiolíticos
La demanda mostró tendencias ascendentes y
descendentes intermitentes, con algunos picos
importantes, reflejando variaciones estacionales y
posibles efectos de cambios en protocolos médicos. La
serie evidenció que la demanda no es uniforme, sino
sensible a episodios específicos de consumo
hospitalario.
Figura 6. Serie temporal mensual de la demanda de N05B
(ansiolíticos)
6. N05C Hipnóticos y sedantes
La serie evidenció un patrón estable de bajo volumen,
con pequeñas oscilaciones intermensuales. La
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 56 de 71
Journal of Scientific and Technological Research Industrial
variabilidad fue mínima comparada con otras
categorías, lo que indica un consumo más predecible y
menos sujeto a picos extremos.
Figura 7. Serie temporal mensual de la demanda de N05C
(hipnóticos y sedantes)
7. R03 Medicamentos para enfermedades
respiratorias
La serie presentó gran variabilidad, con picos
pronunciados y descensos abruptos, especialmente
alrededor de 2023 y 2025.
Este comportamiento refleja la influencia de factores
estacionales, como brotes respiratorios, sobre la
demanda.
Figura 8. Serie temporal mensual de la demanda de R03
(medicamentos respiratorios)
8. R06 Antihistamínicos
La serie mostró ciclos marcados con picos regulares y
caídas abruptas, reflejando patrones estacionales
consistentes, probablemente asociados a cambios en la
incidencia de alergias o condiciones respiratorias en la
población hospitalaria.
Figura 9. Serie temporal mensual de la demanda de R06
(antihistamínicos)
4.2.2.2. Identificación de tendencias y variaciones en la
demanda
Con el fin de analizar la demanda agregada de todos los
medicamentos incluidos en el estudio, se calculó una
variable denominada total_sales, que representó la suma
mensual de las dispensaciones de todas las categorías
terapéuticas. Este indicador permitió observar la dinámica
global de consumo en la farmacia hospitalaria, identificar
periodos de alta presión asistencial y detectar posibles
quiebres estructurales o picos de demanda simultáneos en
múltiples grupos de medicamentos.
En la figura 15 se muestra la evolución de las ventas totales
mensuales desde 2020 hasta 2025. Se observaron
incrementos y disminuciones marcadas a lo largo del
periodo, con picos importantes en años específicos que
reflejan tanto la estacionalidad como eventos
excepcionales que afectaron el consumo global. Asimismo,
se identificaron descensos abruptos en 2023 y 2025, lo que
evidencia la volatilidad en la demanda agregada y resalta la
importancia de modelos predictivos que permitan anticipar
estos cambios.
Figura 10. Evolución mensual de las ventas totales de
medicamentos en la farmacia hospitalaria
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 57 de 71
Journal of Scientific and Technological Research Industrial
La figura anterior que la demanda agregada presentó un
comportamiento fluctuante con incrementos y descensos a
lo largo del tiempo.
Se identificaron picos de demanda significativos en
algunos meses, especialmente alrededor de 2021, 2022 y
2025, lo que evidenció periodos de mayor presión
asistencial y mayor consumo de medicamentos.
Asimismo, se detectó una caída abrupta en 2023, seguida
de una recuperación progresiva en los meses posteriores.
En general, la serie temporal reflejó variabilidad y posibles
patrones estacionales en la demanda agregada, lo cual
evidencia la importancia de emplear técnicas analíticas y
modelos predictivos que permitan anticipar estos cambios
y mejorar la planificación y gestión del inventario.
3.2.3. Detección de estacionalidad
La detección de estacionalidad permitió evaluar si el
comportamiento de la demanda presentaba ciclos regulares
a lo largo del tiempo, lo cual resulta fundamental para la
construcción de modelos predictivos en series temporales.
Para este análisis se utilizaron diferentes técnicas
estadísticas: el suavizamiento mediante media móvil
simple (SMA), el test de estacionariedad de Dickey-Fuller
aumentado (ADF) y el análisis de autocorrelación (ACF) y
autocorrelación parcial (PACF).
Estas herramientas permitieron identificar tendencias
subyacentes, patrones cíclicos y la estructura temporal de
la serie de datos.
4.2.3.1. Análisis mediante media móvil (Simple Moving
Average)
Para suavizar las fluctuaciones de corto plazo y resaltar la
tendencia de la serie temporal, se aplicó la técnica de media
móvil simple (SMA) utilizando una sección de cuatro
periodos mensuales.
Esta técnica, en términos matemáticos, se expresa:




Descripción de la fórmula:
: representa al tamaño de la sección.
: corresponde al valor observado en un período .
Figura 11. Serie temporal de ventas mensuales de
medicamentos con media móvil simple (SMA)
A partir de la figura anterior se observó que la demanda
presentó fluctuaciones importantes entre los años
analizados, períodos que presentan alto consumo y
descensos abruptos en otros. Sin embargo, la línea de
media móvil permitió identificar una tendencia general
oscilante con ciclos recurrentes y esto sugiere la presencia
de patrones estacionales en el comportamiento de la
demanda. Asimismo, se observó que los valores de la serie
no se mantuvieron alrededor de una media constante a lo
largo del tiempo, lo cual sugiere que la serie no es
estrictamente estacionaria. Este resultado fue corroborado
mediante el test de Dickey-Fuller aumentado (ADF)
aplicado a la serie original.
Figura 12. Primera prueba estacionaria de la serie de
datos
Figura 13. Segunda prueba estacionaria de la serie de
datos
En ambos casos se obtuvieron valores de p-value cercanos
o superiores a 0.05, lo que indica que no se puede rechazar
la hipótesis nula de presencia de raíz unitaria, confirmando
que la serie presenta no estacionariedad.
4.2.3.2. Identificación de patrones cíclicos en la demanda
de medicamentos
Para analizar la dependencia temporal entre los valores de
la serie y detectar posibles patrones cíclicos, se realizaron
gráficos de función de autocorrelación (ACF) y función de
autocorrelación parcial (PACF). Estas herramientas
permiten evaluar la relación entre los valores actuales de la
serie y sus valores pasados en distintos rezagos temporales.
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 58 de 71
Journal of Scientific and Technological Research Industrial
Figura 14. Función de autocorrelación (ACF) y
autocorrelación parcial (PACF) de las ventas mensuales
de medicamentos
A partir de la interpretación conjunta de los gráficos ACF
y PACF presentados en la figura anterior, se identificó que
el modelo ARMA (1,1) podría ser adecuado para
representar la dinámica temporal de la demanda agregada
de medicamentos. Este tipo de modelo combina un
componente autorregresivo (AR) y un componente de
media móvil (MA), permitiendo capturar tanto la
dependencia temporal directa como los efectos de los
errores pasados.
En conjunto, los resultados del análisis de autocorrelación
confirmaron la existencia de patrones cíclicos en la
demanda de medicamentos, lo que evidencia que el
comportamiento de la serie no es aleatorio, sino que sigue
estructuras temporales que pueden ser modeladas y
utilizadas para fines de predicción.
3.3. Preparación del dataset para el modelado predictivo
Para modelar la demanda total de medicamentos, se
evaluaron distintas alternativas dentro del enfoque de series
temporales, considerando principalmente modelos
autorregresivos y de medias móviles.
Inicialmente, a partir del análisis de las funciones de
autocorrelación (ACF) y autocorrelación parcial (PACF),
se planteó como modelo candidato un modelo ARMA
(1,1), dado que ambas funciones mostraban un corte
significativo en el rezago 1. Sin embargo, al realizar la
estimación del modelo, se observó que los coeficientes
asociados al componente de media móvil (MA) no
resultaron estadísticamente significativos (p-value > 0.05),
por lo que se descartó dicho componente.
En consecuencia, se optó por un modelo autorregresivo de
orden 1, AR (1), el cual permite capturar la dependencia
temporal de la demanda en función de su valor
inmediatamente anterior.
3.3.1. Transformación de la serie temporal
Con el objetivo de garantizar la correcta aplicación de
técnicas de series temporales, se realizó la transformación
estructural del dataset mensual, asegurando que los datos
se encontraran organizados en función del tiempo y listos
para el modelamiento predictivo.
3.3.1.1. Conversión de la fecha a índice temporal
Posteriormente, a la variable de la fecha se estableció como
índice del dataset, transformando la estructura tabular en
una serie temporal indexada.
Esta transformación permitió que cada observación
quedara asociada a un punto específico en el tiempo, lo cual
es fundamental para aplicar modelos autorregresivos y
analizar patrones temporales como tendencia y
estacionalidad.
3.3.1.2. Organización cronológica de los registros
Luego que la variable de fecha fue establecida como índice
del dataset, se procedió a verificar y garantizar el orden
cronológico de los registros. Para ello, se ordenaron las
observaciones en orden ascendente para asegurar que los
datos más antiguos se ubicaran al inicio de la serie y los
más recientes al final.
Esto fue fundamental para preservar la coherencia temporal
del análisis porque los modelos de series temporales
requieren que las observaciones sigan una secuencia lógica
en el tiempo. Adicionalmente, se verificó la continuidad
temporal de los registros, identificando posibles periodos
faltantes que pudieran alterar la estructura de la serie.
3.3.2. División del dataset
Posterior a la transformación de la serie temporal, se realizó
la división del dataset con el objetivo de evaluar el
desempeño del modelo predictivo en condiciones
controladas.
Este proceso consistió en separar los datos en dos
subconjuntos: entrenamiento y prueba.
A diferencia de los modelos tradicionales de ML, donde la
división suele realizarse de manera aleatoria, en este caso
se respetó la secuencia temporal de los datos. Esta decisión
metodológica permitió evitar la fuga de información
garantizando que el modelo únicamente aprendiera de
datos pasados para predecir valores futuros.
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 59 de 71
Journal of Scientific and Technological Research Industrial
4.3.2.1. Conjunto de entrenamiento (Train Set)
El conjunto de entrenamiento estuvo conformado por la
mayor parte de los registros históricos del dataset,
específicamente aquellos comprendidos hasta la fecha de
corte establecida. Durante esta etapa, el modelo ajustó sus
parámetros internos para representar la dinámica temporal
de la serie.
4.3.2.2. Conjunto de prueba (Test Set)
El conjunto de prueba estuvo constituido por los registros
posteriores a la fecha de corte, los cuales no fueron
utilizados durante el entrenamiento del modelo. Este
subconjunto permitió evaluar la capacidad predictiva del
modelo frente a datos nuevos, simulando su desempeño en
un entorno real.
Figura 15. Establecimiento del conjunto de entrenamiento
y prueba del dataset
3.3.3. Selección de variables para el modelo
La selección de variables constituyó un paso fundamental
en la construcción del modelo predictivo, ya que permitió
definir los elementos que influirían directamente en la
estimación de la demanda de medicamentos. Para el caso
de esta investigación, se priorizó el uso de variables que
capturaran la dependencia temporal de la serie,
simplificando el modelo sin perder capacidad explicativa.
3.3.3.1. Variables explicativas utilizadas en el modelo
En el presente estudio, las variables explicativas estuvieron
conformadas por los valores rezagados de la variable
objetivo, es decir, la demanda de medicamentos en
periodos anteriores. Específicamente, se utilizó el valor
correspondiente al periodo inmediatamente anterior como
principal variable explicativa, lo cual permitió modelar la
relación directa entre la demanda actual y la pasada.
4.3.3.2. Variable objetivo: demanda de medicamentos
La variable objetivo del modelo fue la demanda total de
medicamentos, representada por la variable total_sales.
Esta variable fue construida mediante la agregación de las
distintas categorías terapéuticas clasificadas según el
sistema ATC. La utilización de una variable agregada
permitió simplificar el análisis y centrarse en el
comportamiento global de la demanda, lo cual resulta
relevante.
3.4. Implementación del modelo de Machine Learning para
predicción de demanda
En esta etapa se implementó un modelo de series
temporales con el objetivo de predecir la demanda futura
de medicamentos a partir de la variable agregada
total_sales. El enfoque adoptado fue de tipo autorregresivo,
considerando que los valores históricos de la demanda
contienen información relevante para explicar su
comportamiento futuro. Previo al entrenamiento de los
modelos, fue necesario verificar la calidad de los datos
utilizados en el dataset, y con ello se identificó la presencia
de valores faltantes (NaN) en la serie. Estos fueron tratados
mediante imputación utilizando el método de propagación
hacia adelante (forward fill).
Figura 16. Verificación de valores inválidos en la serie
total_sales
Figura 17. Proceso de imputación de valores faltantes
mediante forward fill
3.4.1. Modelo autorregresivo (AR)
Este modelo fue seleccionado como una técnica adecuada
para modelar la dinámica temporal de la demanda de
medicamentos, debido a la dependencia observada entre los
valores actuales y los valores pasados de la serie.
A partir del análisis previo de autocorrelación, se
determinó que este tipo de modelos eran suficientes para
capturar la estructura temporal de los datos, descartando la
inclusión de componentes de media móvil debido a su falta
de significancia estadística.
3.4.1.1. Configuración del modelo AR
El modelo se configuró utilizando la función AutoReg,
considerando como variable de entrada la serie temporal
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 60 de 71
Journal of Scientific and Technological Research Industrial
total_sales”. Se estableció un rezago de orden 1 (lags = 1),
lo que implica que el valor actual de la demanda depende
únicamente del valor inmediatamente anterior.
Matemáticamente, el modelo se expresó de la siguiente
forma:
 
Donde:
: demanda de medicamentos en el periodo actual
: demanda en el periodo anterior
: constante del modelo
: coeficiente autorregresivo
: término de error
Esta configuración permitió capturar la inercia de la serie
temporal, es decir, la influencia directa del comportamiento
pasado sobre la demanda futura.
Figura 18. Configuración del modelo autorregresivo AR
3.4.1.2. Resultados del entrenamiento del modelo
El entrenamiento del modelo AR (1) generó resultados
estadísticamente significativos, evidenciando que la
demanda de medicamentos presenta una dependencia
temporal importante.
Figura 19. Resultados del modelo AutoReg
A partir de la figura anterior, los principales resultados
obtenidos fueron:
Coeficiente autoregresivo () = 0.3607: Este valor
indica que aproximadamente el 36.07% de la demanda
actual puede explicarse por la demanda del periodo
anterior.
Constante ()=1170.24: Representa el nviel base de la
demanda cuando no se considera el efecto del rezago:
 del coeficiente AR = 0.002: Al ser menor a
0.05, se concluyó ue el coeficiente es
estadísticamente significativo, validando de esta
manera a la relevancia del modelo.
Criterios de información (AIC=994.003): Indicaron un
ajuste adecuado del modelo a los datos.
A partir de estos resultados, el modelo estimado se expresó
como:

Este resultado evidenció que la serie de demanda no es
aleatoria, sino que presenta una estructura temporal que
puede ser aprovechada para realizar predicciones.
Finalmente, se generó el pronóstico de la demanda para los
periodos futuros, el cual fue comparado con los valores
reales del conjunto de prueba.
Figura 20. Pronóstico de demanda de medicamentos
usando modelo AR
El gráfico mostró que el modelo logra capturar la tendencia
general de la serie, aunque presenta limitaciones para
reproducir variaciones abruptas, lo cual es característico de
modelos autorregresivos simples.
Sin embargo, su desempeño fue adecuado como
aproximación inicial para la predicción de la demanda en
el contexto hospitalario.
3.4.2. Modelo ARIMA
Con el objetivo de mejorar la capacidad predictiva del
modelo autorregresivo simple, se implementó un modelo
ARIMA (AutoRegressive Integrated Moving Average), el
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 61 de 71
Journal of Scientific and Technological Research Industrial
cual permite capturar no solo la dependencia temporal, sino
también la tendencia y los componentes de error presentes
en la serie.
Este modelo resulta adecuado para series no estacionarias,
como la demanda de medicamentos observada, ya que
incorpora un proceso de diferenciación que elimina la
tendencia y estabiliza la media de la serie.
3.4.2.1. Ajuste del modelo ARIMA
El modelo ARIMA fue configurado con parámetros (p, d,
q) = (1, 1, 1), definidos a partir del análisis previo de
autocorrelación (ACF) y autocorrelación parcial (PACF),
así como de la necesidad de aplicar una diferenciación de
primer orden para lograr la estacionariedad.
Matemáticamente, el modelo se expresa como:
   
Donde cada uno de sus componentes se interpreta de la
siguiente manera:
: representa la demanda de medicamentos en el
periodo actual ttt, medida a través de la variable
agregada total_sales.
: corresponde a la serie diferenciada, definida
como:
 
Este término permite eliminar la tendencia de la serie y
garantizar la estacionariedad, condición necesaria para la
correcta aplicación del modelo ARIMA.
: es la constante del modelo, la cual representa el nivel
promedio de la serie diferenciada cuando los demás
términos son nulos.
: es el coeficiente autorregresivo de primer orden
(AR), que mide la influencia del cambio en la demanda
del periodo anterior () sobre el cambio actual.
Este parámetro captura la persistencia temporal de la
serie.
: es el coeficiente de media móvil (MA), el cual
modela el impacto del error del periodo anterior ()
sobre el valor actual.
Este componente permite corregir errores pasados y
mejorar la precisión del modelo.
: representa el término de error aleatorio en el
periodo actual, el cual se asume como ruido blanco con
media cero y varianza constante.
=1: indica que el modelo utiliza un rezago
autorregresivo de primer orden.
=1: señala que se aplicó una diferenciación de primer
orden para estabilizar la serie.
=1: indica la inclusión de un término de media móvil
de primer orden.
El ajuste del modelo se realizó utilizando el conjunto de
entrenamiento, comprendido hasta diciembre de 2024, lo
que permitió estimar los parámetros del modelo sin
comprometer la validez de la evaluación posterior.
4.4.2.2. Predicción de la demanda futura de medicamentos
Una vez ajustado el modelo, se generaron predicciones
para el conjunto de prueba correspondiente al año 2025,
utilizando la función forecast().
Figura 21. Pronóstico de demanda mediante modelo
ARIMA
En la figura se observan tres componentes principales:
Datos de entrenamiento (Train Data)
Datos reales del conjunto de prueba (True Test Data)
Predicción generada por el modelo (ARIMA Forecast)
El modelo ARIMA mostró una tendencia general de la
serie, generando predicciones relativamente estables.
Sin embargo, se evidenció una limitación importante en la
capacidad del modelo para reproducir variaciones abruptas
o cambios bruscos en la demanda.
En particular, se observó que el modelo tiende a suavizar
la serie, generando predicciones menos volátiles en
comparación con los valores reales.
3.4.3. Comparación entre valores observados y predichos
Con el fin de evaluar el desempeño del modelo, se realizó
una comparación directa entre lo observado y lo predicho.
La evaluación gráfica permitió comparar la capacidad
predictiva de los modelos ARIMA y SARIMA frente a los
datos reales de demanda de medicamentos. Se presentan
tres gráficas principales:
Journal of Scientific and Technological Research
Industrial
ISSNe: 2961-211X
PROF-JSTRI-V-00
Vol. 7 N.º 1
(January - June, 2026)
Página 62 de 71
Journal of Scientific and Technological Research Industrial
Figura 22. Pronóstico de demanda mensual de
medicamentos mediante el modelo ARIMA
De la figura anterior se muestra que la línea azul representa
los datos de entrenamiento, la línea naranja los valores
reales de prueba, y la línea verde el pronóstico generado
por ARIMA. Los picos de demanda elevados en ciertos
meses no se reflejan completamente en el pronóstico, lo
que indica que el modelo ARIMA, sin componentes
estacionales explícitos, predice bien la tendencia central,
pero tiene limitaciones en periodos con variaciones
extremas.
Figura 23. Pronóstico de demanda mensual de
medicamentos mediante el modelo SARIMA
A partir de la figura anterior se evidencia que la línea verde
representa el pronóstico SARIMA.
A diferencia del modelo ARIMA, el modelo SARIMA
logra reproducir de manera más precisa los picos y valles
estacionales de la curva de la demanda mensual y esto
refleja la capacidad del modelo para incorporar patrones
periódicos de 12 meses.
En estas figuras, la comparación visual permite observar
que SARIMA ajusta mejor la amplitud de las oscilaciones
estacionales, mostrando menor desviación respecto a los
valores reales.
Aunque en el modelo ARIAM se subestima la demanda en
meses con picos pronunciados, evidenciando la ventaja de
incluir estacionalidad en contextos de demanda
hospitalaria variable.
3.5. Evaluación del desempeño del modelo
La evaluación cuantitativa del desempeño de los modelos
se realizó mediante métricas de error estándar: RMSE y
MAE.
Estas métricas permiten cuantificar la discrepancia entre
los valores pronosticados y los observados, y son
esenciales para validar la utilidad del modelo en la
planificación de inventarios y gestión de medicamentos.
3.5.1. Métricas de evaluación
Para cuantificar el error de predicción se calcularon las
métricas más representativas:
3.5.1.1. RMSE (Root Mean Squared Error)
El RMSE indica la desviación promedio entre los valores
reales y los predichos, penalizando errores grandes.
Valores menores reflejan un mejor ajuste del modelo.
ARIMA: 5.82 %
SARIMA: 3.76 %
3.5.1.2. MAE (Mean Absolute Error)
El MAE muestra el error promedio absoluto, representando
la magnitud de los errores sin considerar su dirección.
Valores más bajos indican mayor precisión.
ARIMA: 5.14 %
SARIMA: 3.42 %
3.5.1.3. Interpretación de las métricas de error
Los resultados indican que SARIMA presenta menores
errores tanto en RMSE como en MAE respecto a ARIMA,
lo que confirma que la incorporación de estacionalidad
permite capturar mejor los patrones periódicos de la
demanda de medicamentos.
Esto es consistente con la observación gráfica de los
pronósticos, donde SARIMA se ajusta con mayor precisión
a los picos y valles estacionales.
3.5.2. Análisis de residuos del modelo
La evaluación gráfica del comportamiento de los modelos
permitió analizar de manera cualitativa.