Systema MachineLearning ForwardLearning Idea

Alchemist · Mensaje por **Alchemist** » 13 Abr 2026 01:11

Hola a todos. Me presento: me hago llamar el "Alchemist de WallStreet". Tras más de un lustro dedicado al desarrollo de sistemas cuantitativos en las sombras, hoy quiero compartir una arquitectura que desafía las limitaciones convencionales de MetaTrader 5.
La Filosofía: Cero Reglas, Máxima Probabilidad

Imagen

A diferencia de la mayoría de los sistemas, este algoritmo no tiene ninguna regla ni estrategia predefinida por un humano. No hay instrucciones arbitrarias de cruces de medias, soportes o indicadores retail. El sistema nace "vacío" de sesgos y responde a una única pregunta fundamental:

¿Cuál es la probabilidad estadística de que el precio suba ofreciendo un Ratio Riesgo/Beneficio de 1:3?

El algoritmo busca patrones por sí solo, aprende sin supervisión, construye sus propias reglas de entrada y gestiona el riesgo sin intervención humana. El papel del desarrollador aquí no es decir qué operar, sino actuar como un arquitecto de datos que supervisa la precisión predictiva, refina el código o lanza entrenamientos forzados cuando la métrica lo exige.
¿Por qué Forward Learning en MQL5?

Criticar a MQL5 por ser "lento" para el Machine Learning es no entender de ingeniería. Aunque no tiene la potencia de cálculo de Python, ofrece algo invaluable: latencia cero e integración total con el flujo de ticks.

En lugar de un modelo estático que queda obsoleto al mes, he implementado Forward Learning. El sistema evoluciona en tiempo real, "madurando" con el mercado y adaptándose a las nuevas condiciones mediante una simbiosis de aprendizaje por refuerzo y supervisión de datos no lineales.
La Arquitectura: Un Ecosistema de 3 Fases

He sustituido la visión lineal del precio por el análisis de 28 features cuantitativas, procesadas en un ciclo de vida diseñado para la supervivencia estadística:
1. Recolección y el "Observatorio" (Cold Start)

El sistema construye su inteligencia desde cero:

Filtro de Supervivencia: Antes de entrar en operativa real, los patrones capturados en vectores de 28 dimensiones deben superar un periodo de observación. Si un patrón no demuestra un Edge claro bajo condiciones de mercado reales, es desechado para evitar contaminar la base de conocimientos con ruido.

2. El Ensamble Híbrido Nativo

Para optimizar la carga computacional, utilizo una jerarquía de modelos en simbiosis:

Capa de Memoria Adaptativa (KNN): Localiza similitudes en "huellas dactilares" del pasado mediante distancias euclidianas.

Capa de Clasificación Dinámica (GBM): Un motor de Gradient Boosting Machine que calibra la confianza estadística de la predicción.

Red Neuronal: Actúa como el procesador de alta jerarquía, integrando las señales anteriores para filtrar falsos positivos y dar la orden final de ejecución.

El Cortafuegos: Control del Overfitting

Para asegurar que el sistema no "memorice" el pasado, he implementado defensas nativas:

Feature Dropout: Durante el entrenamiento, el algoritmo ignora aleatoriamente un porcentaje de sus features, forzándolo a encontrar patrones robustos y generales en lugar de dependencias frágiles.

Regularización L2 y Validación Cruzada Dinámica: Penaliza la complejidad excesiva y compara constantemente la precisión In-Sample vs. Out-of-Sample (Forward). Si la brecha crece, el sistema detecta el sobreajuste al instante.

Resiliencia: Detección de "Drift"

Mediante tests de error acumulado (Page-Hinkley), el algoritmo identifica el Concept Drift (cambio de régimen). Si la eficacia cae por debajo de un umbral prematuro, el sistema:

Detiene la operativa.

Inicia un re-entrenamiento automático basado en los datos más recientes.

Si es necesario, realiza un Rollback hacia una arquitectura previa más estable guardada en su Hall of Fame.

Conclusión

Este sistema es la prueba de que el trading moderno no consiste en encontrar el "indicador mágico", sino en construir arquitecturas capaces de aprender y desaprender mientras el mercado respira. Hemos pasado de las reglas fijas a una inteligencia que entiende la estructura de los datos sin que un humano tenga que explicarle qué es una tendencia, la idea es que el lo entienda por si mismo.

Imagen

Esta imagen representa el Dashboard del algoritmo. A través de esta interfaz, puedo supervisar en tiempo real la evolución de su aprendizaje y cómo se adapta con el paso del tiempo. Me permite visualizar los patrones específicos que el sistema ha descubierto y, fundamentalmente, auditar su WinRate actual.

A diferencia de las arquitecturas de redes neuronales convencionales, que suelen operar como una 'caja negra' donde es imposible descifrar el porqué de cada decisión, mi sistema es transparente para su creador. Puedo identificar con precisión en qué patrones y parámetros de su propio descubrimiento se ha basado para ejecutar cada operación.

Como mencioné anteriormente, el algoritmo opera por fases. Actualmente, se encuentra en la Fase 1: Recolección y Aprendizaje Autónomo, donde el sistema toma entradas por sí mismo para observar el mercado y estructurar sus propios vectores de datos.

A continuación, comparto una serie de capturas del Dashboard; es la ventana principal para observar la metamorfosis del sistema y su maduración estadística.

Imagen

Aquí tienes la corrección de ese texto para que encaje perfectamente con el tono del resto del artículo. He refinado el vocabulario técnico para que se perciba la profundidad del análisis:

En la siguiente imagen se pueden apreciar los patrones que el algoritmo ha descubierto de forma autónoma, junto a su WinRate proyectado y la frecuencia de observación de cada uno. Es evidente que el sistema se encuentra aún en su etapa temprana de recolección de datos; un periodo crítico donde la prioridad es la acumulación de muestras estadísticas para validar la robustez de cada patrón antes de su promoción a la fase operativa.

A pesar de estar en una etapa inicial, la capacidad de discernimiento del sistema ya comienza a perfilar ineficiencias en el mercado que pasarían desapercibidas para el ojo humano o para cualquier indicador lineal convencional.

Imagen

Un aspecto sumamente sofisticado de esta arquitectura es su capacidad para reconocer estacionalidades temporales. El sistema identifica de forma autónoma sus horarios de mayor y menor esperanza matemática, adaptando su gestión de riesgo dinámicamente según la franja horaria en la que se encuentre.

No es una programación horaria rígida impuesta por mí; es el propio algoritmo el que, mediante el análisis de sus resultados, entiende en qué momentos la volatilidad y el flujo de órdenes favorecen sus patrones descubiertos. Si el sistema detecta que en determinada sesión la probabilidad de éxito disminuye, reduce su exposición de manera automática, protegiendo el capital sin necesidad de intervención manual.

Imagen

En definitiva, no estamos ante un simple bot de trading, sino ante una infraestructura capaz de autodiagnosticarse y evolucionar. Mi labor como 'Alchemist' no es operar, sino perfeccionar el crisol donde este algoritmo transmuta los datos brutos en probabilidad pura. Estaré compartiendo más avances conforme el sistema complete sus fases de maduración.

Imagen

Fercho · Mensaje por **Fercho** » 16 Abr 2026 03:23

Muy interesante tu proyecto Alchemist, dices que no depende de indicadores pero hablas de features, no es lo mismo?

…… Y otra cosa, aunque sea en tiempo real y sobre datos de mercado “desconocidos”, creo que al medirlos el observador (tu programa) en realidad va descubriendo si el gato está vivo o muerto en la caja. Al final termina siendo un estado pasado, no?

Y dentro de una muestra tan reducida de estados, no terminas en un curve fitting ? Recuerda lo que Gekko habla de mil desviaciones standards, cómo luego las descuentas de los pocos grados de libertad que te quedan?!

Tal vez no he entendido nada, ojo, y por eso me voy a poner con ese curso de NT8 y ML de enero 2025 que me ha gustado el tutorial, y siempre es bueno adicionar conocimientos, enhorabuena por el post, y por muchos mas !!!

Saludos cordiales

https://developer.ninjatrader.com/blog/ ... jatrader-8

Alchemist · Mensaje por **Alchemist** » 01 May 2026 17:38

Fercho escribió: 16 Abr 2026 03:23 Muy interesante tu proyecto Alchemist, dices que no depende de indicadores pero hablas de features, no es lo mismo?

…… Y otra cosa, aunque sea en tiempo real y sobre datos de mercado “desconocidos”, creo que al medirlos el observador (tu programa) en realidad va descubriendo si el gato está vivo o muerto en la caja. Al final termina siendo un estado pasado, no?

Y dentro de una muestra tan reducida de estados, no terminas en un curve fitting ? Recuerda lo que Gekko habla de mil desviaciones standards, cómo luego las descuentas de los pocos grados de libertad que te quedan?!

Tal vez no he entendido nada, ojo, y por eso me voy a poner con ese curso de NT8 y ML de enero 2025 que me ha gustado el tutorial, y siempre es bueno adicionar conocimientos, enhorabuena por el post, y por muchos mas !!!

Saludos cordiales

Hola, Fercho. Qué buena observación. Mira, sobre el tema de indicadores vs. features, para mí la diferencia es la naturaleza del dato: no uso indicadores clásicos (como un RSI), sino datos cuantitativos brutos (velocidad, flujo, aceleración) para que el modelo identifique 'huellas digitales' numéricas en tiempo real.

Pero lo más importante es lo que mencionas del overfitting. Mi sistema está diseñado para detectar y salir del sobreajuste de forma totalmente autónoma, sin intervención humana. Funciona así:

Autodiagnóstico constante: Durante el entrenamiento, el sistema se 'auto-examina'. Separa un 20% de datos que nunca ha visto (Out-of-Sample) y se pone a prueba a sí mismo. Si detecta que solo es capaz de acertar en los datos conocidos pero falla en ese 20% nuevo, el sistema identifica el overfitting al instante y descarta ese patrón automáticamente.

Sustitución en caliente: No necesito intervenir para apagarlo o ajustarlo. Si un patrón que estaba funcionando deja de ser efectivo (porque el mercado cambió), el módulo de Reinforcement Learning detecta la caída de precisión en tiempo real. En ese momento, el algoritmo 'jubila' ese patrón y lo reemplaza por otro que sí esté demostrando capacidad predictiva en las condiciones actuales.

Aprendizaje del flujo real: Al aprender en vivo, el sistema captura la micro-dinámica real (spread, latencia, velocidad de ejecución), lo que le permite validar si un patrón es rentable en la práctica o si es solo una ilusión estadística del pasado.

En resumen, el sistema es un organismo vivo: él mismo mide su propia salud y, si detecta que está cayendo en curve fitting, se corrige solo para mantener la ventaja estadística.

¡Un saludo!

Systema MachineLearning ForwardLearning Idea

Systema MachineLearning ForwardLearning Idea

Re: Systema MachineLearning ForwardLearning Idea

Re: Systema MachineLearning ForwardLearning Idea