fine anni'80 del XX sec. - Cronologia Universale

Artificial Intelligence (AI): viene inventato il Reinforced Learning (RL: Sutton & Barto), con l’interazione di un agente col suo environment, agente che impara dalle sue azioni e conseguenze / rewards (si tratta quindi di semi-supervised learning). E’ una tecnica imparentata con Dynamic Programming (Bellman, 1952) che modella le interazioni con l’environment come un processo decisionale di Markov (ma RL non richiede un modello a priori).