Punti di forza e di debolezza dei modelli di apprendimento per rinforzo: un'applicazione all'orientamento spaziale nei pulcini

Academic Article

Publication Date:

2006

abstract:

Questo articolo ha due obiettivi. Il primo è discutere i punti di forza e di debolezza dei modelli di apprendimento per rinforzo (Sutton e Barto, 1998), ed in particolare del modello attore-critico, per lo studio del comportamento animale. Il secondo è mostrare tali punti di forza "in azione" riassumendo i principali risultati ottenuti con una specifica applicazione del modello attore-critico alla modellizzazione di alcuni comportamenti di navigazione spaziale osservati nei pulcini (per maggiori dettagli si veda Mannella e Baldassarre, in stampa). Il primo obiettivo è particolarmente importante in quanto, nonostante le notevoli potenzialità dei modelli di apprendimento per rinforzo, la comunità di vita artificiale tende ad usare poco questi modelli, ad esempio rispetto ai modelli basati sugli algoritmi genetici, l'apprendimento supervisionato e l'apprendimento non supervisionato (si veda ad esempio il tipo di modelli utilizzati nell'ultimo Workshop Italiano di Vita Artificiale, Baldassarre et al., 2005, e nell'ultima conferenza internazionale di Artificial Life, Pollak et al., 2004). Dapprima l'articolo presenterà gli esperimenti sui pulcini reali riprodotti e studiati con il modello qui presentato e le interpretazioni teoriche dei risultati fornite dagli autori degli stessi (sez. 2). Poi illustrerà il modello (sez. 3) ed i risultati ottenuti con esso (sez. 4). In seguito elencherà i punti di forza dei modelli di apprendimento per rinforzo, tra cui la notevole plausibilità biologica della versione attore-critico (sez. 5). Infine presenterà un'analisi delle debolezze di tali modelli e delle ragioni tecniche e storiche della loro scarsa diffusione nella comunità di vita artificiale (sez. 6).

Iris type:

01.01 Articolo in rivista

Keywords:

Apprendimento per rinforzo

List of contributors:

Baldassarre, Gianluca; Mannella, Francesco

Authors of the University:

BALDASSARRE GIANLUCA

MANNELLA FRANCESCO

Handle:

https://iris.cnr.it/handle/20.500.14243/311333

Published in:

SISTEMI INTELLIGENTI (TESTO STAMP.)

Journal