Skip to Main Content (Press Enter)

Logo CNR
  • ×
  • Home
  • People
  • Outputs
  • Organizations
  • Expertise & Skills

UNI-FIND
Logo CNR

|

UNI-FIND

cnr.it
  • ×
  • Home
  • People
  • Outputs
  • Organizations
  • Expertise & Skills
  1. Outputs

Punti di forza e di debolezza dei modelli di apprendimento per rinforzo: un'applicazione all'orientamento spaziale nei pulcini

Academic Article
Publication Date:
2006
abstract:
Questo articolo ha due obiettivi. Il primo è discutere i punti di forza e di debolezza dei modelli di apprendimento per rinforzo (Sutton e Barto, 1998), ed in particolare del modello attore-critico, per lo studio del comportamento animale. Il secondo è mostrare tali punti di forza "in azione" riassumendo i principali risultati ottenuti con una specifica applicazione del modello attore-critico alla modellizzazione di alcuni comportamenti di navigazione spaziale osservati nei pulcini (per maggiori dettagli si veda Mannella e Baldassarre, in stampa). Il primo obiettivo è particolarmente importante in quanto, nonostante le notevoli potenzialità dei modelli di apprendimento per rinforzo, la comunità di vita artificiale tende ad usare poco questi modelli, ad esempio rispetto ai modelli basati sugli algoritmi genetici, l'apprendimento supervisionato e l'apprendimento non supervisionato (si veda ad esempio il tipo di modelli utilizzati nell'ultimo Workshop Italiano di Vita Artificiale, Baldassarre et al., 2005, e nell'ultima conferenza internazionale di Artificial Life, Pollak et al., 2004). Dapprima l'articolo presenterà gli esperimenti sui pulcini reali riprodotti e studiati con il modello qui presentato e le interpretazioni teoriche dei risultati fornite dagli autori degli stessi (sez. 2). Poi illustrerà il modello (sez. 3) ed i risultati ottenuti con esso (sez. 4). In seguito elencherà i punti di forza dei modelli di apprendimento per rinforzo, tra cui la notevole plausibilità biologica della versione attore-critico (sez. 5). Infine presenterà un'analisi delle debolezze di tali modelli e delle ragioni tecniche e storiche della loro scarsa diffusione nella comunità di vita artificiale (sez. 6).
Iris type:
01.01 Articolo in rivista
Keywords:
Apprendimento per rinforzo
List of contributors:
Baldassarre, Gianluca; Mannella, Francesco
Authors of the University:
BALDASSARRE GIANLUCA
MANNELLA FRANCESCO
Handle:
https://iris.cnr.it/handle/20.500.14243/311333
Published in:
SISTEMI INTELLIGENTI (TESTO STAMP.)
Journal
  • Use of cookies

Powered by VIVO | Designed by Cineca | 26.5.0.0 | Sorgente dati: PREPROD (Ribaltamento disabilitato)