Nummer INFO-4194 |
Titel Verhalten und Lernen |
Lehrform(en) Vorlesung |
---|---|---|
ECTS | 6 | |
Arbeitsaufwand - Kontaktzeit - Selbststudium |
Arbeitsaufwand:
180 h Kontaktzeit:
60 h / 4 SWS Selbststudium:
120 h |
|
Veranstaltungsdauer | 1 Semester | |
Häufigkeit des Angebots | Unregelmäßig | |
Unterrichtssprache | Englisch | |
Prüfungsform | Klausur (mündliche Prüfung bei geringer Teilnehmeranzahl) |
|
Inhalt | Diese Vorlesung baut auf dem vorhandenen Wissen auf, wie Tiere und Menschen ihr Verhalten planen, entscheiden und kontrollieren und wie sie ihr Verhalten im Laufe der Zeit immer weiter optimieren und anpassen. Dementsprechend werden Algorithmen für die Entscheidungsfindung, Kontrolle, Optimierung und Anpassung von Verhalten vorgestellt. Insbesondere werden räumliche Repräsentationen für die Verhaltenskontrolle, forward-inverse Kontrollmodelle, einschließlich des Lernens solcher Repräsentationen und Modelle vorgestellt. Auch die Kodierung und das Lernen von motorischen Kontrollprimitiven und motorischen Komplexen wird betrachtet. Zu guter Letzt werden selbstmotivierte künstliche Systeme betrachtet, die danach streben, eine interne Homöostase aufrechtzuerhalten und den Informationsgewinn zu maximieren. |
|
Qualifikationsziele | Die Studierenden wissen, wie intelligentes Verhalten in künstlichen Systemen erzeugt und gelernt werden kann. Sie können Reinforcement Learning (RL), einschließlich hierarchischem RL, faktorisiertem RL und akteurskritischen Ansätzen auf die entsprechenden Probleme anwenden. Außerdem sind sie sich des Unterschieds zwischen modellfreien und modellbasierten RL-Ansätzen bewusst. Sie kennen sich mit dynamischen Bewegungsprimitiven aus und wissen, wie man sie optimiert. Darüber hinaus kennen sie Gaussian Mixture Models und wissen, wie man sie lernt und optimiert. Sie können informationsgewinngesteuertes und selbstmotiviertes Verhalten implementieren und sind sich des Dilemmas zwischen Exploration und Ausbeutung bewusst. Darüber hinaus kennen sie die modellprädiktive Steuerung, die Möglichkeiten zum Erlernen geeigneter modellprädiktiver Strukturen und die Möglichkeiten zur angemessenen Abstraktion solcher Strukturen. Schließlich wissen sie, wie sensomotorische, raum-zeitliche Repräsentationen erlernt, als episodische Gedächtniseinheiten gespeichert und zu kognitiven Karten abstrahiert werden können, die eine modellbasierte RL ermöglichen. |
|
Vergabe von Leistungspunkten/Benotung |
Lehrform
Status
SWS
LP
Prüfungsform
Prüfungsdauer
Benotung
Berechnung
Modulnote (%)
Vorlesung
V
o
2
3.0
K
90
b
100
Übung
Ü
o
2
3.0
|
|
Teilnahmevoraussetzungen | Es gibt keine besonderen Voraussetzungen. | |
Dozent/in | Butz | |
Literatur / Sonstiges | Literatur / Literature: Voraussetzungen / Prerequisites: |
|
Zuletzt angeboten | --- | |
Geplant für | --- | |
Zugeordnete Studienbereiche | INFO-INFO, INFO-PRAK, MEDI-APPL, MEDI-HCI, MEDI-INFO, MEDI-MEDI, ML-CS |