|
Nummer INFO-4xxx |
Titel AI Safety |
Lehrform(en) Vorlesung, Übung |
|---|---|---|
| ECTS | 6 | |
|
Arbeitsaufwand - Kontaktzeit - Selbststudium |
Arbeitsaufwand:
180 h Kontaktzeit:
60 h / 4 SWS Selbststudium:
120 h |
|
| Veranstaltungsdauer | 1 Semester | |
| Häufigkeit des Angebots | Unregelmäßig | |
| Unterrichtssprache | Englisch | |
| Prüfungsform | Projekt und Klausur |
|
| Inhalt | In dieser Veranstaltung erhalten Studierende eine umfassende Einführung in die Sicherheit und Zuverlässigkeit moderner KI-Systeme, wobei der Fokus auf Large Language-Modellen (LLMs) und KI-Agenten liegt. Die Studierenden werden technische Verwundbarkeiten wie die Robustheit gegenüber Angriffen, Jailbreaks, Prompt-Injektionen und Halluzinationen kennenlernen und gleichzeitig Ansätze erproben, mit denen diese Fehler entdeckt und verhindert werden können. Die Vorlesung deckt Herausforderungen bei der Ausrichtung, wie z. B. auftretende Fehlausrichtungen, skalierbare Überwachung und KI-Steuerungsmethoden für die Verwaltung immer leistungsfähigerer Systeme ab. |
|
| Qualifikationsziele | Die Studierenden erwerben praktische Erfahrung in Interpetationstechniken und Evalutionsmethoden sowie in Tools zur Generierung von Wasserzeichen, Entdeckung von KI-generierten Inhalten und sie erwerben ein Verständnis für die Urheberrechts-Implikationen, die mit LLMs verbunden sind. Am Ende der Veranstaltung verstehen die Studierenden sowohl die theoretischen Grundlagen als auch praktische Aspekte der Generierung sicherer KI-Systeme, inklusive Methoden zur Vorhersage von Fähigkeiten generativer KI. |
|
| Vergabe von Leistungspunkten/Benotung |
Lehrform
Status
SWS
LP
Prüfungsform
Prüfungsdauer
Benotung
Berechnung
Modulnote (%) |
|
| Teilnahmevoraussetzungen | Es gibt keine besonderen Voraussetzungen. | |
| Dozent/in | wechselnde Dozenten | |
| Literatur / Sonstiges | Prerequisites: Prior coursework in deep learning, statistical machine learning, or LLMs. |
|
| Zuletzt angeboten | nicht bekannt | |
| Geplant für | derzeit nicht geplant | |
| Zugeordnete Studienbereiche | ||