Nummer

INFO-4xxx
Titel

AI Safety
Lehrform(en)

Vorlesung, Übung
ECTS 6
Arbeitsaufwand
- Kontaktzeit
- Selbststudium
Arbeitsaufwand:
180 h
Kontaktzeit:
60 h / 4 SWS
Selbststudium:
120 h
Veranstaltungsdauer 1 Semester
Häufigkeit des Angebots Unregelmäßig
Unterrichtssprache Englisch
Prüfungsform

Projekt und Klausur

Inhalt

In dieser Veranstaltung erhalten Studierende eine umfassende Einführung in die Sicherheit und Zuverlässigkeit moderner KI-Systeme, wobei der Fokus auf Large Language-Modellen (LLMs) und KI-Agenten liegt. Die Studierenden werden technische Verwundbarkeiten wie die Robustheit gegenüber Angriffen, Jailbreaks, Prompt-Injektionen und Halluzinationen kennenlernen und gleichzeitig Ansätze erproben, mit denen diese Fehler entdeckt und verhindert werden können. Die Vorlesung deckt Herausforderungen bei der Ausrichtung, wie z. B. auftretende Fehlausrichtungen, skalierbare Überwachung und KI-Steuerungsmethoden für die Verwaltung immer leistungsfähigerer Systeme ab.

Qualifikationsziele

Die Studierenden erwerben praktische Erfahrung in Interpetationstechniken und Evalutionsmethoden sowie in Tools zur Generierung von Wasserzeichen, Entdeckung von KI-generierten Inhalten und sie erwerben ein Verständnis für die Urheberrechts-Implikationen, die mit LLMs verbunden sind. Am Ende der Veranstaltung verstehen die Studierenden sowohl die theoretischen Grundlagen als auch praktische Aspekte der Generierung sicherer KI-Systeme, inklusive Methoden zur Vorhersage von Fähigkeiten generativer KI.

Vergabe von Leistungspunkten/Benotung
Lehrform
Status
SWS
LP
Prüfungsform
Prüfungsdauer
Benotung
Berechnung
Modulnote (%)
Teilnahmevoraussetzungen Es gibt keine besonderen Voraussetzungen.
Dozent/in wechselnde Dozenten
Literatur / Sonstiges

Prerequisites: Prior coursework in deep learning, statistical machine learning, or LLMs.

Zuletzt angeboten nicht bekannt
Geplant für derzeit nicht geplant
Zugeordnete Studienbereiche