Nummer ML-4509	Titel AI Safety	Lehrform(en) Vorlesung, Übung
ECTS	6
Arbeitsaufwand - Kontaktzeit - Selbststudium	Arbeitsaufwand: 180 h Kontaktzeit: 60 h / 4 SWS Selbststudium: 120 h
Veranstaltungsdauer	1 Semester
Häufigkeit des Angebots	Unregelmäßig
Unterrichtssprache	Englisch
Prüfungsform	Projekt und Klausur
Inhalt	In dieser Veranstaltung erhalten Studierende eine umfassende Einführung in die Sicherheit und Zuverlässigkeit moderner KI-Systeme, wobei der Fokus auf Large Language-Modellen (LLMs) und KI-Agenten liegt. Die Studierenden werden technische Verwundbarkeiten wie die Robustheit gegenüber Angriffen, Jailbreaks, Prompt-Injektionen und Halluzinationen kennenlernen und gleichzeitig Ansätze erproben, mit denen diese Fehler entdeckt und verhindert werden können. Die Vorlesung deckt Herausforderungen bei der Ausrichtung, wie z. B. auftretende Fehlausrichtungen, skalierbare Überwachung und KI-Steuerungsmethoden für die Verwaltung immer leistungsfähigerer Systeme ab.
Qualifikationsziele	Die Studierenden erwerben praktische Erfahrung in Interpetationstechniken und Evalutionsmethoden sowie in Tools zur Generierung von Wasserzeichen, Entdeckung von KI-generierten Inhalten und sie erwerben ein Verständnis für die Urheberrechts-Implikationen, die mit LLMs verbunden sind. Am Ende der Veranstaltung verstehen die Studierenden sowohl die theoretischen Grundlagen als auch praktische Aspekte der Generierung sicherer KI-Systeme, inklusive Methoden zur Vorhersage von Fähigkeiten generativer KI.
Vergabe von Leistungspunkten/Benotung	Lehrform Status SWS LP Prüfungsform Prüfungsdauer Benotung Berechnung Modulnote (%)
Teilnahmevoraussetzungen	Es gibt keine besonderen Voraussetzungen.
Dozent/in	Pons-Moll, wechselnde Dozenten
Literatur / Sonstiges	Prerequisites: Prior coursework in deep learning, statistical machine learning, or LLMs.
Zuletzt angeboten	nicht bekannt
Geplant für	derzeit nicht geplant
Zugeordnete Studienbereiche	INFO-INFO, MEDI-APPL, MEDI-INFO, ML-CS, ML-DIV

Nummer

ML-4509

Titel

AI Safety

Lehrform(en)

Vorlesung, Übung

ECTS

Arbeitsaufwand
- Kontaktzeit
- Selbststudium

Arbeitsaufwand:
180 h

Kontaktzeit:
60 h / 4 SWS

Selbststudium:
120 h

Veranstaltungsdauer

1 Semester

Häufigkeit des Angebots

Unregelmäßig

Unterrichtssprache

Englisch

Prüfungsform

Projekt und Klausur

Inhalt

In dieser Veranstaltung erhalten Studierende eine umfassende Einführung in die Sicherheit und Zuverlässigkeit moderner KI-Systeme, wobei der Fokus auf Large Language-Modellen (LLMs) und KI-Agenten liegt. Die Studierenden werden technische Verwundbarkeiten wie die Robustheit gegenüber Angriffen, Jailbreaks, Prompt-Injektionen und Halluzinationen kennenlernen und gleichzeitig Ansätze erproben, mit denen diese Fehler entdeckt und verhindert werden können. Die Vorlesung deckt Herausforderungen bei der Ausrichtung, wie z. B. auftretende Fehlausrichtungen, skalierbare Überwachung und KI-Steuerungsmethoden für die Verwaltung immer leistungsfähigerer Systeme ab.

Qualifikationsziele

Die Studierenden erwerben praktische Erfahrung in Interpetationstechniken und Evalutionsmethoden sowie in Tools zur Generierung von Wasserzeichen, Entdeckung von KI-generierten Inhalten und sie erwerben ein Verständnis für die Urheberrechts-Implikationen, die mit LLMs verbunden sind. Am Ende der Veranstaltung verstehen die Studierenden sowohl die theoretischen Grundlagen als auch praktische Aspekte der Generierung sicherer KI-Systeme, inklusive Methoden zur Vorhersage von Fähigkeiten generativer KI.

Vergabe von Leistungspunkten/Benotung

Teilnahmevoraussetzungen

Es gibt keine besonderen Voraussetzungen.

Dozent/in

Pons-Moll, wechselnde Dozenten

Literatur / Sonstiges

Prerequisites: Prior coursework in deep learning, statistical machine learning, or LLMs.

Zuletzt angeboten

nicht bekannt

Geplant für

derzeit nicht geplant

Zugeordnete Studienbereiche

INFO-INFO, MEDI-APPL, MEDI-INFO, ML-CS, ML-DIV