Die Georg-August-Universität Göttingen sucht einen PhD Researcher (m/w/d) im Bereich Paraphrase Types & LLM. Im Rahmen des Forschungsprojekts "Paraphrase Types" wird ein Kandidat gesucht, der sich mit der Entwicklung und Evaluierung von Methoden zur Erkennung und Generierung von Paraphrasen in Large Language Models (LLMs) beschäftigt. Die Stelle ist ab dem 01.02.2026 in Vollzeit zu besetzen und auf 36 Monate befristet. Der ideale Kandidat verfügt über einen Master-Abschluss in Informatik oder verwandten Bereichen, starke Programmierkenntnisse und Erfahrung mit Deep Learning und NLP.
Die Georg-August-Universität Göttingen Stiftung Öffentlichen Rechts – Institut für Informatik sucht ab dem 01.02.2026 einen engagierten PhD Researcher (m/w/d) im Bereich Paraphrase Types & LLM. Diese Vollzeitstelle (teilzeitgeeignet) ist mit der Entgeltgruppe 13 TV-L bewertet und bis zum 31.01.2029 befristet.
Das GippLab ( https://gip... [Vollständig anzeigen] ) unter der Leitung von Prof. Dr. Bela Gipp forscht an der Schnittstelle von Informatik, Data Science und Informationswissenschaft, wobei ein besonderer Fokus auf Natural Language Processing (NLP) basierend auf Large Language Models (LLM) liegt.
Werden Sie Teil des Forschungsprojekts "Paraphrase Types: A New Paradigm for Paraphrase Generation and Detection" und starten Sie zum 01.02.2026 als PhD Researcher (m/w/d) für 36 Monate durch!
Kurzbeschreibung des Projekts:
Paraphrasen sind Texte, die dieselbe Bedeutung mit anderen Worten oder grammatikalischen Strukturen vermitteln. Aktuelle automatisierte Systeme zur Paraphrasengenerierung und -erkennung (PGD) bewerten jedoch nur binär, ob Satzpaare die gleiche Bedeutung haben. Dieses Projekt zielt darauf ab, Paraphrasentypen zu definieren und zu erkennen, um zu verstehen, welche Veränderungen Texte ähnlich machen. Dies ermöglicht vielfältige Anwendungsfälle, wie die granulare Identifizierung von Autoren, die Erstellung linguistischer Profile oder die Verbesserung von Plagiatserkennungssystemen. Das Projekt wird einen Ansatz zum Erlernen von Paraphrasentypen in Large Language Models (LLMs) entwickeln, implementieren und evaluieren. Dabei werden die Handhabung von Paraphrasentypen in Paraphrasenmodellen bewertet (WP1), Paraphrasentypen in Trainingsziele und Datensätze integriert (WP2) und ein PGD-System entwickelt, das diese Erkenntnisse berücksichtigt (WP3).
Ihre Verantwortlichkeiten:
- Erstellung einer einheitlichen Taxonomie von Paraphrasentechniken für Englisch und Deutsch.
- Untersuchung der Fähigkeiten und Grenzen von LLMs im Bereich Paraphrasierung.
- Entwicklung neuer Aufgaben, Datensätze und Benchmarks für das Training spezialisierter Sprachmodelle.
- Erforschung von Interpretationsmechanismen zur Analyse des Verhaltens von LLMs.
- Entwicklung neuer Metriken für PGD.
- Anwendung der entwickelten Techniken in anderen Projekten der Gruppe.
- Umsetzung der Forschung in einen interaktiven Webanwendungsprototypen.
- Veröffentlichung der Ergebnisse auf führenden NLP-Konferenzen.
- Unterricht im Rahmen des PhD-Programms in Informatik an der Universität Göttingen.
- Betreuung von Master- und Bachelorstudenten in verwandten Projekten.
Ihr Profil:
- Master-Abschluss (oder Äquivalent) in Informatik, Computerlinguistik, Data Science oder einem verwandten Bereich.
- Starke Programmierkenntnisse, insbesondere in Python.
- Erfahrung mit Deep Learning Frameworks (z.B. PyTorch) und NLP Libraries (z.B. Hugging Face).
- Solide Kenntnisse in NLP Downstream Tasks (z.B. NER, Tokenisierung).
- Professionelle Deutsch- und Englischkenntnisse (C1).
- Kommunikations- und Teamfähigkeit.
Wir bieten:
- Ein anregendes, interdisziplinäres und internationales Forschungsumfeld an einer der Top-Universitäten Deutschlands.
- Die Möglichkeit, zu einem hochwirksamen Projekt an der Schnittstelle von KI, Linguistik und Kulturerbe beizutragen.
- Engagierte Betreuung zur Förderung Ihrer akademischen und persönlichen Entwicklung.
- Zugang zu modernsten HPC-Ressourcen, wie einem GPU-Cluster mit NVIDIA A100 GPUs.
- Finanzierung zur Präsentation Ihrer Forschung auf internationalen Konferenzen.
- Eine Vollzeitstelle mit wettbewerbsfähigem Gehalt nach TV-L.
- Büroräume und technische Ausstattung vor Ort in Göttingen.
Diese Position erfordert regelmäßige Anwesenheit in Göttingen; Remote-Arbeit ist in begrenztem Umfang möglich.
Für weitere Informationen kontaktieren Sie bitte PD Dr. Terry Ruas: ruas@uni-go... [Vollständig anzeigen]
Die Universität Göttingen setzt sich für die Erhöhung des Frauenanteils in unterrepräsentierten Bereichen ein und fördert die Vereinbarkeit von Beruf und Familie. Bewerbungen von Schwerbehinderten werden bei gleicher Qualifikation bevorzugt berücksichtigt.
Bitte reichen Sie Ihre Bewerbung bis zum 26.11.2025 über das Bewerbungsportal ein: http://obp.... [Vollständig anzeigen]
Auskunft erteilt Herr Terry Lima Ruas, E-Mail: ruas@uni-go... [Vollständig anzeigen] , Tel. +49 159068036... [Vollständig anzeigen]
Hinweis: Mit der Einreichung Ihrer Bewerbung willigen Sie in die Verarbeitung Ihrer Daten gemäß der Datenschutzgrundverordnung (DSGVO) ein.