Universität St. Gallen
St.Gallen
Wissenschaftliche Hilfskraft Data Science / Data Lake Engineer (m/w/d)
- 06 Juni 2026
- 100%
- St.Gallen
Über den Job
Die Universität St. Gallen ist eine führende Wirtschaftsuniversität mit über 10.000 Studierenden und 3.700 Mitarbeitenden.
Das Schweizerische Institut für Aussenwirtschaft und Angewandte Wirtschaftsforschung, kurz SIAW-HSG, beschäftigt rund 40 Mitarbeitende und ist eines der 36 Institute der Universität.
Unser Fokus liegt auf Aussenhandel, Makroökonomie, Steuern und Sozialsystemen, Öffentlicher Wirtschaft, Umweltökonomie, Finanzökonomie und Versicherungen.
Wir sind verantwortlich für Forschung, Lehre und Dienstleistungen in unseren Fachgebieten und bilden Nachwuchstalente für Forschung und die Schnittstelle zwischen Wissenschaft und Praxis aus.
Der Lehrstuhl für Internationale Wirtschaft am SIAW verfügt über Expertise in Versicherung, Banken und systemischem Risiko, mit Schwerpunkt auf der Verbindung akademischer Erkenntnisse und regulatorischer Praxis.
Beschäftigungsbedingungen- Startdatum: 1. August 2026 oder nach Vereinbarung
- Befristung auf 6 Monate, mit der Möglichkeit einer Verlängerung um weitere 6 Monate je nach Projektbedarf und Leistung
- Vergütung: Wettbewerbsfähiges Gehalt entsprechend den Schweizer Universitätsstandards
- Arbeitsumfeld: Die Stelle ist in ein akademisches Forschungsumfeld eingebettet und beinhaltet enge Zusammenarbeit mit Fakultät, Doktoranden, wissenschaftlichen Mitarbeitenden und IT-/Dateninfrastrukturpartnern
Bewerbungsvoraussetzungen
Für den Beginn des Bewerbungsprozesses reichen Sie bitte ein:- Motivationsschreiben, das Ihr Interesse an der Stelle und relevante Erfahrungen in Data Science, Data Engineering oder Forschungsinfrastruktur mit konkreten Beispielen der Projekte und Ihrer Rolle darin erläutert
- Lebenslauf
- Akademische Zeugnisse, insbesondere vom Masterstudium
- Beispiel technischer Arbeiten, wie ein GitHub-Repository, Programmierprojekt, Datenpipeline, Abschlussarbeit, Seminararbeit oder andere relevante Arbeitsproben
- Namen von bis zu zwei akademischen oder beruflichen Referenzen
Bewerbungen werden fortlaufend geprüft, bis die Stelle besetzt ist.
Ihre Aufgaben
Verantwortlichkeiten und Projekt
Die Stelle unterstützt die Entwicklung eines Forschungs-Data-Lake für empirische Arbeiten mit grossen finanziellen, textlichen, lizenzierten und teilweise vertraulichen Datensätzen. Ziel ist es, eine robuste, gut dokumentierte und reproduzierbare Dateninfrastruktur zu schaffen, die Forschenden ermöglicht, Daten effizient und sicher zu erfassen, zu speichern, zu verarbeiten, zu dokumentieren und zu analysieren.
Forschungs- und Infrastrukturaufgaben umfassen Data Engineering, Programmierung, Dokumentation und Koordination mit Forschenden und IT-/Plattformanbietern. Kernaufgaben sind unter anderem:
Entwurf und Implementierung des Forschungs-Data-Lake
- Unterstützung beim Entwurf einer skalierbaren Datenarchitektur für ca. 5 TB Forschungsdaten
- Strukturierung der Daten in Roh-, bereinigte und analysebereite Schichten
- Entwicklung klarer Benennungskonventionen, Ordnerstrukturen, Zugriffsregeln und Dokumentationsstandards
- Sicherstellung, dass der Data Lake die langfristige Aufbewahrung von Roh- und verarbeiteten Daten unterstützt
Datenaufnahme und Integration
- Aufbau automatisierter Workflows zum Import von Daten von externen Anbietern, Datenbanken, APIs, Dateilieferungen und von Forschenden gepflegten Quellen
- Integration von Finanzdatensätzen, Textdatensätzen und anderen lizenzierten Forschungsdaten in eine konsistente Infrastruktur
- Implementierung von Validierungsprüfungen, Protokollierung, Fehlerbehandlung und Versionskontrolle bei Datenaktualisierungen
- Dokumentation der Datenherkunft, Lizenzen, Aktualisierungsfrequenzen und Nutzungsbeschränkungen
Automatisierung von Forschungspipelines
- Entwicklung reproduzierbarer Pipelines zum Bereinigen, Transformieren und Vorbereiten von Datensätzen für empirische Forschung
- Erstellung wiederverwendbarer Skripte und Vorlagen für wiederkehrende Datentasks
- Unterstützung von Forschenden bei der Umwandlung manueller Datenarbeit in automatisierte und dokumentierte Workflows
- Beitrag zu reproduzierbaren Forschungspraktiken durch Git-basierte Codeverwaltung und klare Pipeline-Dokumentation
Datenverwaltung, Vertraulichkeit und Zugriffsmanagement
- Mitwirkung bei der Implementierung von Verfahren zum Umgang mit lizenzierten und vertraulichen Datensätzen
- Unterstützung von rollenbasierten Zugriffskonzepten, Dokumentation von Datenberechtigungen und Einhaltung von Anbietervereinbarungen
- Erstellung von Dateninventaren und Metadaten-Dateien, um Datensätze für das Forschungsteam auffindbar und nutzbar zu machen
- Koordination mit interner IT oder externen Plattformanbietern bei Bedarf
Forschungsunterstützung
- Unterstützung von Forschenden bei Datenvorbereitung, Qualitätsprüfungen, explorativer Analyse und technischer Fehlerbehebung
- Bereitstellung von Dokumentationen und kurzen internen Anleitungen, damit die Infrastruktur über die initiale Projektphase hinaus gepflegt werden kann
- Beitrag zu weiteren datenintensiven Forschungsprojekten am Lehrstuhl oder Institut, wo angemessen
Die Stelle eignet sich besonders für Kandidat:innen, die Data Science, Data Engineering und angewandte akademische Forschung verbinden möchten. Die Rolle bietet die Möglichkeit, eine Forschungsinfrastruktur von Grund auf aufzubauen und Erfahrungen mit grossen, realen Forschungsdaten zu sammeln.
Ihr Profil
- Masterabschluss in Data Science, Informatik, Statistik, Ökonometrie, Informationssystemen oder einem eng verwandten Fachgebiet
- Starkes Interesse an Forschungsdateninfrastruktur, Data Engineering, Automatisierung empirischer Forschungspipelines und reproduzierbarer Wissenschaft
- Ausgezeichnete Programmierkenntnisse, vorzugsweise in Python und SQL; Erfahrung mit R, Stata oder Matlab ist von Vorteil
- Erfahrung mit Data Engineering Tools und Workflows, wie APIs, ETL/ELT-Pipelines, Git, Docker, Workflow-Automatisierung, Metadaten-Dokumentation oder cloudbasierten Forschungsumgebungen
- Vertrautheit mit strukturierten und unstrukturierten Daten, inklusive Finanzdatensätzen, Textdaten und grossen Dateisystemen
- Gutes Verständnis von Datenverwaltung, Zugriffskontrolle, Dokumentation und Reproduzierbarkeit
- Bereitschaft, sorgfältig mit lizenzierten und vertraulichen Forschungsdaten umzugehen
- Hohe Motivation und Fähigkeit, selbstständig sowie in enger Zusammenarbeit mit Forschenden und IT-/Dateninfrastruktur-Anbietern zu arbeiten
- Vorerfahrung mit cloudbasierten Data-Science-Plattformen ist von Vorteil
"Ein Ort, an dem Wissen geschaffen wird" – Als eine der führenden europäischen Universitäten für Wirtschaftswissenschaften und Betriebswirtschaft ist die Universität St. Gallen (HSG), Schweiz, der Ausbildung von über 10.000 Studierenden verpflichtet. Die HSG ist einer der grössten Arbeitgeber der Region und bietet mehr als 3.500 Forschenden, Lehrenden und Fachkräften ein attraktives und innovatives Umfeld.