St.Gallen

Wissenschaftliche Hilfskraft Data Science / Data Lake Engineer (m/w/d)

06 Juni 2026
100%
St.Gallen

Job-Zusammenfassung

Die Universität St. Gallen ist eine führende Wirtschaftsuni mit über 10.000 Studierenden. Erlebe ein innovatives Arbeitsumfeld mit attraktiven Vorteilen.

Aufgaben

Entwicklung eines Forschungsdatenlake für empirische Arbeiten.
Automatisierung von Forschungs-Pipelines für Datenanalysen.
Unterstützung bei der Datenintegration und -dokumentation.

Fähigkeiten

Abschluss in Datenwissenschaft, Informatik oder verwandten Bereichen.
Programmierkenntnisse in Python und SQL sind erforderlich.
Erfahrung mit Datenengineering-Tools und -Workflows.

Ist das hilfreich?

Über den Job

Die Universität St. Gallen ist eine führende Wirtschaftsuniversität mit über 10.000 Studierenden und 3.700 Mitarbeitenden.
Das Schweizerische Institut für Aussenwirtschaft und Angewandte Wirtschaftsforschung, kurz SIAW-HSG, beschäftigt rund 40 Mitarbeitende und ist eines der 36 Institute der Universität.
Unser Fokus liegt auf Aussenhandel, Makroökonomie, Steuern und Sozialsystemen, Öffentlicher Wirtschaft, Umweltökonomie, Finanzökonomie und Versicherungen.
Wir sind verantwortlich für Forschung, Lehre und Dienstleistungen in unseren Fachgebieten und bilden Nachwuchstalente für Forschung und die Schnittstelle zwischen Wissenschaft und Praxis aus.
Der Lehrstuhl für Internationale Wirtschaft am SIAW verfügt über Expertise in Versicherung, Banken und systemischem Risiko, mit Schwerpunkt auf der Verbindung akademischer Erkenntnisse und regulatorischer Praxis.

Beschäftigungsbedingungen
Startdatum: 1. August 2026 oder nach Vereinbarung
Befristung auf 6 Monate, mit der Möglichkeit einer Verlängerung um weitere 6 Monate je nach Projektbedarf und Leistung
Vergütung: Wettbewerbsfähiges Gehalt entsprechend den Schweizer Universitätsstandards
Arbeitsumfeld: Die Stelle ist in ein akademisches Forschungsumfeld eingebettet und beinhaltet enge Zusammenarbeit mit Fakultät, Doktoranden, wissenschaftlichen Mitarbeitenden und IT-/Dateninfrastrukturpartnern

Bewerbungsvoraussetzungen
Für den Beginn des Bewerbungsprozesses reichen Sie bitte ein:
Motivationsschreiben, das Ihr Interesse an der Stelle und relevante Erfahrungen in Data Science, Data Engineering oder Forschungsinfrastruktur mit konkreten Beispielen der Projekte und Ihrer Rolle darin erläutert
Lebenslauf
Akademische Zeugnisse, insbesondere vom Masterstudium
Beispiel technischer Arbeiten, wie ein GitHub-Repository, Programmierprojekt, Datenpipeline, Abschlussarbeit, Seminararbeit oder andere relevante Arbeitsproben
Namen von bis zu zwei akademischen oder beruflichen Referenzen

Bewerbungen werden fortlaufend geprüft, bis die Stelle besetzt ist.

Ihre Aufgaben

Verantwortlichkeiten und Projekt
Die Stelle unterstützt die Entwicklung eines Forschungs-Data-Lake für empirische Arbeiten mit grossen finanziellen, textlichen, lizenzierten und teilweise vertraulichen Datensätzen. Ziel ist es, eine robuste, gut dokumentierte und reproduzierbare Dateninfrastruktur zu schaffen, die Forschenden ermöglicht, Daten effizient und sicher zu erfassen, zu speichern, zu verarbeiten, zu dokumentieren und zu analysieren.
Forschungs- und Infrastrukturaufgaben umfassen Data Engineering, Programmierung, Dokumentation und Koordination mit Forschenden und IT-/Plattformanbietern. Kernaufgaben sind unter anderem:

Entwurf und Implementierung des Forschungs-Data-Lake

Unterstützung beim Entwurf einer skalierbaren Datenarchitektur für ca. 5 TB Forschungsdaten
Strukturierung der Daten in Roh-, bereinigte und analysebereite Schichten
Entwicklung klarer Benennungskonventionen, Ordnerstrukturen, Zugriffsregeln und Dokumentationsstandards
Sicherstellung, dass der Data Lake die langfristige Aufbewahrung von Roh- und verarbeiteten Daten unterstützt

Datenaufnahme und Integration

Aufbau automatisierter Workflows zum Import von Daten von externen Anbietern, Datenbanken, APIs, Dateilieferungen und von Forschenden gepflegten Quellen
Integration von Finanzdatensätzen, Textdatensätzen und anderen lizenzierten Forschungsdaten in eine konsistente Infrastruktur
Implementierung von Validierungsprüfungen, Protokollierung, Fehlerbehandlung und Versionskontrolle bei Datenaktualisierungen
Dokumentation der Datenherkunft, Lizenzen, Aktualisierungsfrequenzen und Nutzungsbeschränkungen

Automatisierung von Forschungspipelines

Entwicklung reproduzierbarer Pipelines zum Bereinigen, Transformieren und Vorbereiten von Datensätzen für empirische Forschung
Erstellung wiederverwendbarer Skripte und Vorlagen für wiederkehrende Datentasks
Unterstützung von Forschenden bei der Umwandlung manueller Datenarbeit in automatisierte und dokumentierte Workflows
Beitrag zu reproduzierbaren Forschungspraktiken durch Git-basierte Codeverwaltung und klare Pipeline-Dokumentation

Datenverwaltung, Vertraulichkeit und Zugriffsmanagement

Mitwirkung bei der Implementierung von Verfahren zum Umgang mit lizenzierten und vertraulichen Datensätzen
Unterstützung von rollenbasierten Zugriffskonzepten, Dokumentation von Datenberechtigungen und Einhaltung von Anbietervereinbarungen
Erstellung von Dateninventaren und Metadaten-Dateien, um Datensätze für das Forschungsteam auffindbar und nutzbar zu machen
Koordination mit interner IT oder externen Plattformanbietern bei Bedarf

Forschungsunterstützung

Unterstützung von Forschenden bei Datenvorbereitung, Qualitätsprüfungen, explorativer Analyse und technischer Fehlerbehebung
Bereitstellung von Dokumentationen und kurzen internen Anleitungen, damit die Infrastruktur über die initiale Projektphase hinaus gepflegt werden kann
Beitrag zu weiteren datenintensiven Forschungsprojekten am Lehrstuhl oder Institut, wo angemessen

Die Stelle eignet sich besonders für Kandidat:innen, die Data Science, Data Engineering und angewandte akademische Forschung verbinden möchten. Die Rolle bietet die Möglichkeit, eine Forschungsinfrastruktur von Grund auf aufzubauen und Erfahrungen mit grossen, realen Forschungsdaten zu sammeln.

Ihr Profil

Masterabschluss in Data Science, Informatik, Statistik, Ökonometrie, Informationssystemen oder einem eng verwandten Fachgebiet
Starkes Interesse an Forschungsdateninfrastruktur, Data Engineering, Automatisierung empirischer Forschungspipelines und reproduzierbarer Wissenschaft
Ausgezeichnete Programmierkenntnisse, vorzugsweise in Python und SQL; Erfahrung mit R, Stata oder Matlab ist von Vorteil
Erfahrung mit Data Engineering Tools und Workflows, wie APIs, ETL/ELT-Pipelines, Git, Docker, Workflow-Automatisierung, Metadaten-Dokumentation oder cloudbasierten Forschungsumgebungen
Vertrautheit mit strukturierten und unstrukturierten Daten, inklusive Finanzdatensätzen, Textdaten und grossen Dateisystemen
Gutes Verständnis von Datenverwaltung, Zugriffskontrolle, Dokumentation und Reproduzierbarkeit
Bereitschaft, sorgfältig mit lizenzierten und vertraulichen Forschungsdaten umzugehen
Hohe Motivation und Fähigkeit, selbstständig sowie in enger Zusammenarbeit mit Forschenden und IT-/Dateninfrastruktur-Anbietern zu arbeiten
Vorerfahrung mit cloudbasierten Data-Science-Plattformen ist von Vorteil

"Ein Ort, an dem Wissen geschaffen wird" – Als eine der führenden europäischen Universitäten für Wirtschaftswissenschaften und Betriebswirtschaft ist die Universität St. Gallen (HSG), Schweiz, der Ausbildung von über 10.000 Studierenden verpflichtet. Die HSG ist einer der grössten Arbeitgeber der Region und bietet mehr als 3.500 Forschenden, Lehrenden und Fachkräften ein attraktives und innovatives Umfeld.

Wissenschaftliche Hilfskraft Data Science / Data Lake Engineer (m/w/d)

Aufgaben

Fähigkeiten

Über den Job

Lohnrechner