Forschungspraktikum Computer Vision: Bild-zu-Sequenz-Modellierung (z. B. Transformer)
Zurich
Auf einen Blick
- Veröffentlicht:02 Dezember 2025
- Pensum:100%
- Vertragsart:Festanstellung
- Arbeitsort:Zurich
Job-Zusammenfassung
Scandit bietet ein Praktikum im Bereich maschinelles Lernen an. Arbeite in einem innovativen Umfeld, das Vielfalt und Inklusion fördert.
Aufgaben
- Forschung zu ML-Methoden für komplexe visuelle Aufgaben.
- Experimentieren mit neuartigen ML-Architekturen für strukturierte Daten.
- Durchführung systematischer Experimente zur Validierung von Hypothesen.
Fähigkeiten
- MSc oder PhD in Informatik, ML oder verwandtem Bereich erforderlich.
- Kenntnisse in Python und Deep Learning-Frameworks wie PyTorch.
- Analytische Fähigkeiten und Erfahrung in der Netzwerkbewertung.
Ist das hilfreich?
Dauer: Mindestens 6 Monate; idealerweise 9–12 Monate, abhängig von der Erfahrung des Kandidaten
Scandit verleiht Menschen Superkräfte. Ob es darum geht, Lieferfahrern schnellere Zustellungen zu ermöglichen, einen Patienten mit seiner Medikation abzugleichen oder Einzelhändlern zu helfen, die Geschäftsabläufe effizienter zu gestalten – unsere Technologie automatisiert Arbeitsabläufe und liefert umsetzbare Erkenntnisse, die Unternehmen in verschiedenen Branchen unterstützen. Schließe dich uns an, während wir weiter expandieren, wachsen und innovativ sind, und hilf dabei, Scandit auf die nächste Stufe zu heben.
Über das Praktikum
Wir bieten ein forschungsorientiertes Praktikum an, das darauf abzielt, Methoden des maschinellen Lernens für komplexe visuelle Verständnisaufgaben voranzutreiben. Das Projekt konzentriert sich auf Deep-Learning-Architekturen für die Bild-zu-Sequenz-Modellierung, wie Transformer, Aufmerksamkeitsmechanismen und moderne Sequenz- und Repräsentationslern-Frameworks, um herausfordernde und hochstrukturierte Computer-Vision-Probleme zu adressieren. Dieses Projekt trägt zu langfristigen Forschungsbemühungen bei, die darauf abzielen, noch höhere Leistung, Robustheit und Generalisierung in groß angelegten visuellen Anwendungen zu erreichen.
Was du tun wirst
Du arbeitest eng mit erfahrenen ML-Forschern und Ingenieuren an modernster Forschung an der Schnittstelle von Computer Vision und Sequenzmodellierung zusammen. Deine Aufgaben umfassen:
- Entwurf und Experimentieren mit neuen ML-Architekturen für strukturierte visuelle Daten.
- Bewertung alternativer Modellierungsparadigmen (z. B. Encoder-Decoder, hybride Transformer-Modelle, sequenzbasierte Repräsentationen).
- Untersuchung von Techniken zur Verbesserung von Robustheit, Generalisierung und Mehransichts-Schlussfolgerungen.
- Durchführung systematischer Experimente, Ablationen und Fehleranalysen zur Validierung von Forschungshypothesen.
Dieses Projekt bietet Möglichkeiten für neuartige Modellgestaltung, umfangreiche Experimente und wissenschaftliche Forschung. Du wirst zur langfristigen Innovation unserer Technologie beitragen, mit potenziell realen Auswirkungen für Millionen von Nutzern. Eine ideale Position für erfahrene Masterstudierende, Doktorandenkooperationen oder Kandidaten, die eine Forschungskarriere in Industrie oder Wissenschaft anstreben.
Wer du bist
Master- oder Doktorand/in in Informatik, Maschinellem Lernen, Künstlicher Intelligenz oder einem verwandten Bereich mit starkem Forschungsfokus. Kandidaten sollten eine solide Grundlage in maschinellem Lernen, neuronalen Netzen und Computer Vision besitzen.
Wesentliche Fähigkeiten:
- Kenntnisse in Python und Deep-Learning-Frameworks wie PyTorch.
- Praktische Erfahrung im Entwurf, Training und der Bewertung neuronaler Netze, einschließlich CNNs und Transformer-basierter Architekturen.
- Starke analytische und problemlösende Fähigkeiten mit der Fähigkeit, experimentelle Ergebnisse zu interpretieren und effektiv zu iterieren.
- Vertrautheit mit bewährten Forschungspraktiken, einschließlich Reproduzierbarkeit, kontrollierten Experimenten und Ablationsstudien.
Wünschenswerte Fähigkeiten:
- Frühere Forschungserfahrung in Computer Vision, Mustererkennung, Sequenzmodellierung oder Bild-zu-Sequenz-Architekturen.
- Erfahrung im Training groß angelegter Modelle oder mit Foundation-Style-Architekturen.
- Beiträge zu Publikationen, Preprints oder Open-Source-Projekten im Bereich maschinelles Lernen.
Starke Kommunikationsfähigkeiten und die Fähigkeit, selbstständig in einer forschungsorientierten Umgebung zu arbeiten.
Was wir bieten
- Wir sind in 10 Ländern als „Great Place to Work“ zertifiziert!
- Ein hochqualifiziertes Team und eine angenehme Umgebung, in der du deine Begeisterung für Herausforderungen in der Computer Vision und modernste Technologien einbringen kannst
- Hackathons, Sommerfeste, Firmenausflüge und weitere regelmäßige Veranstaltungen
- Büro im Stadtzentrum von Zürich
Wer wir sind
Könnte dein Code Superkräfte verleihen? Ob es darum geht, Lieferfahrern schnellere Zustellungen zu ermöglichen, einen Patienten mit seiner Medikation abzugleichen oder Einzelhändlern zu helfen, die Geschäftsabläufe effizienter zu gestalten – unsere Technologie automatisiert Arbeitsabläufe und liefert umsetzbare Erkenntnisse, die Unternehmen in verschiedenen Branchen unterstützen. Das bedeutet, dass wir keine technischen Herausforderungen für Ingenieure wie dich missen. Schließe dich uns an, während wir weiter expandieren, wachsen und innovativ sind, und hilf dabei, Scandit auf die nächste Stufe zu heben.
„Jeder ist hier willkommen“ – ist ein gefeierter Bestandteil unserer DNA.
Bei Scandit bemühen wir uns, ein inklusives Umfeld zu schaffen, das unsere Mitarbeitenden stärkt. Wir glauben, dass unsere Produkte und Dienstleistungen von unseren vielfältigen Hintergründen und Erfahrungen profitieren und sind stolz darauf, ein sicherer Ort für alle zu sein.
Alle qualifizierten Bewerbungen werden unabhängig von Rasse, Hautfarbe, Nationalität, Religion, sexueller Orientierung, Geschlecht, Geschlechtsidentität, Alter, körperlicher [Beeinträchtigung] oder Dauer der Arbeitslosigkeit berücksichtigt.