Zurich
Hier
Stage en recherche en vision par ordinateur : Modélisation image-séquence (par ex. Transformers)
- Date de publication :02 décembre 2025
- Taux d'activité :100%
- Type de contrat :Durée indéterminée
- Lieu de travail :Zurich
Résumé de l'emploi
Rejoignez Scandit pour un stage de recherche passionnant!
Tâches
- Développer des architectures ML pour des données visuelles complexes.
- Évaluer des paradigmes de modélisation alternatifs en vision par ordinateur.
- Réaliser des expériences systématiques pour valider les hypothèses.
Compétences
- Étudiant en MSc ou PhD en IA ou domaine connexe.
- Maîtrise de Python et de frameworks de deep learning.
- Compétences analytiques solides en interprétation des résultats.
Est-ce utile ?
À propos de cette offre
Durée : Minimum 6 mois ; idéalement 9–12 mois, selon l’expérience du candidat
Scandit donne des super-pouvoirs aux gens. Que ce soit pour permettre aux livreurs d’effectuer des livraisons plus rapides, associer un patient à son médicament, ou aider les détaillants à rendre les opérations en magasin plus efficaces, notre technologie automatise les flux de travail et fournit des informations exploitables pour aider les entreprises dans divers secteurs. Rejoignez-nous alors que nous continuons à nous développer, croître et innover, et aidez à porter Scandit au niveau supérieur.
À propos du stage
Nous proposons un stage axé sur la recherche visant à faire progresser les méthodes d’apprentissage automatique pour des tâches complexes de compréhension visuelle. Le projet se concentre sur les architectures d’apprentissage profond pour la modélisation image-séquence, telles que les Transformers, les mécanismes d’attention, et les cadres modernes d’apprentissage de séquences et de représentations, afin de résoudre des problèmes complexes et très structurés en vision par ordinateur. Ce projet contribue à des efforts de recherche à long terme visant à atteindre des performances, une robustesse et une généralisation encore plus élevées dans des applications visuelles à grande échelle.
Ce que vous ferez
Vous travaillerez en étroite collaboration avec des chercheurs et ingénieurs ML expérimentés sur des recherches de pointe à l’intersection de la vision par ordinateur et de la modélisation de séquences. Votre travail comprendra :
- Concevoir et expérimenter de nouvelles architectures ML pour des données visuelles structurées.
- Évaluer des paradigmes de modélisation alternatifs (par ex., encodeur-décoder, modèles hybrides Transformer, représentations basées sur des séquences).
- Étudier des techniques pour améliorer la robustesse, la généralisation et le raisonnement multi-vues.
- Réaliser des expériences systématiques, des ablations et des analyses d’erreurs pour valider les hypothèses de recherche.
Ce projet offre des opportunités de conception de modèles novateurs, d’expérimentation approfondie et de recherche académique. Vous contribuerez à l’innovation à long terme de notre technologie, avec un impact potentiel dans le monde réel pour des millions d’utilisateurs. Une position idéale pour des étudiants de master expérimentés, des collaborations doctorales ou des candidats préparant une carrière de recherche en industrie ou en milieu académique.
Qui vous êtes
Étudiant MSc ou PhD en informatique, apprentissage automatique, intelligence artificielle ou domaine connexe avec un fort accent sur la recherche. Les candidats doivent avoir une solide base en théorie de l’apprentissage automatique, réseaux neuronaux et vision par ordinateur.
Compétences essentielles :
- Maîtrise de Python et des frameworks d’apprentissage profond tels que PyTorch.
- Expérience pratique dans la conception, l’entraînement et l’évaluation de réseaux neuronaux, y compris CNN et architectures basées sur Transformer.
- Solides capacités analytiques et de résolution de problèmes, avec la capacité d’interpréter les résultats expérimentaux et d’itérer efficacement.
- Familiarité avec les bonnes pratiques de recherche, y compris la reproductibilité, les expériences contrôlées et les études d’ablation.
Compétences souhaitables :
- Expérience préalable en recherche en vision par ordinateur, reconnaissance de formes, modélisation de séquences ou architectures image-séquence.
- Expérience dans l’entraînement de modèles à grande échelle ou travail avec des architectures de type fondation.
- Contributions à des publications, prépublications ou projets open source en apprentissage automatique.
Excellentes compétences en communication et capacité à travailler de manière autonome dans un environnement orienté recherche.
Ce que nous offrons
- Nous sommes certifiés « Great Place to Work » dans 10 pays !
- Une équipe hautement qualifiée et un environnement agréable où vous pouvez mettre à profit votre enthousiasme pour les défis en vision par ordinateur et les technologies de pointe
- Hackathons, fêtes d’été, sorties d’entreprise et autres événements réguliers
- Bureau au centre-ville de Zurich
Qui nous sommes
Votre code pourrait-il donner des super-pouvoirs ? Que ce soit pour permettre aux livreurs d’effectuer des livraisons plus rapides, associer un patient à son médicament ou aider les détaillants à rendre les opérations en magasin plus efficaces, notre technologie automatise les flux de travail et fournit des informations exploitables pour aider les entreprises dans divers secteurs. Cela signifie que nous n’avons pas de pénurie de défis techniques pour des ingénieurs comme vous. Rejoignez-nous alors que nous continuons à nous développer, croître et innover, et aidez à porter Scandit au niveau supérieur.
« Tout le monde est le bienvenu ici » - est un élément célébré de notre ADN.
Chez Scandit, nous nous efforçons de créer un environnement inclusif qui responsabilise nos employés. Nous croyons que nos produits et services bénéficient de nos origines et expériences diverses et sommes fiers d’être un espace sûr pour tous.
Toutes les candidatures qualifiées seront examinées sans distinction de race, couleur, nationalité, religion, orientation sexuelle, genre, identité de genre, âge, handicap physique ou durée de chômage.