Responsable Gen AI / Agentic AI
Vevey
Infos sur l'emploi
- Date de publication :09 octobre 2025
- Taux d'activité :100%
- Type de contrat :Durée indéterminée
- Lieu de travail :Vevey
Résumé de l'emploi
Infosys recrute un Lead Gen AI pour développer des solutions AI innovantes. Rejoignez un environnement dynamique offrant des opportunités de croissance.
Tâches
- Concevoir et déployer des applications Gen AI avec des LLMs.
- Optimiser les pipelines RAG avec des recherches sémantiques.
- Collaborer avec des équipes UX pour des solutions prêtes à la production.
Compétences
- Diplôme en informatique ou domaine similaire avec 4 ans d'expérience.
- Compétences avancées en Python et ML/AI.
- Expérience avec des bases de données vectorielles et services cloud.
Est-ce utile ?
Détails du poste
Lieu de travail
Alpharetta, GA, Austin, TX, Bridgewater, NJ, Charlotte, NC, Denver, CO, Hartford, CT, Houston, TX, New York, NY, Palm Beach, FL, Phoenix, AZ, Raleigh, NC, Richardson, TX, Sunnyvale, CA, Tampa, FL, Tempe, AZ
État / Région / Province
Arizona, Californie, Colorado, Connecticut, Floride, Géorgie, New Jersey, New York, Caroline du Nord, Texas, Virginie
Pays
États-Unis
Compétences
Technologie|Intelligence Artificielle|Intelligence Artificielle - TOUS, Technologie|Plateforme Cloud|AWS AI/ML, Technologie|développement mobile multiplateforme|React Native, Technologie|Science des données|Apprentissage automatique, Technologie|Apprentissage automatique|Python
Domaine
Conseil
Groupe d'intérêt
Infosys Limited
Entreprise
ITL USA
ID de la demande
140001BR
Description du poste
Infosys recherche un Responsable Gen AI / Agentic AI pratique pour piloter le développement et le déploiement de solutions d'IA de nouvelle génération utilisant des modèles de langage étendus (LLM), la génération augmentée par récupération (RAG) et les cadres Agentic AI. Ce rôle est idéal pour un ingénieur de niveau intermédiaire avec une forte expertise technique, une passion pour la construction, et la capacité de diriger de petites équipes ou flux de travail dans un environnement rapide et axé sur l'innovation.
Qualifications requises
Licence en informatique, IA/ML ou domaine connexe.
4 ans d'expérience en ingénierie logicielle ou science des données, dont 2 à 3 ans dans des systèmes Gen AI ou basés sur LLM.
Solides compétences en programmation Python et expérience avec les bibliothèques ML/IA (Hugging Face Transformers, LangChain, PyTorch).
Expérience pratique avec les bases de données vectorielles (FAISS, Pinecone, Weaviate, Azure AI Search).
Familiarité avec les plateformes cloud et les services Gen AI (AWS, Azure, GCP).
Expérience en développement d'API REST (FastAPI, Flask) et en conteneurisation (Docker).
Bonne compréhension de la gouvernance de l'IA, de la sécurité des modèles et de l'ingénierie des prompts.
Ce poste est situé à Bridgewater, NJ ; Sunnyvale, CA ; Austin, TX ; Raleigh, NC ; Richardson, TX ; Tempe, AZ ; Phoenix, AZ ; Charlotte, NC ; Houston, TX ; Denver, CO ; Hartford, CT ; New York, NY, Palm Beach, FL ; Tampa, FL ou Alpharetta, GA, ou le candidat doit être prêt à déménager.
Les candidats autorisés à travailler pour tout employeur aux États-Unis sans parrainage de visa basé sur l'employeur sont invités à postuler. Infosys ne peut pas fournir de parrainage d'immigration pour ce poste pour le moment.
Responsabilités clés
Concevoir, développer et déployer des applications Gen AI utilisant des LLM et des cadres agentic (par exemple, LangGraph, AutoGen, Crew AI).
Affiner les LLM open-source et propriétaires en utilisant des techniques comme LoRA, QLoRA et PEFT.
Construire et optimiser des pipelines RAG avec récupération hybride, découpage sémantique et recherche vectorielle.
Intégrer des solutions Gen AI avec des services cloud natifs (AWS Bedrock, Azure OpenAI, GCP Vertex AI).
Travailler avec des données non structurées (PDF, HTML, audio, images) et des modèles multimodaux.
Mettre en œuvre des pratiques LLMOps incluant la gestion des versions de prompts, la mise en cache, l'observabilité et le suivi des coûts.
Évaluer la performance des modèles à l'aide d'outils comme RAGAS, DeepEval et FMeval.
Collaborer avec les chefs de produit, les ingénieurs de données et les équipes UX pour fournir des solutions prêtes pour la production.
Encadrer les ingénieurs juniors et contribuer aux revues de code, discussions de conception et meilleures pratiques.
Qualifications préférées :
Exposition aux flux de travail agentic et agents autonomes.
Expérience avec les pipelines CI/CD et outils DevOps (GitHub Actions, Jenkins, Terraform).
Familiarité avec l'intégration front-end (React, Angular, TypeScript) et les API GraphQL.
Connaissance de l'interprétabilité des modèles, de la mitigation des biais et des systèmes humains dans la boucle.
Expérience avec les modèles multimodaux et les systèmes de perception (par exemple, vision + langage).
Le poste implique de rester assis ainsi que de travailler devant un ordinateur pendant de longues périodes. Doit être capable de communiquer par téléphone, email ou en face à face.
Fourchette de rémunération annuelle estimée pour les candidats dans les lieux ci-dessous :
Sunnyvale, CA ; Bridgewater, NJ ; New York, NY, Denver, CO : 73000 $ à 122275 $
En plus d'un salaire compétitif, en tant qu'employé à temps plein d'Infosys, vous bénéficiez également des avantages suivants :
Assurance médicale/dentaire/vision/vie
Invalidité de longue/courte durée
Comptes de remboursement santé et soins aux personnes à charge
Assurances (accident, maladie grave, indemnité hospitalière, juridique)
Plan 401(k) et contributions selon le niveau de salaire
Jours fériés payés plus congés payés.