← Back to jobs

Senior Data Scientist NLP/GenAI - Catalog

Worldwide

Role Summary

As a Senior Data Scientist in the NLP/GenAI team, you will prototype and deploy algorithms that address challenges related to marketplace catalogs, leveraging NLP, Computer Vision, and Generative AI. This senior role involves collaboration with Product, Data Engineers, and Development teams to create impactful solutions that enhance the user experience and optimize marketplace management across a diverse range of clients.

Benefits & Culture

This position offers the flexibility of full remote work, allowing you to work from anywhere, including Paris or Bordeaux. You will have the opportunity to implement cutting-edge algorithms that affect over 500 e-commerce sites globally, fostering an innovative and autonomous work environment. Additionally, Mirakl promotes a culture of diversity and inclusion, encouraging employees to share their work through presentations and conferences.

Full Job Description

Headquarters: Remote - France URL: http://mirakl.fr Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activit digitale afin d'acclrer de faon durable et rentable leur croissance.  Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avance, scurise et volutive leur permettant de digitaliser leur activit et d'largir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacit, offrir une exprience d'achat personnalise leurs clients, et augmenter leurs profits grce au retail media. Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations : www.mirakl.fr    A propos de Mirakl Labs Nos quipes techniques et produits, nommes Mirakl Labs, sont principalement rparties entre nos 2 hubs situs Paris et Bordeaux. Elles collaborent au quotidien afin d'adresser les problmatiques de nos clients et utilisateurs en rpondant diffrents challenges lis aux nouvelles fonctionnalits, la scalabilit, la scurit et l ergonomie& Elles oprent en mode agile et s'organisent en Squads composes d'un Squad Lead, de 5 dveloppeurs, d'un Product Manager et d'un QA. Chaque Squad est spcialise sur un scope fonctionnel afin de concevoir et raliser de nouvelles features, leurs volutions et des APIs (avec un dcoupage en micro-services). Nos quipes Infrastructure, Architecture, Scurit, Documentation, Product Design, Data et Support oprent en transverse en apportant leur expertise et de la cohrence sur l ensemble des produits. Toutes les quipes sont responsables de leur primtre et chacun des collaborateurs apporte son exprience et ses ides. Innovation, feedback et implication dans les prises de dcision sont au cSur de notre philosophie. Et pour favoriser ce partage avec d autres passionns, nous sommes sponsors, speakers, et htes de diffrents vnements, meetups, et associations de la scne Tech en France. Au cours des dernires annes, nous avons particip des vnements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.  A propos du job/ Intgr.e dans notre quipe Data Science, votre principale mission sera de prototyper, itrer, et mettre en production des algorithmes en collaboration avec les quipes Produit, les Data Engineers et les quipes de dveloppement./ Vos projets seront centrs sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) grande chelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos donnes riches et varies pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la scurit des utilisateurs et des transactions.Nous cherchons des personnes en CDI, sur Paris, Bordeaux ou en full remote Sujets catalogue :/ Rcriture automatique du contenu Marketing en fonction des attentes mtier Extraction d attributs produit partir d image et de texte libre Dtection de produits variants Catgorisation de produits Onboarding automatique des produits vendeurs Fusion de fiches produits provenant de sources multiples Prdiction de produits tendance Ce qu il y a pour vous dans ce job : Implmenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumtrie trs importantes (millions de produits, de clients, de commandes par an) Des techniques de pointe varies (modles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs franais avoir des LLM finetuns en production grande chelle. Rejoignez-nous pour continuer cultiver cet esprit pionnier Une vraie autonomie et responsabilit dans les projets dont vous avez ownership Notre stack et nos outils Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spcifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale. Au quotidien, vous allez : Analyser, prparer les donnes, prototyper des algorithmes Les mettre en production en collaboration avec les Data Engineers et les quipes de dveloppement Faire des dashboards afin d illustrer la pertinence des algorithmes et de monitorer la production Prsenter les rsultats au weekly data science et participer aux sessions de brainstorming de l quipe changer avec les autres quipes pour affiner les cas d utilisation, l exprience utilisateur et les modes d intgration/ Vous aimerez ce job si : Vous avez 4 ans d'exprience minimum en tant que Data Scientist, avec une exprience significative en NLP et ML appliqu en entreprise Vous avez dj mis en production des algorithmes de Machine Learning Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus) Vous matrisez Python, Tensorflow ou/et PyTorch Vous avez une exprience en dveloppement Spark Vous tes pragmatique, data-driven et orient mtier Vous aimez avoir l ownership de vos sujets et vous tes autonome et avez un trs bon esprit d quipe Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs Vous aimez partager votre travail dans le cadre de prsentations internes, dans des confrences ou en rdigeant des articles Envie de nous rejoindre? P Un change tlphonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de dcouvrir ce que Mirakl peut vous offrir en retour. Un premier change technique par zoom de 30 minutes avec une personne de l quipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de dcouvrir comment vos comptences peuvent s'intgrer nos projets. Un cas pratique raliser la maison. Une restitution et change technique avec un manager de l quipe Data Science de 75 minutes. Un dernier change de 1H par zoom avec des futurs collgues Mirakl autour de nos valeurs et de notre culture d entreprise./ Mirakl est engage en faveur de la diversit, de l galit des chances et de l inclusion. Nous clbrons nos diffrences car nous sommes convaincus que les qualits visibles et invisibles de chaque Mirakl Worker sont une source de force et d innovation. Dans le cadre de cet engagement, nous tudions toutes les candidatures sans distinction de : genre, ethnicit, religion, orientation sexuelle, handicap, ge ou toute autre caractristique protge par la loi. To apply: https://weworkremotely.com/remote-jobs/labs-senior-data-scientist-nlp-genai-catalog

Similar jobs

Found 6 similar jobs