Le célèbre chercheur en intelligence artificielle Andrej Karpathy, cofondateur d'OpenAI et ancien chef de la division IA de Tesla, vient de confirmer son arrivée chez Anthropic (la société d'IA derrière le chatbot Claude).
Cette décision est considérée comme une étape de renforcement notable d'Anthropic dans la concurrence de plus en plus féroce de l'IA avec OpenAI et Google.
Sur le réseau social X, Karpathy a déclaré qu'il avait officiellement rejoint Anthropic et qu'il reviendrait au travail de recherche et de développement de grands modèles linguistiques (LLM).
Selon Anthropic, Karpathy a commencé à travailler cette semaine au groupe de pré-entraînement dirigé par Nick Joseph.
Il s'agit du département responsable des stages de formation à grande échelle qui aident Claude à acquérir des connaissances de base et des compétences essentielles.
La pré-formation est considérée comme l'une des étapes les plus coûteuses et qui nécessite le plus de ressources de calcul dans le processus de développement de modèles d'IA avancés.
Anthropic a également déclaré que Karpathy construirait un groupe spécialisé dans l'utilisation de Claude pour soutenir et accélérer les activités de recherche pré-formation.
Les experts en technologie estiment que Karpathy est l'un des rares experts capables de relier la théorie du grand modèle linguistique à la pratique de l'entraînement à l'IA à très grande échelle.
Le recrutement d'Anthropic montre que l'entreprise parie sur une direction de recherche soutenue par l'IA, au lieu de dépendre uniquement de l'expansion de ses capacités de calcul.
Avant de rejoindre Anthropic, Karpathy a travaillé pendant de nombreuses années chez OpenAI en se concentrant sur l'apprentissage en profondeur et la vision assistée.
En 2017, il a quitté OpenAI pour rejoindre Tesla, où il dirige les programmes Autopilot et Full Self-Driving (FSD), deux projets principaux liés aux voitures autonomes de ce constructeur de voitures électriques.
Après avoir quitté Tesla en 2022, Karpathy est retourné à OpenAI pendant environ un an avant de repartir en 2024 pour créer Eureka Labs (start-up d'applications d'assistants en IA dans l'éducation).
Cependant, depuis son lancement, Karpathy n'a pas partagé beaucoup de nouvelles informations sur Eureka Labs. On ne sait pas encore s'il continuera à diriger cette startup.
Outre son travail de recherche sur l'IA, Karpathy est également largement connue dans la communauté technologique grâce à des cours et des conférences approfondies sur les réseaux neuronaux et les grands modèles linguistiques. Karpathy possède également une chaîne YouTube spécialisée dans le partage de connaissances sur l'IA et le LLM.
Parallèlement au recrutement de Karpathy, Anthropic a également ajouté l'expert en cybersécurité Chris Rohlf à l'équipe de test de durabilité de l'IA (red team). Cette division est chargée d'évaluer la résilience des modèles d'IA avancés aux menaces dangereuses.
Rohlf a plus de 20 ans d'expérience dans le domaine de la cybersécurité. Il a travaillé dans le célèbre groupe de sécurité "The Paranoids" de Yahoo et a travaillé pendant 6 ans chez Meta avant de rejoindre Anthropic. De plus, Rohlf a également participé à des recherches au Center for Emerging Security and Technology de l'université de Georgetown.
Selon Rohlf, l'IA pourrait ouvrir de grandes opportunités pour améliorer la cybersécurité mondiale et Anthropic est l'un des endroits les plus appropriés pour poursuivre cet objectif.