Tout comprendre sur DeepSeek : l’IA chinoise qui bouleverse

Nous sommes en fin janvier 2025. Et si vous suivez un peu la bourse américaine, vous avez sûrement vu passer le tremblement de terre financier qu’a causé DeepSeek. Cette startup chinoise – inconnue auparavant du monde occidental – qui a dévoilé un modèle d’intelligence artificielle (IA) nommé DeepSeek-R1 a fait fondre plus de 1 000 milliards de dollars des marchés à Wall Street.

Pourquoi tout ce remue-ménage ? Parce que DeepSeek-R1 est aussi performant que les meilleurs modèles américains, sauf qu’il a coûté une fraction du prix et – cerise sur le gâteau 🍒 – il est accessible gratuitement. Autant dire que dans la bataille technologique qui oppose la Chine et les États-Unis, certains y voient déjà un tournant historique, un peu comme le « moment Spoutnik » de l’IA.

1. DeepSeek-R1 : Un Modèle Révolutionnaire

Allier performance et efficacité

DeepSeek-R1 est présenté comme l’égal du modèle o1 d’OpenAI ou des derniers modèles d’Anthropic ou de Google. Il excelle en compréhension du langage, en raisonnement, en mathématiques et en codage (pour plus de détails, je vous invite à lire leur papier de recherche). Les premiers tests sont impressionnants, à la hauteur des géants américains (le media tom’s guide fait une bonne comparaison entre ChatGPT et DeepSeek ici).

Coût de développement extrêmement bas

Le plus étonnant dans tout ça ? C’est que ce modèle aurait couté 10 fois moins cher à entrainer que ses concurrents. Alors que des entreprises comme OpenAI, Meta ou Google investissent des centaines de millions, voire des milliards de dollars dans la recherche et le développement de l’IA, DeepSeek-R1 aurait été créé pour seulement 5,6 millions de dollars ! 💸

Sur les réseaux sociaux, on compare même DeepSeek à Tony Stark avec cette célèbre scène dans Iron Man.

(Même qui illustre le parallèle entre Tony Stark dans Iron Man et DeepSeek)

Open-source et gratuit

Contrairement à la tendance adoptée par la plupart des grandes sociétés technologiques américaines, DeepSeek-R1 est entièrement open source. Pour les non technophiles, ce mot signifie que toute personne peut accéder au modèle et le réutiliser sans restriction.

Cette approche bouscule profondément les modèles économiques existants, qui reposent surtout sur la vente d’abonnements ou sur des coûts à l’utilisation (API). DeepSeek propose aussi cette dernière option mais si vous souhaitez garder vos données confidentielles, il faudra éviter cette méthode. 🔐

2. Un Impact Économique et Stratégique

Choc sur les marchés boursiers

L’annonce de la sortie de DeepSeek-R1 a eu des conséquences immédiates : les entreprises américaines ont vu leurs actions chuter, craignant de ne plus être compétitives face à cette IA performante et peu coûteuse. Les investisseurs anticipent un bouleversement dans la recherche en IA : les milliards dépensés par les acteurs historiques pourraient ne plus être nécessaires pour proposer des performances équivalentes.

Réaction des entreprises américaines

  • OpenAI : La société a très vite réagi en annonçant une version gratuite de GPT-o3 Mini.
  • Meta (Facebook) : Mark Zuckerberg a mis en place une cellule de crise.
  • Changement de stratégie : De nombreuses entreprises envisagent désormais de valoriser davantage les applications construites au-dessus de l’IA plutôt que l’IA elle-même.

Pression sur les géants chinois

La secousse ne touche pas uniquement les entreprises américaines. Des acteurs majeurs comme Alibaba, ByteDance ou Tencent ont dû baisser le prix de leurs propres modèles d’IA, témoignant de l’effet concurrentiel immédiat provoqué par DeepSeek-R1.

Alibaba s’est précipité de dévoiler son dernier modèle qui excellerait dans le codage : Qwen 2.5 (je vous le testerai dans un prochain article 😉).

3. Origine et Technologie de DeepSeek

Liang WenFeng : un financier visionnaire

Fait étonnant, le fondateur de DeepSeek, Liang WenFeng, n’est pas un ingénieur de la Silicon Valley, mais un financier. Cofondateur du hedge fund High-Flyer, il a très tôt misé sur l’importance stratégique de l’IA pour anticiper les tendances du marché. Dès 2021, il a acheté des milliers de GPU Nvidia, prévoyant l’accélération de la demande et les éventuelles restrictions américaines.

Une architecture unique « Mixture of Experts »

Contrairement à GPT-4 qui cherche à « tout savoir » à partir d’un seul modèle centralisé, DeepSeek-R1 fonctionne comme une université composée de départements spécialisés. Chaque requête est ainsi redirigée vers une « équipe » d’experts dédiée, ce qui réduit drastiquement la consommation d’énergie et améliore la rapidité des réponses.

L’entraînement s’est également fait sans intervention humaine, grâce à l’apprentissage par renforcement, augmentant la fiabilité et la capacité d’adaptation du système.

Open-source, mais sous surveillance

L’ouverture du code et des modèles de DeepSeek-R1 a été applaudie par une grande partie de la communauté scientifique et des développeurs. Mais ça ne veut pas dire que le modèle est sécurisé pour autant.

Si vous l’utilisez à partir de leur site, vos données seront tracées et stockées sur leurs serveurs en Chine (historique des chats, fichiers, frappes clavier…etc). Pas top pour la protection des données…

Attendez-vous aussi qu’il y ait de la censure sur ce modèle ainsi que des plusieurs biais.

(Réponse de DeepSeek au prompt « est-ce que Taiwen est un pays indépendant ? »)

PS : Puisque le modèle de DeepSeek est open source, il est possible de le faire fonctionner en local (c’est-à-dire, uniquement sur votre ordinateur) ce qui permet de complètement protéger vos données. Retrouvez l’article complet ici 🐳.

4. Géopolitique et Enjeux de Sécurité

Une possible violation de la propriété intellectuelle ?

OpenAI accuse DeepSeek d’avoir utilisé les réponses de ChatGPT pour améliorer ses propres modèles. Si cette accusation se confirme, cela soulèverait un problème de propriété intellectuelle à l’échelle internationale. Le gouvernement américain a ouvert une enquête pour déterminer si DeepSeek-R1 a enfreint des lois sur la protection des technologies.

Mais n’oublions pas que Deepseek n’est pas le seul à piquer les données des autres. C’est une pratique courante dans ce milieu qui n’est pas très médiatisé. Je vous invite à voir la vidéo de MKBHD (Youtubeur tech américain) qui donne un très bon exemple : Sora (IA de génération de vidéos) serait entrainé sur ses vidéos sans son consentement.

Des sanctions contournées ?

Ce qui étonne encore plus la bourse américaine, c’est que DeepSeek a réussi cette prouesse technologique alors que le gouvernement des USA a interdit l’exportation de puces IA vers la Chine.

Il s’avère que – malgré ces sanctions – DeepSeek aurait réussi à obtenir des cartes graphiques Nvidia de pointe. Comme quoi il reste difficile de contrôler les transferts technologiques dans un contexte où l’IA est devenue un atout stratégique et géopolitique majeur.

L’interview de Alexandr Wang, Fondateur de Scale AI, dresse un panorama intéressant sur ce sujet.

5. Que nous réserve la suite ?

DeepSeek et l’avenir de l’IA

DeepSeek ne compte pas s’arrêter là. Des rumeurs annoncent un futur modèle dédié aux vidéos, concurrent potentiel à Sora d’OpenAI ou d’autres IA de génération visuelle.

OpenAI a déjà rendu gratuit son nouveau modèle o3-mini. La réponse des concurrents n’attend pas. Le monde de l’IA a repris un coup d’accélérateur. 🚀

Un futur dominé par l’IA ?

L’importance stratégique de l’IA ne fait plus de doute. Les récentes innovations démontrent une accélération du développement technologique, qui va se répercuter dans tous les secteurs « intellectuels ».

Tout le monde sera touché par ces évolutions. Ce n’est pas pour rien que les dirigeants de la tech s’accordent à dire qu’il faudra mettre en place un revenu universel. Mais avant que cela arrive, il est crucial pour toutes personnes actives d’être sensibilisées à ces technologies et de savoir les utiliser correctement.