[!info] TL;DR : La base vectorielle managée de référence pour alimenter tes apps RAG.
Pinecone : la mémoire longue durée de tes agents IA
Pinecone est une base de données vectorielle entièrement managée. Tu y stockes des embeddings et tu requêtes les plus proches sémantiquement en millisecondes. L'infrastructure qui permet au RAG de fonctionner à grande échelle, sans serveur à gérer.
Ce que ça permet
- Stocker des millions de vecteurs et les requêter en temps réel
- Alimenter des pipelines RAG (docs, emails, transcripts, code)
- Construire des moteurs de recommandation et de similarité
- Persister la mémoire long terme d'agents IA
Pour qui
- Devs qui construisent des apps RAG ou des agents avec mémoire
- Équipes qui ont besoin de recherche sémantique à grande échelle
- Projets qui veulent une infra vectorielle sans ops
Mini-playbook
- Crée un index Pinecone (choisis la dimension selon ton modèle d'embedding)
- Génère les embeddings de tes docs et upsert dans l'index
- À chaque requête : embed la question, query Pinecone, envoie les top-k au LLM
Pièges
- Plan gratuit limité à 1 index et 1 M de vecteurs : bien dimensionner
- Les coûts montent vite sur des volumes élevés : tester Supabase pgvector d'abord pour les petits projets
Tags
- Catégorie : 🤖 IA & LLM
- Tags : IA, Vecteurs, RAG, Base de données