VigieProcure
Data Intelligence for Business
Plateforme opérationnelle
Cockpit data · Mai 2026

L'intelligence de la commande publique, en un coup d'œil.

Vision factuelle, continue et enrichie du gisement de marchés publics français et européens — couverture, qualité, contacts, profondeur historique et intelligence sémantique propulsée par les modèles les plus performants du marché.

marchés
Indexés en base · BOAMP · TED · DECP
3 sources officielles Profondeur historique : 2015 → aujourd'hui Mise à jour : toutes les 12 h Périmètre : France métropole · DOM · Europe

01Couverture

L'étendue du gisement indexé, marché par marché, acheteur par acheteur.

FR · UE
Marchés actifs
Marchés publiés et exploitables, hors archives clôturées.
SIRET
Acheteurs publics uniques
Entités identifiées par SIRET — collectivités, ministères, hôpitaux, EPCI.
CPV
Codes CPV couverts
Nomenclature européenne des fournitures, services et travaux.
Sources d'ingestion actives
BOAMP
France · quotidien
TED
Europe · 27 États
DECP
data.gouv · open data
Profondeur historique
2015→ 2026
11 années de données structurées, requêtables et croisées par acheteur, CPV et territoire.

02Qualité des données

Le degré d'exploitabilité commerciale du gisement, métrique par métrique.

Acheteurs identifiés
SIRET valide rapproché du référentiel INSEE Sirene.
Budget renseigné
Montant estimé ou plafonné présent dans la publication.
Durée du marché
Durée contractuelle exprimée en mois — clé pour la détection de renouvellement.
Acheteurs enrichis
Croisement Sirene + INSEE — type, taille, territoire, code APE.
Titres normalisés
Titre nettoyé et standardisé pour la recherche et le scoring.

03Contacts décisionnaires

Interlocuteurs identifiés pour chaque marché — clé de la prise de contact commerciale.

Contacts
Contacts liés à un marché
Email, téléphone, correspondant, adresse — extraits automatiquement des publications.
Marchés avec contact direct
Part du gisement avec au moins un point de contact exploitable.
Emails renseignés
emails uniques identifiés.
Téléphones renseignés
Lignes directes acheteur ou service marchés.
Personnes
Interlocuteurs distincts identifiés
Correspondants nommément identifiés sur l'ensemble du gisement — base d'un ciblage commercial fin.
RGPD
Sources & traitement
Données publiques officielles
Contacts extraits exclusivement des publications légales BOAMP / TED / DECP — usage commercial conforme.

04Intelligence sémantique

Recherche en langage naturel, extraction structurée et scoring par affinité métier — propulsés par les modèles de référence du marché.

Recherche hybride dense + lexicale

Chaque marché est encodé en embedding multilingue (FR/EN) et croisé avec un index lexical BM25. La fusion par RRF (Reciprocal Rank Fusion) renvoie les marchés réellement pertinents, au-delà des correspondances de mots-clés.

Embeddings indexés
Vecteurs Milvus 2.4 (HNSW) + Elasticsearch BM25
Modèle d'embedding
E5-large · 560M · multilingue
Référence open-weight sur le benchmark MTEB multilingue.
Embedding
Recherche sémantique
E5-large-instruct
Multilingue FR/EN/26 langues — alternative à OpenAI text-embedding-3-large, en infra souveraine.
Extraction
LLM d'extraction structurée
Mistral-7B
Mistral-7B-Instruct quantifié AWQ — JSON strict, durée, montant, renouvellement extraits du DCE.
Roadmap
Modèles évalués en continu
BGE-M3 · Llama-3 · Mistral-Large
Benchmark FR mensuel, bascule conditionnée à un gain de précision > 3 points.

05Activité & fraîcheur

Le rythme d'enrichissement de la base et la fraîcheur des données servies.

30 jours
Marchés ingérés / jour
Moyenne glissante 30 jours — flux BOAMP, TED et DECP cumulés.
RT
Cadence de synchronisation
Toutes les 12 h
Pipeline orchestré 24/7 avec contrôle qualité automatique avant publication.
Marchés exploitables commercialement Indicateur composite — acheteur identifié, CPV présent, titre normalisé, budget ou durée renseignés. Reflète la part du gisement directement actionnable par une équipe commerciale.