Skip links

Salesforce Document AI : Exploitez vos données non structurées

Dans la plupart des organisations, une grande partie des données précieuses est présente dans des emplacements difficilement accessibles par votre CRM.

Notes de rendez-vous, contrats, comptes-rendus, étiquettes produits ou emails… ces données précieuses sont là, mais elles restent silencieuses.

C’est ce que l’on appelle la donnée non structurée.

Jusqu’à présent, cette masse d’informations restait sous-exploitée : trop coûteuse à saisir manuellement, impossible à requêter et déconnectée de vos processus automatisés. Mais avec l’arrivée de Document AI, intégré nativement à Data360 (ex-Data Cloud), la situation est en train de changer.

Document AI ne se contente pas de lire vos documents : il les comprend. Ce service ingère vos fichiers bruts, en extrait les points pivots (montants, dates, etc.) qui peuvent alors être injecter dynamiquement dans votre modèle de données Salesforce.

Découvrez comment transformer vos documents dormants en leviers de croissance et passer d’une gestion documentaire passive à une vision client 360° réellement augmentée.

Le défi de la donnée non structurée

80 % des données d’entreprise sont aujourd’hui non structurées (Gartner)
Selon Gartner, leur volume augmente trois fois plus vite que celui des données structurées. Pour une entreprise utilisant Salesforce, cela signifie que la majorité de l’intelligence client se trouve hors de portée : dans des comptes-rendus de réunion, des contrats PDF ou des retours terrain. Ces documents contiennent des signaux commerciaux faibles ou forts, mais ils sont isolés du reste de l’écosystème. Ces données ne peuvent donc être ni analysées à grande échelle, ni exploitées dans vos workflows, ni utilisées par vos agents IA.
  • Ressaisie manuelle des informations : temps perdu, processus chronophages et erreurs humaines ❌
  • Délais de traitement : l’information existe mais n’est pas disponible au bon moment, au risque de coûter des opportunités commerciales ou de dégrader l’expérience client ❌
  • Efficacité décisionnelle diminuée : des signaux commerciaux critiques passent inaperçus ❌

L’entreprise se retrouve alors face à un paradoxe : elle dispose de plus en plus de données, mais une grande partie lui échappe, réduisant ainsi l’efficacité opérationnelle et la prise de décision.

Document AI : l'outil qui lit, comprend et structure vos documents automatiquement

Document AI est un service d’extraction de données conçu pour analyser des contenus non structurés et les convertir en données structurées utilisables dans Salesforce ou Data Cloud. Ce n’est plus un simple lecteur, c’est un extracteur intelligent basé sur des modèles de langage (LLM).
Disponible en GA depuis la release Summer ’25, il a été conçu pour répondre à un besoin précis : Rendre exploitables, de manière fiable et automatisée, des informations enfermées dans des documents.
Contrairement aux outils traditionnels, Document AI n’a pas besoin que vos documents soient tous identiques au millimètre près. Il est capable de :
🧠 Interpréter le contexte Il fait la différence entre une « date de facturation » et une « date d’échéance », même si elles sont côte à côte.
📐 Gérer la variabilité Que votre contrat fasse 2 ou 50 pages, ou que le donnée soit à gauche ou à droite, l’IA localise l’information pertinente.
🛠️ Normaliser la donnée Il peut transformer un « 12 janv. 26 » écrit à la main en un format de date propre 12/01/2026 prêt pour Salesforce.
La véritable révolution réside dans la configuration. Aucun code complexe : vous pilotez l’extraction via un schéma dans Data Cloud où chaque champ est associé à une instruction en langage naturel. C’est ici que votre expertise métier intervient, en donnant au système un prompt structuré :
“Extrais le montant total TTC. Il s’agit de la valeur numérique la plus élevée du document, généralement précédée des termes ‘Total’ ou ‘À payer’ et exprimée en Euros.”
En associant ces instructions à des types de données précis (Texte, Nombre, Booléen), Document AI transforme un PDF inerte en un objet structuré, prêt à alimenter votre modèle de données métier (DMO) et à être utilisé par Agentforce.

Construction de votre premier modèle d’extraction avec Document AI

Avant de vous lancer dans une automatisation complète, la meilleure façon de comprendre Document AI consiste à créer un premier modèle simple et de tester l’extraction en temps réel, afin d’ajuster au mieux vos instructions.

Voici les étapes essentielles pour commencer :

1. Assignation des droits nécessaires

Le permission set “Data Cloud Architect” est nécessaire pour gérer les configurations dans Document AI.

2. Où créer votre premier modèle Document AI

App Launcher > Data Cloud > Process Content > Document AI > New

Cet espace vous permet d’accéder à vos modèles ou d’en créer des nouveaux.

3. Création de votre premier modèle pas à pas

Après avoir cliqué sur le bouton “New”, vous avez le choix entre deux options :

  • Créer un schéma à partir d’un Unstructured DMO
  • Créer un schéma sans objet source —> Utiliser cette option pour ce premier modèle. Il s’agit de l’option à utiliser pour étendre le modèle à un usage en apex, dans un flow ou dans Agentforce.

Vous voici donc dans le builder et l’outil de configuration de votre schéma Document AI. Vous pouvez dès à présent charger vos fichiers qui vont pouvoir être utilisés pour tester ce modèle.

Sur le panneau de gauche, vous avez la possibilité de créer votre modèle manuellement, à partir d’un template, ou en utilisation l’outil d’auto extraction.

4. Définition des champs et instructions

Après avoir fait votre choix et cliquer sur “Next”, vous avez la possibilité d’ajouter de nouveaux champs à extraire. Il s’agit ici de décrire la liste de champs à retrouver dans vos fichiers et de choisir le type associé (text, number, boolean). A ce jour, seuls ces trois types de champ sont disponibles.

Pour chacun de ces champs, il va être nécessaire de définir des instructions. Il s’agit de la partie centrale de la configuration.

Quelques exemples d’instructions :
  • ”Extrais la date de signature du contrat. C’est un champ au format DD/MM/YYYY généralement placée à la fin du document”
  • ”Extrais le nom du client, qui représente l’entreprise signataire généralement dans l’en tête du document”
  • “Extrait le montant total TTC : il s’agit du montant le plus élevé exprimé en €”

Plus vos instructions sont claires et précises et plus l’IA sera en mesure de fournir des résultats fiables.

5. Tester votre modèle

Une fois vos champs et vos instructions définis, vous pouvez commencer vos tests. Pour un document choisi (pdf ou image), le système va vous afficher le texte détecté dans le document.

Intégration de Document AI avec Agentforce

Une fois votre configuration Document AI opérationnelle, l’étape suivante consiste à automatiser le traitement des documents entrants pour rendre les informations extraites directement accessibles à vos agents Agentforce. C’est ce qui permet de passer d’un usage ponctuel à une intégration complète dans vos processus métiers.

Déclencher automatiquement l’analyse d’un document

Chaque fois qu’un document est ajouté dans Salesforce, qu’il s’agisse d’un upload manuel, d’un document reçu par email ou généré par un processus métier, vous pouvez déclencher l’analyse via l’API Document AI. L’endpoint à appeler est :

{{salesforce_instance_url}}/services/data/{{api_version}}/ssot/document-processing/actions/extract-data?htmlEncode=false

L’appel peut être effectué depuis une méthode Apex. Cette méthode se charge de :

  • récupérer le fichier (ContentDocument/ContentVersion),
  • appeler l’API d’extraction,
  • analyser le JSON retourné,
  • et stocker les valeurs extraites dans un objet dédié ou dans vos enregistrements métiers.

Cela permet, par exemple, d’enrichir automatiquement un Case, un Contact ou une Opportunité sans aucune intervention humaine.

Process automatisation Document AI
Mettre les résultats à disposition d’un agent Agentforce

En exposant votre méthode Apex comme invocable, vous pouvez ensuite l’intégrer dans un topic Agentforce sous forme d’action. L’agent devient alors capable de :

  • analyser un document à la demande,
  • extraire les informations importantes,
  • générer un résumé du contenu,
  • ou répondre à des questions précises sur les éléments trouvés dans le fichier.
Exemples :
“Peux-tu analyser les contrats et amendements joints et me donner la date de signature la plus récente ?”
“Quel est le montant total des factures de mon client ?”
“Résume le rapport technique attaché à ce dossier.”

L’agent s’appuie entièrement sur les données extraites par Document AI, ce qui lui permet de répondre sans ouvrir les pièces jointes. Automatiser l’extraction avec Document AI et Agentforce permet :

D’éliminer la lecture manuelle
De fiabiliser les données métier
De gagner en vitesse
D’améliorer la pertinence des agents

Vos documents ne sont plus une source d’information isolée : ils deviennent une partie intégrée et exploitable de votre CRM et de vos automatisations IA.

Vers une vision 360 réellement augmentée par l’IA

L’automatisation de l’extraction documentaire n’est pas seulement une optimisation technique. C’est une transformation beaucoup plus profonde : celle qui consiste à intégrer, dans votre CRM, une masse d’informations qui étaient jusqu’ici invisibles, inexploitables ou perdues dans des pièces jointes.

Grâce à Document AI, ces informations deviennent :

  • structurées,
  • fiables,
  • immédiatement activables,
  • et compréhensibles par vos agents Agentforce.

Ce passage d’un monde basé sur la saisie manuelle à un monde basé sur la compréhension automatique ouvre une nouvelle génération d’usages. En automatisant l’analyse de vos documents, Document AI transforme un volume important de données invisibles en informations exploitables. Combiné avec Agentforce, il permet de mettre cette intelligence au service de vos utilisateurs, de vos processus et de votre relation client.

C’est une étape clé vers un CRM réellement augmenté : un système qui ne se contente plus de stocker des informations, mais qui contribue activement à les comprendre et à les valoriser.