Features
Toutes les fonctionnalités dont vous avez besoin
Une plateforme complète pour gérer le cycle de vie de vos données d'entreprise
01 · Ingestion
Ingestion intelligente
Importez vos documents depuis n'importe quelle source. Nous gérons l'extraction, le nettoyage et la préparation.
- Support multi-formats : PDF, DOCX, TXT, MD, HTML
- Connecteurs natifs : Notion, Google Drive, SharePoint
- OCR intégré pour les documents scannés
- Détection automatique de la langue
- Import en masse avec files d'attente
PDF Documents
1,284 docs
Notion
47 pages
Google Drive
312 files
Confluence
89 pages
GitHub
12 repos
Raw document
contract_2026.pdf · 2.4MB
chunk_1
~500 tok
chunk_2
~500 tok
chunk_3
~500 tok
Vectorized
1536 dim · pgvector
02 · Processing
Traitement avancé
Chunking intelligent, nettoyage et extraction de métadonnées pour une recherche optimale.
- Découpage intelligent avec préservation du contexte
- Nettoyage et normalisation automatique
- Extraction de métadonnées (auteur, date, tags)
- Déduplication de contenu
- File d'attente avec retry automatique
03 · Search API
Recherche puissante
Recherche sémantique avec filtres, reranking et API RESTful complète.
- Similarité vectorielle avec pgvector
- Filtres sur métadonnées (date, auteur, source)
- Recherche hybride (vectorielle + full-text)
- Reranking des résultats
- API RESTful avec authentification par clé
POST /api/v1/search
// Request
{
"query": "What is our refund policy?",
"limit": 5,
"threshold": 0.7
}
// Response
{
"results": [{
"content": "Our refund policy...",
"score": 0.92,
"document": "policies.pdf"
}]
}