Détection automatique des champs du document

Nos analyseurs reconnaissent intelligemment et détectent automatiquement les valeurs de champ uniques des documents téléchargés.

Reconnaissance de la langue du document

Détectez la langue des documents numérisés ou imprimés, des images et des fichiers PDF.

Reconnaissance optique de caractères (OCR)

Convertissez des documents numérisés ou imprimés, y compris des images et des fichiers PDF, en texte lisible par machine.

Intégration et automatisation

Nos analyseurs de documents peuvent être intégrés dans des systèmes logiciels ou des processus de travail existants.

API de reconnaissance de la langue des documents

Parse Documents est un ensemble robuste d'API conçues pour répondre à toutes les exigences d'analyse de documents. Notre objectif est de simplifier le processus complexe de gestion des documents, qu'il s'agisse de recherche, d'analyse ou de gestion des erreurs. Ceux-ci incluent un tri facile des pages, un large éventail de types de documents pris en charge et un rapport d'erreurs approfondi.

Polyvalence et flexibilité

Grâce à nos différentes API, vous pouvez non seulement lire les documents téléchargés, mais également mettre les documents en file d'attente pour analyse par téléchargement direct ou par lien externe. Nos API sont conçues en tenant compte de la nature dynamique de l’entreprise, leur permettant de s’adapter de manière transparente à une variété de besoins et de configurations commerciales.

Configuration fanfaronne

Les API sont codées selon la spécification OpenAPI (OAS), ce qui rend le processus d'intégration simple et sans tracas. Nous fournissons une documentation complète basée sur l'interface utilisateur Swagger qui détaille les réponses possibles ainsi que les codes d'état et d'erreur possibles.

Votre sécurité est notre priorité

Toutes les requêtes API sont authentifiées à l'aide des en-têtes JWT pour une sécurité maximale. Cela garantit que les données sensibles de vos documents seront toujours protégées.

Commençons

Nous sommes ravis de vous compter parmi nous et avons hâte de voir comment vous intégrerez et maximiserez les avantages de Parse Documents dans vos opérations de gestion de documents !

Assurez-vous de remplacer "YourAuthTokenHere" par le jeton du porteur réel.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Transformez votre processus de traitement de documents avec un système d'extraction de données avancé basé sur l'IA qui vous aide à prendre des décisions plus intelligentes.