Automatyczne wykrywanie pól dokumentu

Nasze analizatory inteligentnie rozpoznają i automatycznie wykrywają unikalne wartości pól z przesłanych dokumentów.

Rozpoznawanie języka dokumentu

Wykryj język zeskanowanych lub wydrukowanych dokumentów, obrazów i plików PDF.

Optyczne rozpoznawanie znaków (OCR)

Konwertuj zeskanowane lub wydrukowane dokumenty, w tym obrazy i pliki PDF, na tekst do odczytu maszynowego.

Integracja i automatyzacja

Nasze analizatory dokumentów można zintegrować z istniejącymi systemami oprogramowania lub procesami pracy.

API rozpoznawania języka dokumentu

Parse Documents to solidny zestaw interfejsów API zaprojektowany tak, aby spełniać wszystkie wymagania dotyczące analizy dokumentów. Naszym celem jest uproszczenie złożonego procesu zarządzania dokumentami, niezależnie od tego, czy jest to wyszukiwanie, analiza czy obsługa błędów. Obejmują one łatwe sortowanie stron, szeroką gamę obsługiwanych typów dokumentów i dokładne raportowanie błędów.

Wszechstronność i elastyczność

Korzystając z naszych różnych interfejsów API, możesz nie tylko czytać przesłane dokumenty, ale także umieszczać je w kolejce do analizy poprzez bezpośrednie przesłanie lub link zewnętrzny. Nasze interfejsy API zostały zaprojektowane z myślą o dynamicznym charakterze biznesu, dzięki czemu mogą bezproblemowo dostosowywać się do różnorodnych potrzeb i konfiguracji biznesowych.

Konfiguracja Swaggera

Interfejsy API są kodowane zgodnie ze specyfikacją OpenAPI (OAS), dzięki czemu proces integracji jest bezproblemowy i prosty. Zapewniamy obszerną dokumentację opartą na interfejsie użytkownika Swagger, która szczegółowo opisuje możliwe odpowiedzi oraz możliwe kody statusu i błędów.

Twoje bezpieczeństwo jest naszym priorytetem

Wszystkie żądania API są uwierzytelniane przy użyciu nagłówków JWT w celu zapewnienia maksymalnego bezpieczeństwa. Dzięki temu Twoje wrażliwe dane w dokumentach będą zawsze chronione.

Zacznijmy

Cieszymy się, że jesteś na pokładzie i nie możemy się doczekać, aby zobaczyć, jak zintegrujesz i zmaksymalizujesz korzyści z Parse Documents w swoich operacjach zarządzania dokumentami!

Pamiętaj, aby zastąpić „YourAuthTokenHere” rzeczywistym tokenem okaziciela.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Przekształć proces przetwarzania dokumentów za pomocą zaawansowanego systemu ekstrakcji danych opartego na sztucznej inteligencji, który pomoże Ci podejmować mądrzejsze decyzje.