Автоматическое определение полей документа

Наши анализаторы интеллектуально распознают и автоматически обнаруживают уникальные значения полей из загруженных документов.

Распознавание языка документа

Определите язык отсканированных или распечатанных документов, изображений и файлов PDF.

Оптическое распознавание символов (OCR)

Преобразуйте отсканированные или распечатанные документы, включая изображения и файлы PDF, в машиночитаемый текст.

Интеграция и автоматизация

Наши анализаторы документов можно интегрировать в существующие программные системы или рабочие процессы.

API распознавания языка документа

Parse Documents — это надежный набор API-интерфейсов, предназначенный для удовлетворения всех требований к анализу документов. Наша цель — упростить сложный процесс управления документами, будь то поиск, анализ или обработка ошибок. К ним относятся простая сортировка страниц, широкий спектр поддерживаемых типов документов и подробные отчеты об ошибках.

Универсальность и гибкость

Используя наши различные API, вы можете не только читать загруженные документы, но и ставить их в очередь для анализа путем прямой загрузки или внешней ссылки. Наши API разработаны с учетом динамичного характера бизнеса, что позволяет им легко адаптироваться к различным бизнес-потребностям и конфигурациям.

Конфигурация Swagger

API-интерфейсы кодируются в соответствии со спецификацией OpenAPI (OAS), что делает процесс интеграции простым и легким. Мы предоставляем обширную документацию на основе пользовательского интерфейса Swagger, в которой подробно описаны возможные ответы, а также возможные коды состояния и ошибок.

Ваша безопасность – наш приоритет

Все запросы API аутентифицируются с использованием заголовков JWT для максимальной безопасности. Это гарантирует, что ваши конфиденциальные данные документа всегда будут защищены.

Давайте начнем

Мы очень рады приветствовать вас и с нетерпением ждем возможности увидеть, как вы интегрируете и максимизируете преимущества Parse Documents в своих операциях по управлению документами!

Обязательно замените «YourAuthTokenHere» фактическим токеном носителя.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Преобразуйте процесс обработки документов с помощью усовершенствованной системы извлечения данных на базе искусственного интеллекта, которая поможет вам принимать более разумные решения.