Automatinis dokumento laukų aptikimas

Mūsų analizatoriai protingai atpažįsta ir automatiškai aptinka unikalias lauko reikšmes iš įkeltų dokumentų.

Dokumento kalbos atpažinimas

Aptikti nuskaitytų arba spausdintų dokumentų, vaizdų ir PDF failų kalbą.

Optinio ženklų atpažinimas (OCR)

Konvertuokite nuskaitytus arba spausdintus dokumentus, įskaitant vaizdus ir PDF failus, į mašininio skaitymo tekstą.

Integravimas ir automatizavimas

Mūsų dokumentų analizatorius galima integruoti į esamas programinės įrangos sistemas ar darbo procesus.

Dokumento kalbos atpažinimo API

Parse Documents yra patikimas API rinkinys, sukurtas patenkinti visus dokumentų analizės reikalavimus. Mūsų tikslas – supaprastinti sudėtingą dokumentų valdymo procesą, nesvarbu, ar tai būtų paieška, analizavimas ar klaidų tvarkymas. Tai apima lengvą puslapių rūšiavimą, daugybę palaikomų dokumentų tipų ir kruopščią klaidų informaciją.

Universalumas ir lankstumas

Naudodami mūsų įvairias API, galite ne tik nuskaityti įkeltus dokumentus, bet ir sudėti dokumentus į eilę analizuoti tiesiogiai įkeliant arba naudojant išorinę nuorodą. Mūsų API sukurtos atsižvelgiant į dinamišką verslo pobūdį, todėl jos sklandžiai tenkina įvairius verslo poreikius ir konfigūracijas.

Swagger konfigūracija

API koduojamos pagal OpenAPI specifikaciją (OAS), todėl integravimo procesas yra be rūpesčių ir paprastas. Pateikiame išsamią „Swagger“ vartotojo sąsaja pagrįstą dokumentaciją, kurioje išsamiai aprašomi galimi atsakymai ir galimi būsenos bei klaidų kodai.

Jūsų saugumas, mūsų prioritetas

Visos API užklausos autentifikuojamos naudojant JWT antraštes, kad būtų užtikrintas maksimalus saugumas. Taip užtikrinama, kad jūsų neskelbtini dokumento duomenys visada bus apsaugoti.

Pradėkime

Džiaugiamės galėdami prisijungti prie jūsų ir nekantraujame pamatyti, kaip integruosite ir maksimaliai padidinsite Parse Documents naudą savo dokumentų valdymo operacijose!

Būtinai pakeiskite „YourAuthTokenHere“ tikruoju nešiklio prieigos raktu.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Transformuokite dokumentų apdorojimo procesą su pažangia, AI varomą duomenų ištraukimo sistema, padedančia priimti protingesnius sprendimus.