Dokumendiväljade automaatne tuvastamine

Meie analüsaatorid tunnevad arukalt ära ja tuvastavad automaatselt üleslaaditud dokumentide ainulaadsed väljaväärtused.

Dokumendi keeletuvastus

Tuvastage skannitud või prinditud dokumentide, piltide ja PDF-failide keel.

Optiline märgituvastus (OCR)

Teisendage skannitud või prinditud dokumendid, sealhulgas pildid ja PDF-failid, masinloetavaks tekstiks.

Integratsioon ja automatiseerimine

Meie dokumendianalüsaatoreid saab integreerida olemasolevatesse tarkvarasüsteemidesse või tööprotsessidesse.

Dokumendi keeletuvastuse API

Parse Documents on tugev API-de komplekt, mis on loodud vastama kõigile dokumendianalüüsi nõuetele. Meie eesmärk on lihtsustada keerukat dokumentide haldamise protsessi, olgu selleks siis vigade otsimine, analüüsimine või käsitlemine. Nende hulka kuuluvad lihtne lehtede sorteerimine, lai valik toetatud dokumenditüüpe ja põhjalik veateade.

Mitmekülgsus ja paindlikkus

Meie erinevate API-de abil saate lisaks üleslaaditud dokumentidele lugeda ka dokumente analüüsimiseks järjekorda otse üleslaadimise või välislingi kaudu. Meie API-d on loodud äritegevuse dünaamilist olemust silmas pidades, võimaldades neil sujuvalt kohaneda mitmesuguste ärivajaduste ja konfiguratsioonidega.

Swaggeri konfiguratsioon

API-d on kodeeritud vastavalt OpenAPI spetsifikatsioonile (OAS), mis muudab integreerimisprotsessi probleemivabaks ja lihtsaks. Pakume Swaggeri kasutajaliidesel põhinevat ulatuslikku dokumentatsiooni, mis kirjeldab võimalikke vastuseid ning võimalikke oleku- ja veakoode.

Teie turvalisus on meie prioriteet

Kõik API päringud autentitakse maksimaalse turvalisuse tagamiseks JWT päiste abil. See tagab, et teie dokumendi tundlikud andmed on alati kaitstud.

Alustame

Meil on hea meel, et olete kaasas ja ei jõua ära oodata, et näha, kuidas integreerite ja maksimeerite rakenduse Parse Documents eeliseid oma dokumendihaldustoimingutes!

Kindlasti asendage "YourAuthTokenHere" tegeliku kandja märgiga.
Identify Document Languages
POST /v1/documents/languages

A POST method that identifies the languages of the provided document text. This method takes the document text as input and returns the identified languages along with their probabilities.

Example Request
POST /v1/documents/languages
Request Body
{
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}
Responses
  • 200 Success: Returns the identified languages along with their probabilities.
  • 404 Not Found: The requested document is not found.
  • 400 Bad Request: The request was made incorrectly.
Here is the modified HTML template with the .NET example filled and rewritten for other programming languages:
import requests

url = "https://%(baseUrl)s/v1/documents/languages"
headers = {
    "Authorization": "Bearer {YOUR_API_KEY}"
}

payload = {
    "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
}

response = requests.post(url, headers=headers, json=payload)
response.raise_for_status()

identified_languages = response.json()

for lang in identified_languages:
    print(f"Language: {lang['code']} - Probability: {lang['probability']}")
        
package main

import (
    "fmt"
    "net/http"
    "bytes"
    "encoding/json"
)

func main() {
    identifyDocumentLanguages()
}

func identifyDocumentLanguages() {
    url := "https://%(baseUrl)s/v1/documents/languages"
    apiKey := "{YOUR_API_KEY}"

    payload := map[string]interface{}{
        "text": "Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
    }

    requestBody, _ := json.Marshal(payload)
    req, _ := http.NewRequest("POST", url, bytes.NewBuffer(requestBody))
    req.Header.Set("Authorization", "Bearer "+apiKey)
    req.Header.Set("Content-Type", "application/json")

    client := &http.Client{}
    response, _ := client.Do(req)

    identifiedLanguages := []map[string]interface{}{}

    json.NewDecoder(response.Body).Decode(&identifiedLanguages)

    for _, lang := range identifiedLanguages {
        fmt.Printf("Language: %v - Probability: %v\n", lang["code"], lang["probability"])
    }
}
        
<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://%(baseUrl)s/v1/documents/languages",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_POST => true,
  CURLOPT_POSTFIELDS => json_encode([
    "text" => "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer {YOUR_API_KEY}",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$error = curl_error($curl);

curl_close($curl);

if ($error) {
  echo "Error: " . $error;
} else {
  $identifiedLanguages = json_decode($response, true);

  foreach ($identifiedLanguages as $lang) {
    echo "Language: " . $lang['code'] . " - Probability: " . $lang['probability'] . "\n";
  }
}
using System;
using System.Net.Http;
using System.Text;
using System.Text.Json;
using System.Threading.Tasks;

class Program
{
    private static readonly HttpClient client = new HttpClient();
    private static readonly string BASE_URL = "{YOUR_API_BASE_URL}";
    private static readonly string API_KEY = "{YOUR_API_KEY}";

    static void Main(string[] args)
    {
        IdentifyDocumentLanguages().Wait();
    }

    private static async Task IdentifyDocumentLanguages()
    {
        try
        {
            client.DefaultRequestHeaders.Authorization = new System.Net.Http.Headers.AuthenticationHeaderValue("Bearer", API_KEY);

            var requestBody = new
            {
                text = "Lorem ipsum dolor sit amet, consectetur adipiscing elit."
            };

            var requestContent = new StringContent(JsonSerializer.Serialize(requestBody), Encoding.UTF8, "application/json");

            var response = await client.PostAsync(BASE_URL + "/v1/documents/languages", requestContent);
            response.EnsureSuccessStatusCode();

            var responseBody = await response.Content.ReadAsStringAsync();
            var identifiedLanguages = JsonSerializer.Deserialize<IdentifyLanguage[]>(responseBody);

            foreach (var lang in identifiedLanguages)
            {
                Console.WriteLine($"Language: {lang.code} - Probability: {lang.probability}");
            }
        }
        catch (HttpRequestException e)
        {
            Console.WriteLine($"Error: {e.Message}");
        }
    }
}

In this code, we define a simple program with a single method `IdentifyDocumentLanguages`.

This method first sets up the authentication header by adding the bearer token to the HttpClient's default headers.

Then, it creates the request body containing the document text.

It sends a POST request to the specified endpoint with the request body as JSON.

If the request fails for any reason, an HttpRequestException will be thrown and the method will catch it and print the error message to the console.

If the request is successful, the method will read the response body as an array of `IdentifyLanguage` objects and print the language code and probability for each identified language.

Request Body:

  • text: The document text to identify the languages.

Parse Documents

Muutke oma dokumenditöötlusprotsessi täiustatud tehisintellektil töötava andmevõtusüsteemiga, mis aitab teil teha nutikamaid otsuseid.