Hubungi Read API

Hubungi Read API

Dalam panduan ini, Anda akan mempelajari cara memanggil API Baca untuk mengekstrak teks dari gambar. Anda akan mempelajari berbagai cara untuk mengonfigurasi perilaku API ini untuk memenuhi kebutuhan Anda.

Panduan ini mengasumsikan Anda telah membuat sumber daya Visi Komputer dan memperoleh kunci langganan dan URL titik akhir. Jika belum, ikuti mulai cepat untuk memulai.

Menentukan cara memproses data (opsional)

Menentukan model OCR

Secara default, layanan ini akan menggunakan model GA terbaru untuk mengekstrak teks. Dimulai dengan Read 3.2, parameter model-version memungkinkan pemilihan antara GA dan model pratinjau untuk versi API tertentu. Model yang Anda tentukan akan digunakan untuk mengekstrak teks dengan operasi Baca.

Saat menggunakan operasi Baca, gunakan nilai berikut untuk parameter model-version opsional.

Nilai Model yang digunakan
Pratinjau 2022-01-30 Model pratinjau terbaru dengan bahasa Hindi additonal, Arab, dan bahasa skrip Devanagari dan Arab lainnya dan peningkatan pada pratinjau sebelumnya.
2021-09-30-pratinjau Model pratinjau sebelumnya dengan bahasa Rusia addiitonal dan Cyrillic dan peningkatan pada model GA sebelumnya.
2021-04-12 Model GA terbaru
Tidak disediakan Model GA terbaru
terbaru Model GA terbaru

Bahasa input

Secara default, layanan mengekstrak semua teks dari gambar atau dokumen Anda termasuk bahasa campuran. Operasi baca memiliki parameter permintaan opsional untuk bahasa. Hanya masukkan kode bahasa jika Anda ingin memaksa dokumen diproses sebagai bahasa khusus tersebut. Jika tidak, layanan dapat menampilkan teks yang tidak lengkap dan salah.

Output urutan baca alami (bahasa Latin saja)

Secara default, layanan menghasilkan baris teks dalam urutan kiri ke kanan. Secara opsional, dengan parameter permintaan readingOrder , gunakan natural untuk output urutan pembacaan yang lebih ramah manusia seperti yang ditampilkan dalam contoh berikut. Fitur ini hanya didukung untuk bahasa Latin.

OCR Reading order example

Pilih rentang halaman atau beberapa halaman untuk mengekstraksi teks

Secara default, layanan mengekstrak teks dari semua halaman dalam dokumen. Secara opsional, gunakan parameter permintaan pages untuk menentukan nomor halaman atau rentang halaman untuk mengekstrak teks hanya dari halaman tersebut. Contoh berikut memperlihatkan dokumen dengan 10 halaman, dengan teks yang diekstrak untuk kedua kasus - semua halaman (1-10) dan halaman yang dipilih (3-6).

Selected pages output

Kirimkan data ke layanan

Anda mengirimkan gambar lokal atau gambar jarak jauh ke Read API. Untuk lokal, Anda memasukkan data gambar biner ke dalam isi permintaan HTTP. Untuk jarak jauh, Anda menentukan URL gambar dengan memformat isi permintaan seperti berikut ini: .

Panggilan Baca API Baca mengambil gambar atau dokumen PDF sebagai input dan mengekstrak teks secara asinkron.

Panggilan kembali dengan bidang tajuk respons yang disebut Operation-Location . Nilai Operation-Location adalah URL yang berisi ID Operasi yang akan digunakan pada langkah berikutnya.

Header respons Contoh nilai
Lokasi-Operasi https://cognitiveservice/vision/v3.2/read/analyzeResults/49a36324-fc4b-4387-aa06-090cfbf0064f

Billing

Halaman harga Computer Vision menyertakan tingkat harga untuk Baca. Setiap gambar atau halaman yang dianalisis adalah satu transaksi. Jika Anda memanggil operasi dengan dokumen PDF atau TIFF yang berisi 100 halaman, operasi Baca akan menghitungnya sebagai 100 transaksi dan Anda akan ditagih untuk 100 transaksi. Jika Anda melakukan 50 panggilan ke operasi dan setiap panggilan mengirimkan dokumen dengan 100 halaman, Anda akan ditagih untuk 50 X 100 = 5000 transaksi.

Dapatkan hasil dari layanan

Langkah kedua adalah memanggil operasi Dapatkan Hasil Baca. Operasi ini mengambil sebagai input ID operasi yang dibuat oleh operasi Baca.

Ini mengembalikan respons JSON yang berisi bidang status dengan kemungkinan nilai berikut.

Nilai Makna
notStarted Operasi belum dimulai.
running Operasi sedang diproses.
failed Operasi gagal.
succeeded Operasi berhasil.

Anda memanggil operasi ini secara berulang hingga kembali dengan nilai berhasil. Gunakan interval 1 hingga 2 detik untuk menghindari melebihi tingkat permintaan per detik (RPS).

Tingkat gratis membatasi tarif permintaan hingga 20 panggilan per menit. Tingkat berbayar memungkinkan 10 permintaan per detik (RPS) yang dapat ditingkatkan berdasarkan permintaan. Perhatikan pengenal dan wilayah sumber daya Azure Anda, dan buka tiket dukungan Azure atau hubungi tim akun Anda untuk meminta tarif permintaan per detik (RPS) yang lebih tinggi.

Ketika bidang status memiliki nilai, respons JSON berisi konten teks yang diekstrak dari gambar atau dokumen Anda. Respons JSON mempertahankan pengelompokan baris asli dari kata-kata yang dikenali. Ini termasuk baris teks yang diekstraksi dan koordinat kotak batasnya. Setiap baris teks mencakup semua kata yang diekstrak dengan koordinat dan skor kepercayaan diri mereka.

Data yang dikirimkan ke Read operasi untuk sementara dienkripsi dan disimpan saat istirahat untuk waktu singkat, lalu dihapus. Ini memungkinkan aplikasi Anda mengambil teks yang diekstrak sebagai bagian dari respons layanan.

Sampel output JSON

Lihat contoh respons JSON yang berhasil berikut ini:

Klasifikasi tulisan tangan untuk baris teks (hanya bahasa Latin)

Respons termasuk mengklasifikasikan apakah setiap baris teks memiliki gaya tulisan tangan atau tidak, bersama dengan skor kepercayaan diri. Fitur ini hanya didukung untuk bahasa Latin. Contoh berikut menunjukkan klasifikasi tulisan tangan untuk teks dalam gambar.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *