Добрый день. Я хочу использовать многопроходное распознавание, по такому алгоритму.

  1. Вначале отправляю картинку на с помощью метода processImage, все параметры по умолчанию, кроме: language=russian, profile=textExtraction, exportFormat=xml.
  2. Далее в цикле проверяю статус задачи с помощью метода getTaskStatus.
  3. После того как задача готова, скачиваю в результате xml.
  4. Далее парсю xml на предмет уверенно распознанных слов, и по координатам (которые в атрибутах l, b, t, r) этих слов высчитываются нужные координаты полей.
  5. Формируется XML Parameters of Field Recognition, точнее просто переписываются атрибуты: left, top, right, bottom.
  6. Далее сформированный xml передаётся на обработку методу processFields и ему в параметрах указывается taskId, который был получен от указанного выше метода processImage.

Но в ответе я получаю ошибку: Server Error, точнее ошибка в xml ответе приходит "Internal Server Error"

Что я делаю не так?

Возможно это из-за того, что я xml с параметрами для processFields посылаю чуть-чуть по другому?

curl_setopt(CURLOPT_POST, TRUE);
curl_setopt(CURLOPT_POSTFIELDS, array("xml" => $xmlText));

Пробовал и так

curl_setopt(CURLOPT_POST, TRUE);
curl_setopt(CURLOPT_POSTFIELDS, array("xml" => urlencode($xmlText)));

Тогда выходит ошибка: Data at the root level is invalid. Line 1, position 1. XML с параметрами у меня такой (только атрибуты меняю):

<?xml version="1.0" encoding="UTF-8"?>
<document xmlns="http://ocrsdk.com/schema/taskDescription-1.0.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://ocrsdk.com/schema/taskDescription-1.0.xsd http://ocrsdk.com/schema/taskDescription-1.0.xsd">
    <fieldTemplates/>
    <page applyTo="0">
        <text id="issueWho" left="0" top="0" right="0" bottom="0">
            <language>Russian</language>
            <regExp>([0-9а-яА-Я\.\s])</regExp>
            <textType>normal</textType>
            <oneTextLine>false</oneTextLine>
        </text>
        <text id="issueDate" left="0" top="0" right="0" bottom="0">
            <language>Russian</language>
            <regExp>(((|0)[1-9])|([1|2][0-9])|(30)|(31))\.(((|0)[1-9])|(10)|(11)|(12))\.(((19)|(20))[0-9][0-9])</regExp>
            <textType>normal</textType>
            <oneTextLine>true</oneTextLine>
        </text>
    </page>
</document>

asked 29 May '13, 12:49

rinaatt's gravatar image

rinaatt
136

edited 29 May '13, 16:51


Добрый день,

Судя по логам приложения, e-mail которого совпадает с вашим, заданий со статусом Internal Error не было.

Xml выглядит нормально. Вы можете прислать идентификатор задания, на котором была ошибка, а также картинку, которую хотите обработать? На e-mail, указанный в личном кабинете.

link

answered 30 May '13, 11:20

Vasily%20Panferov's gravatar image

Vasily Panferov ♦♦
5422516

отправил на CloudOcrSdk@abbyy.com

(30 May '13, 12:29) rinaatt

благодарю, починили, всё заработало

(01 Jun '13, 13:09) rinaatt

Спасибо за хорошие новости! Так как изображение, которое вы прислали - российский паспорт, то, возможно, вам будет полезен SDK-продукт, специально предназначенный для распознавания российских документов - ABBYY PassportReader SDK http://www.abbyy.ru/passportreader-sdk/

(03 Jun '13, 10:28) Anastasia Ga... ♦♦
Your answer
toggle preview

Follow this question

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

Answers

Answers and Comments

Markdown Basics

  • *italic* or _italic_
  • **bold** or __bold__
  • link:[text](http://url.com/ "title")
  • image?![alt text](/path/img.jpg "title")
  • numbered list: 1. Foo 2. Bar
  • to add a line break simply add two spaces to where you would like the new line to be.
  • basic HTML tags are also supported

Tags:

×37
×17

Asked: 29 May '13, 12:49

Seen: 1,544 times

Last updated: 03 Jun '13, 10:30

© 2016 ABBYY. All rights Reserved. www.ABBYY.com | Privacy Policy | Legal