Мне небходимо распознавать данные структурированные в изображении в виде таблицы. При этом форматирование(шрифт, размер текста, цевет и пр) не важны. Но важно сохранение табличной структуры, т.е. важно знать раположение данных по ячейкам. Подскажите пожалуйста какие настройки будет правильно указать для решения этой задачи? Пробовал ставить выходной формат xlsx, но к сожалению правильная таблица получается далеко не всегда.

asked 05 Jul '13, 00:48

AlexVN's gravatar image

AlexVN
111

edited 29 Jul '13, 12:02

Katia%20Sirotina's gravatar image

Katia Sirotina ♦♦
264


Все зависит от самих таблиц и исходных документов. Например, если таблица присутствует на всей странице документа, то можно наложить табличный блок на всю страницу. Пример кода (на С#) может быть следующим:

      document.AddImageFile(imagePath, null, null);
      FREngine.PageProcessingParams pageProcessingParams = Engine.CreatePageProcessingParams();
      pageProcessingParams.PageAnalysisParams.TableAnalysisParams.SingleLinePerCell = true;
            for (int i = 0; i < document.Pages.Count; i++)
            {
                FREngine.Region region = Engine.CreateRegion();
                region.AddRect(0, 0, pageWidth, pageHeight);
                FREngine.IBlock block = null;
                block = Engine.CreateLayout().AddBlock(FREngine.BlockTypeEnum.BT_Table, region);
                document.Pages.Item(i).Layout.Blocks.RemoveAll();
                document.Pages.Item(i).Layout.AddBlock(FREngine.BlockTypeEnum.BT_Table, region);
                document.Pages.Item(i).AnalyzeTable(0, pageProcessingParams);
            }
            string exportName = "D:\\Samples\\Results";
            document.Recognize(null, null);
            document.Synthesize(null);
            document.Export(exportName, FREngine.FileExportFormatEnum.FEF_XLS, null);

Если таблица присутствует не на всей странице, пришлите нам пожалуйста, примеры обрабатываемых документов на cloudocrsdk@abbyy.com.

С уважением, Анастасия

link

answered 17 Jul '13, 17:35

SDK_support's gravatar image

SDK_support ♦♦
2763

edited 29 Jul '13, 12:11

Katia%20Sirotina's gravatar image

Katia Sirotina ♦♦
264

Спасибо за ответ. В своем вопросе я забыл указать что для распознавания использую Cloud OCR SDK. http://ocrsdk.com/documentation/apireference/ Соответственно вопрос как с помощью вышеуказанного АПИ решить описанную задачу.

(21 Jul '13, 12:30) AlexVN

Мы были бы Вам очень признательны, если бы Вы смогли прислать примеры обрабатываемых Вами документов на cloudocrsdk@abbyy.com. Мы попробуем изучить данный случай и по возможности дать Вам рекомендации.

(21 Jul '13, 18:41) SDK_support ♦♦

Спасибо за оперативный ответ. Примеры документов отправил.

(21 Jul '13, 20:34) AlexVN

В следующей версии технологий во всех присланных Вами документах таблицы полностью находятся. Переход на новые технологии пока запланирован на осень этого года.

Единственное, в документе "gp1.pdf" очень мешают поля по краям, поэтому, если есть такая возможность, попробуйте, немного модифицировать подобные картинки.

С уважением, Анастасия.

(25 Jul '13, 16:31) SDK_support ♦♦

Анастасия, спасибо за ответ. Правильно ли я понимаю что на текущий момент лучшим вариантом будет экспорт в формат Excel? так же интересует можно ли принять участие в тестировании новой версии? Что нужно для этого сделать?

(26 Jul '13, 17:06) AlexVN

Для получения полноценной таблицы в случае экспорта в Excel важно, чтобы таблица была успешно найдена. Однако, если в Вашем сценарии Вам важно сохранить разбиение по ячейкам, то да, лучшим вариантом будет экспорт в Excel для упрошения дальнейшего разбора распознанных данных.

К сожалению, открытое тестирование новых версий у нас не предусмотрено.

(26 Jul '13, 19:06) SDK_support ♦♦

Жаль что нельзя принять участие в тестировании. Подскажите, насколько можно расчитывать что публичный запуск новой версии произойдет осенью, а не будет перенесен на существенно более позний срок? Если на Cloud OCR SDK расчитывать не стоит то получается что единственным вариантом остается установка локальной версии и взаимодецйствие с ней. Насколько я понимаю там там функционал распознавания значительно шире.

(26 Jul '13, 19:48) AlexVN

Аналитик сообщил, что точный срок перехода Cloud OCR SDK на новую версию технологий зависит от результатов тестирования на обратную совместимость, 100% гарантии обновления осенью, к сожалению, нет.

(30 Jul '13, 15:10) Anastasia Ga... ♦♦

Подскажите, появилась ли возможность проверить новую версию в которой улучшено рапознавание табличных данных?

(30 Dec '13, 02:58) AlexVN

Да, совершенно верно, в данном случае пока экспорт в Excel является лучшим вариантом. Касательно Вашего вопроса об участии в тестировании: публичного тестирования новой версии обычно не производится, поэтому возможности принять участие в нем, к сожалению, нет.

(13 Jan '14, 17:50) SDK_support ♦♦
showing 5 of 10 show 5 more comments
Your answer
toggle preview

Follow this question

By Email:

Once you sign in you will be able to subscribe for any updates here

By RSS:

Answers

Answers and Comments

Markdown Basics

  • *italic* or _italic_
  • **bold** or __bold__
  • link:[text](http://url.com/ "title")
  • image?![alt text](/path/img.jpg "title")
  • numbered list: 1. Foo 2. Bar
  • to add a line break simply add two spaces to where you would like the new line to be.
  • basic HTML tags are also supported

Tags:

×160
×11
×5

Asked: 05 Jul '13, 00:48

Seen: 1,806 times

Last updated: 13 Jan '14, 17:50

© 2016 ABBYY. All rights Reserved. www.ABBYY.com | Privacy Policy | Legal