parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Результат сильно зависит от того, что внутри PDF'а...

Sumo 14.05.2018 08:52

Общая схема: выкусываем весь текст из PDF'а и пробуем разобрать его регулрными выражениями или пишем полноценный парсер текста.

У меня была относительно несложная задачи и получилось написать на Питоне через https://github.com/jalan/pdftotext и набор регулярок. Для сложных pdf'ок возни будет очень много. :)