parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Импорт не однородных данных из файлов разных форматов.

AndreyD 14.05.2018 01:28

Приветствую всех гуру парсера! Появилась задача импортировать данные из файлов разных форматов. В частности это файлы брокерских отчетов присылаемых брокером (сбербанк) на почту. Файлы приходят двух форматов txt и pdf. Файлы не имеют какой-то жесткой структуры, количество разных таблиц в отчете может отличаться. Кроме того есть возможность сформировать табличный отчет в программе, этот отчет сохраняется в html-формате.
1. Решал кто-то подобную задачу?
2. Возможен ли импорт из pdf?
3. Как правильно разобрать текстовый файл где таблицы нарисованы символами |=+-* а все выравниванию сделаны пробелами?

К сожалению выложить сюда образец отчета не возможно. Буду крайне признателен за помощь.