Ответ

G_Z 21.12.2017 03:25 / 21.12.2017 05:31

Очень большой или сложный XML всё равно не получится разобрать и целиком построить DOM — легко упереться в лимиты ОС или фактический размер памяти и возможностей выделения памяти Парсером.
Для таких документов нужен парсер, работающий поблочно — читающий файл построчно, собирающий блок по известным открывающим и закрывающим тегам и дающий к его DOM'у интерфейс.

Если сложная работа (хождение по осям, хитрые критерии фильтрации узлов, работы с множествами — фактически XPath) с DOM не требуется, то можно организовать такой парсер самому, читая файл построчно и производя поиск и извлечение узлов и значений регулярными выражениями.
Но не в Парсере, сторонней утилитой, тем же grep'ом.

Либо привести XML к delemited-данным, положить в БД (LOAD DATA INFILE) и дальше комфортно работать с данными силами SQL.
Если совсем лень, есть неплохой инструмент от Microsoft — LogParser, который предоставляет SQL-интерфейс к логфайлам в разнообразных форматах, но только для Windows.

Крупные XML редко сложные, зачастую просто контейнер с большим числом однотипных элементов.

libxml проблема обработки больших xml, stur 20.12.2017 18:50 / 20.12.2017 18:51
- Ответ, G_Z [M] 21.12.2017 03:25 / 21.12.2017 05:31
  - так и есть, stur 21.12.2017 07:32
- Ответ, MoKo 21.12.2017 01:49
  - атрибуты на node, stur 21.12.2017 08:18
    - Там достаточно странно., MoKo 22.12.2017 05:05
      - отлично, спасибо! (-), stur 22.12.2017 09:07 / 22.12.2017 09:15
  - Ответ, stur 21.12.2017 07:28
    - Ответ, MoKo 22.12.2017 04:56
      - Ответ, stur 22.12.2017 09:14

Новости	FAQ	Авторы	Документация	В действии	Библиотека
Инструменты	Полезные ссылки	Хостинги	Скачать	Примеры	Форум