Замечание по поводу необходимости prematch, match, postmatch совершенно справедливо... они правда ненужны :)))
Проблема оказалась вот в чем:
Если анализируемый НТМЛ файл локальный, то все хорошо.. Если грузится как http://..., то почему-то теряется закрывающий тег </p>??? Я понимаю, что для не классического НТМЛ он необязателен... но почему он теряется???