parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Ответ

Misha v.3 13.06.2013 15:54 / 14.06.2013 01:27

а проблема-то в чем?

насколько я вижу, работать с данными как с xml у вас не выйдет (не валидный xml).
а вот regex оптимизировать -- запросто.
например:
<(?:(?:tr|tr class='.+?'))> => <tr(?:\s+class='[^^']+')> или <tr[^^>]*>
<th>(\d+?)<th> => <th>(\d+)<th>
'.+?' => '[^^']+' (это самое важное изменение)
(\d+?)c => (\d+)c
<(?:(?:td|td style=".+?"))> => <td(?:\s+style="[^^"]+")> или <td[^^>]*>