parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

разная таблица для каждой кодировки -- это нормально

Misha v.3 15.07.2008 17:21

ибо одна буква может быть представлена несколькими последосвательностями.

в случае декодирования из 1251 и utf это будет одна table (соотв. один replace).
в случае например koi8 вы должны будете сами как-то анализировать раскодированное содержимое и пытаться понять что за кодировка.

process для этих целей я не рекомендовал-бы (попробуйте с таблицей перекодирования и с process, мне кажется что время/память будут сильно не в пользу последней, кроме того она не разберёт нормально utf-8, где одна русская буква кодируется двумя %XX)

P.S. по моему изначально поставлена неправильная задача. есть кучка log analyzer-ов, в том числе бесплатных, которые по моему стоит использовать.