parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

разве   это самоцель?

Александр Петросян (PAF) 17.02.2003 09:48 / 17.02.2003 09:49

есть кодировка windows-1251, в ней есть определённые microsoft буквы:
http://www.microsoft.com/globaldev/reference/sbcs/1251.htm
среди прочих,
A0 = U+00A0 : NO-BREAK SPACE

загляните в настройки русских Windows в раздел региональных настроек в строку ввода «Разделитель тысяч», вы увидите там глазами пробел. на самом деле, это Alt+0160.

вопрос: откуда берётся эта буква в вашем output?
ответ: из файла windows-1251.cfg, определяющего кодировку.
в xml есть UNICODE буква (вы помните, что цифровые entity в xml — в UNICODE?) с кодом 160d, для которой подбирается соответствие в выходной кодировке (по-умолчанию, в windows-1251).

вариант1: можно удалить строку с этой буквой из windows-1251.cfg, тогда parser, за неимением буквы, выдаст цифровую entity:  

вариант2: если для вашего сердца близка именно такая запись неразрывного пробела [по необъяснимой тонкой душевной организации, поскольку видимых разумных причин тратить 6 байт вместо одного нет], то вы можете в @postprocess сделать ^body.replace этой буквы на близкую сердцу устаревшую конструкцию.