parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Вопрос по экспорту данных в Unicode (UCS-2 LE) с BOM

Глеб 15.10.2013 01:59

Была задача из кода в кодировке 1251 сохранить сгенеренный парсером xml-файл в unicode с BOM.

Наколбасил всякого... на 100% есть более простой способ - о чем и спрашиваю - как сделать это по-человечески?


Мое "творение" таково:

по документации сохраняю строку (с xml-содержимым) в файл в кодировке utf-8

далее натравляю на файл (через exec с запуск bash-скрипта) iconv и перегоняю UTF-8 в UCS-2LE, но до этого делаю так:

cp BOM.bin tmp.xml
iconv -f UTF-8 -t UCS-2LE my.xml >>tmp.xml
mv tmp.xml "my.xml"

где файл BOM.bin - файл из 2 байт - FE FF


как сделать логичнее и проще? ну огород же вышел..
может быть как-то можно пихнуть эти BOM-байты с помощью парсера в начало файла? у меня не вышло


попутно предложение: при file::create кроме чарсета указывать "нужно или нет размещать BOM-блок в начале файла"