Ошибка, если в PCRE приходит непонятная кодировка
Саян 29.12.2016 11:39
Привет, коллеги! Иногда клиент (скажем, странный встроенный броузер symbian) игнорирует требования кодировки и приходят вот такие запросы:
/autocomplete.htm?callback=jQuery1720487&term=�����%20��������,��
Когда я обрабатываю поле term регексом, например таким ^(.*?[аеиоуыэюя])(.*)$
выходит ошибка
UTF-8 validation failed during pcre_exec (-10).
Посоветуйте, как это можно красиво обойти?
- создать свой класс на основе regex, в котором игнорировать подобные ошибки? Выглядит пушкой по воробьям.
- делать автозамену до попадания строки в регекс? Я не знаю, что там за символы и сколько их. Таблица замены может получиться слишком большой и все равно неполной.
- Ошибка, если в PCRE приходит непонятная кодировка, Саян 29.12.2016 11:39