Скрипт для превращения текста со всякими &xxx; и &#nnn; в нормальный utf8
#!/usr/bin/perl use HTML::Entities; binmode ("STDOUT", ":utf8"); print decode_entities(<>);
Для превращения текста со всякими &xxx; и &nnn; в обычный utf8.
Понадобилось из-за штуки, которая в виде таких numeric character references и character entity references сохраняет всё, что не основные символы (латиница, цифры и что-то ещё по минимуму). Кириллицу, например.
Читать дальше