Как перекодировать текст из unicode в UTF-8

Привет, народ! Последние 4 года я не писал сюда, пора прервать молчание:)

У всех бывает ситуация, когда «shit happens». Вот и меня в далеком 2017 она настигла. Я тогда перенес с выделенного сервера все свои сайты на хостинг Бегет (кстати, рекомендую), чтобы их вылечить и изолировать друг от друга.
Переносил, потому что на выделенке сайты как правило не изолированы друг от друга и безопасность системы = безопасности самого слабого сайта. В итоге все проекты заразились вирусами от одного сайта, который работал на старой версии Joomla. Когда переносил, забыл проверить, есть ли файлы с кириллическими названиями. Об этом и будет наш сегодняшний рассказ:)

При переезде с сервера на сервер у вас могут «поломаться» кириллические имена файлов и из за этого, например, на сайте перестанут отображаться картинки. В общем, перестанут работать все файлы, которые были названы кириллицей.

Было название «Острый-и-Плоский-Толбачики.jpg», а стало «#U041e#U0441#U0442#U0440#U044b#U0439-#U0438-#U041f#U043b#U043e#U0441#U043a#U0438#U0439-#U0422#U043e#U043b#U0431#U0430#U0447#U0438#U043a#U0438.jpg»

И из за этого у меня в двух статьях Путешествие по Камчатке. Часть 1 и Путешествие по Камчатке. Часть 2 слетели все картинки. Вот пример, как это выглядело (две картинки уже переименовал):

Что же делать?!

Открываем хостинг, скачиваем файлы, которые когда-то были названы кириллицей:

Получаем кучу файлов с непонятными названиями. На самом деле это просто кодировка Unicode, которая чуть-чуть изменена. Нужно все символы # заменить на %, для этого я использовал программу Sublime Text. Вы можете использовать любой редактор, который умеет массово заменять символы, тот же Notepad++ прекрасно с этим справится.

Далее текст вида

%U041e%U0441%U0442%U0440%U044b%U0439-%U0438-%U041f%U043b%U043e%U0441%U043a%U0438%U0439-%U0422%U043e%U043b%U0431%U0430%U0447%U0438%U043a%U0438

вставляем в сервис http://www.online-decoder.com/ru или https://www.abakbot.ru/online-5/225-dekodirovat-tekst-u0xxx-onlajn

и с помощью нехитрых манипуляций с кнопками:

или

получаем текст

Острый-и-Плоский-Толбачики

Так пробегаемся по каждому файлу. Переименовываем. Получаем примерно такое:

И казалось бы — готово! Но нет:)

Открываем страницы, где располагались наши картинки и проверяем, все ли хорошо отображается.

Там, где отображается до сих пор плохо (картинки по прежнему не грузятся) — копируем url картинки и берем название из него и вставляем в нужный файл. Благо, теперь все файлы читаемы и мы знаем какую картинку нужно переименовать.

На этом все. И помните: НЕ ИПОЛЬЗУЙТЕ кириллические названия для любых файлов в интернете — будет меньше проблем:)

© 2019 Atamovich.ru