Meshbeyn / Web Tools

Как работать с SilverUnicode

SilverUnicode - это вебприложение для работы с символами Юникода. В настоящий момент Вы можете делать с его помощью следующее:

Внешний вид SilverUnicode

Блок выбранного символа

Центральная область серого цвета отображает информацию о выбранном символе: отображение символа, коды символа и информация из базы данных Юникода.

  1. Первым идет отображение символа в рамке. Рамка показывает занимаемое символом место при выводе его на экран. Некоторые символы вылазят за пределы рамки или даже располагаются рядом с ней. Это не ошибка. Есть символы, которые действительно должны отображаться поверх других.
  2. Второй столбец показывает коды символа в различных системах:

    • Порядковый номер символа (кодовая точка) в десятичном и шестнадцатеричном отображении
    • Байты при кодировании Unicode16 Little Endian (используется как стандартное представление символов в Windows) и Big Endian (используется на некоторых RISC-платформах). При такой кодировке символ может занимать 2 или 4 байта. Четырехбайтные символы не поддерживаются некоторыми устаревшими системами.
    • Байты при кодировании в UTF8 (используется как стандартное представление в Linux). Текст в файлах также обычно сохраняется в этой кодировке. При такой кодировке символ может занимать 1-6 байт. Для английского текста (символы с кодами 0-127) такая кодировка позволяет тратить 1 байт на символ. Для большинства других языков 2 байта.
    • Служебная последовательность для указания такого символа в строках C#/Java или в тексте HTML/XML. Если исходный текст может сохраняться не в Юникоде или желательно видеть код символа, его можно записывать в таком виде.
    • Сам символ. Если текст будет сохранен в Юникоде, можно просто вставить туда сам символ. Для некоторых шрифтов (например Webdings) символ будет отличаться от выбранного. Эти шрифты разрабатывались, когда Юникод еще не использовался и просто заменяют буквы другими символами.

    Чтобы скопировать код или символ в буфер обмена, просто щелкните по нему мышкой. (Может выскочить запрос на разрешение приложению доступа к буферу обмена. Вебприложения сами не имеют права пользоваться буфером обмена, так как это может использоваться для кражи важной информации.)

  3. Третий столбец содержит информацию о символе из базы данных Юникода и регион Юникода, к которому принадлежит символ. База данных содержит информацию далеко не о каждом символе (чуть больше 20000 из более чем миллиона кодовых точек), поэтому для большинства символов никакой информации нет.

Список символов

Левая область отображает список символов юникода. Если навести указатель мышки на символ, он будет отображен в увеличенном виде. При нажатии на символ он выбирается и отображается в блоке выбранного символа

Выпадающий список сверху содержит регионы Юникода. Два первых псевдорегиона содержат Базовую Плоскость (первые 65536 кодовых точек) и весь диапазон кодовых точек. Остальные регионы не перекрываются и служат для классификации символов. Если регион отметить галочкой, его символы будут отображаться в списке символов. Если на регион нажать, список символов прокрутится к началу этого региона (если он отображается). При запуске отмечен регион BMP. Чтобы отобразить все символы, просто отметьте регион All Regions. Регион BMP содержит первые 65536 символов Юникода. Эти символы можно хранить в двух байтах Unicode16. Изначально весь Юникод только из них и состоял. Поэтому многие устаревшие программы не понимают остальные символы и считают их "пользовательскими".

Блок настроек

В блоке настроек Вы можете указать шрифт для отображения символов и язык интерфейса.

Для отображения символов используется шрифт, указанный в поле "Выбранный шрифт". При запуске там стоит "Portable User Interface". Это стандартный меташрифт для программ Silverlight. Он состоит из нескольких шрифтов, покрывающих довольно большую часть используемых символов. Не забывайте, что на разных системах эти шрифты могут все-таки различаться в количестве поддерживаемых символов. Например, пользователи Windows XP могут увидеть гораздо меньшее количество символов, чем пользователи Windows 8. Текстовый стек Silverlight автоматически будет показывать символы из "Portable User Interface", если указанный шрифт не существует или не содержит нужный символ. Поэтому учитывайте, что если Вы видите символ при выборе другого шрифта, он может на самом деле там не существовать. Список найденных шрифтов содержит стандартные для Windows 8 шрифты, которые найдены и в Вашей системе. К сожалению, Silverlight-приложение не имеет доступа к названиям шрифтов и не может самостоятельно составить этот список. Если требуемый шрифт установлен, но не отображается в списке, просто введите его название в поле "Выбранный шрифт".

Приложение может работать с английским, немецким и русским интерфейсом. Язык браузера автоматически определяется при запуске. Вы можете его изменить, нажав на кнопку нужного языка (при этом приложение перезапустится!)

Модуль работы со строками

Модуль работы со строками позволяет работать с каждым символом строки по-отдельности. Вы можете вставить в текстовое поле строку и каждый ее символ будет отображен в списке. Если Вы выделите символ, он будет отображен в Блоке выбранного символа. Также кнопкой "вставить символ" можно вставить символ в строку. К сожалению, Silverlight не всегда корректно отображает комбинированные символы, поэтому строка дублируется под приложением на самой странице. В таком виде она будет отображаться в браузере и текстовых редакторах.

Модуль поиска символа

Модуль поиска символа по тексту позволяет искать символы, которые содержат искомый текст в названии, описании или синонимах. Название, описание и синонимы берутся из базы данных Юникода, которая описывает лишь небольшую часть символов (чуть больше 20000). Например, если мы хотим найти символ громкости (громкоговоритель), набираем в поле поиска "speaker" и среди найденных символов получаем следующие: 🔊, 🔉, 🔇, 🔈 и 📢. Выбрав строчку с символом, мы можем рассмотреть его в Блоке выбранного символа.