Найти и удалить невидимые символы из текста
Найденные символы
Анализ текста
0 найдено- 0типов
- 0символов
- 0длина
Вставьте текст слева, и анализ появится автоматически.
Вставьте фрагмент, чтобы проверить текст на скрытые Unicode-символы, которые не видны при обычном чтении: пробелы нулевой ширины, неразрывные пробелы, BOM, табуляции и управляющие знаки. Анализ начинается сразу после ввода. Инструмент подсвечивает найденные символы, показывает их Unicode-коды, количество и позицию, а затем помогает получить исправленный текст.
Какие скрытые и невидимые символы можно обнаружить
Невидимые символы могут выглядеть как обычные пробелы или не занимать места на экране, но при этом влиять на поиск, сравнение строк, URL, импорт данных и отображение текста.
- Zero-width, soft hyphen и BOM
- Показываются ZWSP, ZWNJ, ZWJ, WORD JOINER, BOM, soft hyphen и combining grapheme joiner. Они могут ломать поиск, сравнение строк, URL и значения в формах.
- Пробельные символы Unicode
- Инструмент отличает обычный пробел от NBSP, narrow NBSP, figure space, ideographic space, Ogham space mark, пробелов U+2000..U+200A, пустого символа Брайля и Hangul-филлеров.
- Метки направления и variation selectors
- LRM, RLM, overrides, isolates и variation selectors обычно не видны, но могут менять порядок отображения текста или вариант вывода соседнего символа.
- Табуляции и control-символы
- Табы и нестандартные управляющие символы выводятся в анализе. Обычные переносы строк сохраняются как структура текста и не считаются невидимыми символами.
Как понять, что найдено в тексте
Один и тот же фрагмент может выглядеть правильным, но содержать разные Unicode-коды. Поэтому инструмент показывает не только подсветку, но и технические детали: тип символа, кодовую точку, количество и первую позицию.
- 1
Вставьте текст
Подойдет фрагмент из сайта, PDF, документа, таблицы, CMS, кода, формы или файла данных. Анализ появится без отдельной кнопки.
- 2
Посмотрите подсветку
В предпросмотре невидимые символы заменяются маркерами. При необходимости включите показ обычных пробелов, чтобы отличить их от скрытых Unicode-пробелов.
- 3
Откройте детали находки
В списке типов отображаются Unicode-код, группа, количество и первая позиция по строке и колонке. Это помогает понять, какой символ спрятан в тексте.
- 4
Исправьте и проверьте снова
Можно исправить один тип, только невидимые символы или все найденные типы. После этого скопируйте исправленный текст или отправьте его на повторную проверку.
Как работает исправление
Найденные символы не всегда одинаково опасны: часть лучше удалить, часть заменить обычным пробелом, а табы и переносы часто являются нормальной структурой текста.
Исправить только невидимые
Кнопка выбирает проблемные zero-width символы, BOM, метки направления, variation selectors и нестандартные Unicode-пробелы.
Исправить все найденное
Этот режим дополнительно затрагивает обычные служебные символы, включая табуляции. Его стоит использовать, когда нужно убрать все найденные технические символы за один шаг.
Исправить один тип
Если нужно убрать только конкретный символ, откройте его карточку и примените исправление для этого Unicode-кода.
Проверить исправленный текст
После очистки результат можно скопировать или сразу перенести обратно в поле проверки, чтобы убедиться, что нужные символы исчезли.
Частые невидимые символы Unicode
В таблице перечислены символы, которые часто появляются после копирования из сайтов, документов, PDF, таблиц и редакторов.
| Код | Что это | Чем мешает | Исправление |
|---|---|---|---|
U+200B | Zero width space | Выглядит как отсутствие символа, но мешает поиску, URL и сравнению строк. | Удаляется |
U+00A0 | No-break space | Похож на обычный пробел, но не дает строке переноситься и влияет на точное совпадение. | Заменяется пробелом |
U+FEFF | BOM | Может остаться в начале или середине текста после импорта и мешать обработке данных. | Удаляется |
U+00AD | Soft hyphen | Обычно скрыт, но влияет на перенос слова и может попадать в скопированный текст. | Удаляется |
U+200E | Left-to-right mark | Управляет направлением текста и может неожиданно менять отображение смешанных фрагментов. | Удаляется |
U+0009 | Character tabulation | Табуляция может быть нормальным отступом или лишним символом внутри значения формы. | Заменяется пробелом |
U+3164 | Hangul filler | Выглядит как пустое место и часто используется как скрытый символ в никнеймах, полях и коротких строках. | Удаляется |
U+2800 | Braille pattern blank | Занимает место как пробел, но не является обычным пробелом и может ломать точные сравнения. | Удаляется |
Когда стоит проверить текст
Проверка нужна, когда текст визуально выглядит правильно, но программа, сайт или документ ведут себя так, будто внутри есть лишние символы.
Одинаковые строки не совпадают
Фильтр, поиск, валидация или база данных могут считать две похожие строки разными из-за ZWSP, NBSP, BOM или управляющего символа.
URL, slug или промокод не работает
Скрытый символ внутри адреса, кода или короткого значения трудно заметить глазами, но он меняет фактическую строку.
Текст скопирован из сайта или PDF
При копировании могут добавляться неразрывные пробелы, мягкие переносы, метки направления и другие служебные символы.
Данные готовятся к импорту
Перед загрузкой в CMS, таблицу, CSV, базу данных или форму полезно увидеть скрытые пробелы, табы и управляющие символы.
Нужно отладить код или разметку
Непечатаемые символы могут мешать строковым литералам, конфигурации, JSON, HTML-тексту и другим фрагментам, где важен каждый символ.
Текст странно переносится
Неразрывные пробелы, soft hyphen и управляющие символы могут влиять на переносы, интервалы и визуальное форматирование.
Частые вопросы о невидимых символах
Короткие ответы о поиске, подсветке, Unicode-кодах и очистке скрытых символов в тексте.
Что такое невидимые символы в тексте?
Невидимые символы — это Unicode-символы без обычного видимого начертания или символы, которые выглядят как пробел. Они могут управлять переносами, направлением текста, emoji-вариантами или служебной структурой строки.
Как найти скрытые символы в тексте онлайн?
Вставьте текст в поле проверки. Инструмент автоматически подсветит найденные невидимые и скрытые символы, покажет их Unicode-коды, количество и первую позицию по строке и колонке.
Какие символы находит инструмент?
Инструмент ищет zero-width символы, BOM, soft hyphen, directional marks, overrides, variation selectors, нестандартные Unicode-пробелы, табы и другие control-символы, кроме обычных переносов строк.
Почему появляются zero-width, NBSP и BOM?
Они часто появляются после копирования из PDF, сайтов, офисных документов, таблиц, мессенджеров, CMS и автогенерированных текстов. Иногда такие символы добавляются форматированием или кодировкой файла.
Что значит код U+200B, U+00A0 или U+FEFF?
Это Unicode-кодовая точка найденного символа. Например, U+200B — zero width space, U+00A0 — no-break space, а U+FEFF — byte order mark.
Можно ли удалить все найденные символы сразу?
Можно нажать «Исправить все найденные символы», но табы и другие найденные служебные символы тоже будут обработаны. Если нужно сохранить структуру текста, используйте «Исправить только невидимые символы» или исправляйте отдельные типы.
Почему обычные переносы строк не попадают в найденные символы?
Переносы строк обычно являются нормальной структурой текста: абзацами, списками, адресами или строками CSV. Инструмент сохраняет их в предпросмотре как реальные переносы, а не как скрытые символы.
Текст отправляется на сервер?
Нет. Анализ, подсветка, исправление и копирование выполняются в браузере. Вставленный текст не отправляется на сервер Wertigo и не передается во внешние API.