Формат преобразования Unicode (UTF)

Автор: Monica Porter
Дата создания: 15 Март 2021
Дата обновления: 27 Июнь 2024
Anonim
Понимание Юникода и UTF-8
Видео: Понимание Юникода и UTF-8

Содержание

Определение - Что означает формат преобразования Unicode (UTF)?

Формат преобразования Unicode (UTF) - это формат кодирования символов, который способен кодировать все возможные кодовые точки символов в Unicode. Наиболее продуктивным является UTF-8, который представляет собой кодирование переменной длины и использует 8-битные кодовые единицы, разработанные для обратной совместимости с кодированием ASCII.


Формат преобразования Unicode также известен как универсальный формат преобразования.

Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.

Техопедия объясняет формат преобразования Unicode (UTF)

Формат преобразования Unicode - это один из двух кодировок, используемых в Unicode, другой является Универсальный набор символов (UCS). Они оба используются для отображения диапазона кодовых точек Unicode в последовательности названных значений кода. Числа в названиях кодирования указывают, сколько битов используется в одном кодовом значении кодирования. Это просто означает, что каждому уникальному символу присваивается идентификатор кода, называемый кодовыми точками.

Различные виды кодировок UTF включают в себя:

  • UTF-1 - бывший предшественник UTF-8, более не являющийся частью стандарта Unicode
  • UTF-7 - использует 7 битов для кодирования и в основном использовался, но теперь считается устаревшим
  • UTF-8 - использует 8-битное кодирование переменной ширины для максимальной совместимости с ASCII
  • UTF-16 - 16-битное кодирование переменной ширины
  • UTF-32 - 32-битное кодирование с фиксированной шириной
  • UTF-EBCIDC - использует 8 битов и разработан для совместимости с расширенным двоичным кодированным десятичным кодом обмена (EBCDIC)