![Понимание Юникода и UTF-8](https://i.ytimg.com/vi/7v5ziFDlZ00/hqdefault.jpg)
Содержание
- Определение - Что означает формат преобразования Unicode (UTF)?
- Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.
- Техопедия объясняет формат преобразования Unicode (UTF)
Определение - Что означает формат преобразования Unicode (UTF)?
Формат преобразования Unicode (UTF) - это формат кодирования символов, который способен кодировать все возможные кодовые точки символов в Unicode. Наиболее продуктивным является UTF-8, который представляет собой кодирование переменной длины и использует 8-битные кодовые единицы, разработанные для обратной совместимости с кодированием ASCII.
Формат преобразования Unicode также известен как универсальный формат преобразования.
Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.
Техопедия объясняет формат преобразования Unicode (UTF)
Формат преобразования Unicode - это один из двух кодировок, используемых в Unicode, другой является Универсальный набор символов (UCS). Они оба используются для отображения диапазона кодовых точек Unicode в последовательности названных значений кода. Числа в названиях кодирования указывают, сколько битов используется в одном кодовом значении кодирования. Это просто означает, что каждому уникальному символу присваивается идентификатор кода, называемый кодовыми точками.
Различные виды кодировок UTF включают в себя:
- UTF-1 - бывший предшественник UTF-8, более не являющийся частью стандарта Unicode
- UTF-7 - использует 7 битов для кодирования и в основном использовался, но теперь считается устаревшим
- UTF-8 - использует 8-битное кодирование переменной ширины для максимальной совместимости с ASCII
- UTF-16 - 16-битное кодирование переменной ширины
- UTF-32 - 32-битное кодирование с фиксированной шириной
- UTF-EBCIDC - использует 8 битов и разработан для совместимости с расширенным двоичным кодированным десятичным кодом обмена (EBCDIC)