Что такое текст ASCII и как он используется?

Что такое текст ASCII и как он используется?

ASCII - это аббревиатура, которую вы, возможно, слышали в отношении компьютерного текста, но это термин, который быстро выходит из употребления благодаря более мощному новичку. Но что такое ASCII и для чего он используется?





Что означает ASCII?

Возможно, проще всего начать с самого акронима, поэтому давайте расширим его:





К мериканец S стандартный C ода для я информация я обмен





Эта набитая фраза не дает полной картины, но некоторые части сразу предлагают некоторые подсказки, особенно первые два слова. ASCII - это американский стандарт, значение которого скоро станет очевидным.

Код для обмена информацией предполагает, что мы говорим о формате для передачи данных туда и обратно. В частности, ASCII имеет дело с текстовыми данными: символами, составляющими слова на обычно понятном человеку языке.



ASCII решает проблему присвоения значений буквам и другим символам, чтобы, когда они хранятся в файле как единицы и нули, их можно было преобразовать обратно в буквы при последующем чтении файла. Если разные компьютерные системы соглашаются использовать один и тот же код, такая информация может надежно обмениваться.

как редактировать фото в gIMP

Связанный: Как найти символы и узнать их значение





История ASCII

ASCII, который иногда называют US-ASCII, был американской инновацией, разработанной в 1960-х годах. Стандарт претерпел множество изменений с тех пор, в основном в 1977 и 1986 годах, когда ASCII последний раз обновлялся.

Расширения и вариации основывались на ASCII на протяжении многих лет, в основном для того, чтобы удовлетворить тот факт, что ASCII опускает многие символы, используемые или даже требуемые языками, отличными от английского языка (США). ASCII даже не обслуживает символ валюты Великобритании (£), хотя фунт присутствует в Latin-1, 8-битном расширении, разработанном в 1980-х годах, которое также кодирует несколько других валют.





ASCII был значительно расширен, и ему на смену пришел Unicode, гораздо более всеобъемлющий и амбициозный стандарт, который обсуждается ниже. В 2008 году Unicode обогнал ASCII по популярности для использования в Интернете.

Какие символы представляет ASCII?

Для компьютера буква А так же незнакома, как фиолетовый цвет или чувство ревности. Компьютеры имеют дело с единицами и нулями, и люди сами решают, как использовать эти единицы и нули для представления чисел, слов, изображений и всего остального.

Вы можете думать об ASCII как о коде Морзе в цифровом мире - во всяком случае, первая попытка. В то время как код Морзе используется для представления всего 36 различных символов (26 букв и 10 цифр), ASCII был разработан для представления до 128 различных символов в 7 битах данных.

ASCII чувствителен к регистру, то есть представляет 52 буквы верхнего и нижнего регистра английского алфавита. Наряду с теми же 10 цифрами это примерно половина используемого пространства.

Знаки пунктуации, математические и типографические символы занимают остаток, а также набор управляющих символов, которые представляют собой специальные непечатаемые коды с функциональными значениями - подробнее см. Ниже.

Вот некоторые типичные символы, которые кодирует ASCII:

ДвоичныйДесятичныйХарактер
010 000133!
011 0000480
011 100157 год9
011 101159;
100 000165К
100 001066B
101 101090С УЧАСТИЕМ
101 101191[
110 000197к
110 001098б
111 1101125}

Обратите внимание, что выбранные значения обладают некоторыми полезными свойствами, в частности:

  • Буквы одного и того же регистра всегда можно отсортировать численно, поскольку они в порядке. Например, A имеет более низкое значение, чем B, которое имеет меньшее значение, чем Z.
  • Буквы в разных регистрах смещены ровно на 32. Это позволяет очень легко переводить между нижним и верхним регистром, поскольку в любом случае для каждой буквы нужно переключать только один бит.

Управляющие персонажи

Помимо букв, знаков препинания и цифр, ASCII может представлять ряд управляющих символов, специальных кодовых точек, которые не производят односимвольный вывод, а вместо этого предоставляют альтернативные значения данных для того, что может их использовать.

хорошо, гугл, расскажи мне историю

Например, ASCII 000 1001 - это символ горизонтальной табуляции. Он представляет собой пространство, которое вы получите, когда нажмете клавишу TAB. Обычно вы не видите таких персонажей напрямую, но их эффект часто проявляется. Вот еще несколько примеров:

ДвоичныйДесятичныйХарактер
000 10019Горизонтальная вкладка
000 101010Перевод строки
001 01112. 3Конец блока передачи

А как насчет других персонажей?

ASCII пользовался огромным успехом на заре вычислений, поскольку был прост и широко распространен. Однако в мире с более интернациональным мировоззрением одна система письма просто не справится. Современное общение должно быть возможным на французском, японском - фактически, на любом языке, на котором мы можем хранить текст.

Набор символов Unicode может адресовать в общей сложности 1112 064 различных символа, хотя фактически в настоящее время определено только около одной десятой из них. Может показаться, что это много, но кодировка направлена ​​не только на обслуживание десятков тысяч китайских иероглифов, но и на эмодзи (почти полторы тысячи) и даже на вымершие системы письма, такие как чжурчжэнь.

Связанный: Объяснение 100 самых популярных эмодзи

Unicode признал доминирование ASCII в выборе первых 128 символов: они точно такие же, как ASCII. Это позволяет использовать файлы в кодировке ASCII в ситуациях, когда ожидается Unicode, обеспечивая обратную совместимость.

Резюме

Текст ASCII представляет собой 26 букв английского алфавита с добавленными цифрами, пунктуацией и несколькими другими символами. Он отлично служил своей цели на протяжении большей части полувека,

Теперь его заменил Unicode, который поддерживает огромное количество языков и других символов, включая эмодзи. UTF-8 - это для всех практических целей кодировка, которая должна использоваться для представления символов Юникода в Интернете.

Делиться Делиться Твитнуть Эл. адрес Стоит ли переходить на Windows 11?

Окна были переработаны. Но достаточно ли этого, чтобы убедить вас перейти с Windows 10 на Windows 11?

как отсортировать электронную почту в Gmail
Читать далее Похожие темы
  • Объяснение технологии
  • Жаргон
  • Веб-культура
  • Юникод
Об авторе Бобби Джек(Опубликовано 58 статей)

Бобби - энтузиаст технологий, проработавший разработчиком программного обеспечения большую часть двух десятилетий. Он увлечен играми, работает редактором обзоров в Switch Player Magazine и занимается всеми аспектами онлайн-публикации и веб-разработки.

Ещё от Bobby Jack

Подписывайтесь на нашу новостную рассылку

Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!

Нажмите здесь, чтобы подписаться