"Маловато
будет!" Александр Татарский
Выше мы выяснили,
что с помощью одного бита информации можно закодировать только два разных значения
(например, "да" или "нет").
Информацию об
этом смотрите в разд. "Понятие бита" данной главы.
Но всем совершенно
понятно, что для кодирования более разнообразных вариаций в какой-либо области
знаний (например, даже обычного текста, не говоря уже о звуковой или цветовой
информации) одного бита информации действительно "маловато будет".
Такая информация требует резервирования гораздо большего количества кодов.
А для получения
большего количества кодов, разумеется, единственный путь состоит в увеличении
разрядности двоичного числа (его удлинении). Это заставляет вспомнить и применить
позиционный метод записи чисел.
Например, для
записи десятичного числа 10 003 955 используются пять цифр и восемь разрядов.
Если
рассматривать самый общий случай, как это принято в математике, то можно утверждать,
что, используя небольшое конечное количество цифр (не менее двух) и позиционный
метод записи, можно получить бесконечное количество чисел.
Важная
мысль
С помощью конечного
количества цифр (не менее двух) и позиционного метода записи можно отображать
бесконечное количество чисел.
Но у двоичных
чисел, поскольку они применяются в компьютерных технологиях, есть одна особенность:
двоичные числа, как правило, формируются с фиксированной разрядностью. Такая
совокупность разрядов получила название "слов".
Определение
Двоичное слово— последовательность битов, рассматриваемых как единое целое, имеющая определенное смысловое значение (в соответствующем кодовом алфавите).
Пример
В слове, равном одному байту, — восемь двоичных разрядов, и десятичное число "2" записывается в двоичной системе счисления следующим образом: 00000010. Слово может быть равно двум и более байтам, поэтому то же число может получить и такой вид: 00000000 00000010. Это означает, что если число занимает меньше значимых разрядов, чем отведено для его записи, как в данном примере, то все предыдущие разряды заполняются нулями. И поскольку эти нули занимают старшие разряды, они действительно не имеют значения.
Замечание
Кстати, по этой причине хранение информации на диске не является оптимальным: информация хранится кластерами, даже если в ней записан один бит — все равно весь этот кластер заполняется. В самом деле, двоичные числа записываются также в кластерной форме: 00000001, 000001, 00001, 001, 01, 1 — это одно и то же число, записанное при помощи двоичных слов различной длины. Например, если используется запись информации байтами, то заполняется всегда восемь ячеек памяти, независимо от того, что необходимо сохранить всего один бит. В этом кроется причина нерационального расходования дискового пространства.
В обычной жизни
такой прием существует только в документах, которые требуют строгой документации,
например лотерейные билеты. В остальных случаях мы экономим усилия и не станем
записывать лишние цифры, тем более что они, собственно, ничего и не значат.
Обратимся еще
раз к табл. 4.3 и рассмотрим ее с несколько иной точки зрения. Когда мы составляли
эту таблицу (представление десятичных чисел в двоичном виде), то мы рассуждали
сугубо математически. Теперь эту таблицу необходимо рассмотреть с информационной
точки зрения, а именно представить дело таким образом, что мы составляем двоичные
коды для десятичных чисел, коль скоро последние для человека современного образования
наиболее привычны.
Но сначала необходимо решить одну задачу — рассчитать объем этой таблицы, исходя из количества двоичных разрядов.