ЛЕКЦИЯ02_Представление_данных.DOC

Лекция 2. Представление (кодирование) данных
План лекции:
13 TOC \n \h \z \t "Заголовок 2;2" 1413 LINK \l "_Toc121324597" 141. Представление чисел в двоичном коде15
13 LINK \l "_Toc121324598" 142. Системы счисления15
13 LINK \l "_Toc121324599" 143. Преобразование чисел из одной системы счисления в другую15
13 LINK \l "_Toc121324600" 144. Представление чисел в двоичном коде15
13 LINK \l "_Toc121324601" 145. Представление символьных и текстовых данных15
13 LINK \l "_Toc121324602" 146. Представление звуковых данных в двоичном коде15
13 LINK \l "_Toc121324603" 147. Представление графический данных в двоичном коде15
13 LINK \l "_Toc121324604" 148. Понятие сжатия информации15
15 Представление чисел в двоичном коде
Чтобы работать с данными различных видов, необходимо унифицировать форму их представления, а это можно сделать с помощью кодирования. Проблемами универсального кодирования занимаются различные области науки техники, культуры. Вспомним, что чертежи, ноты, математические выкладки являются тоже некоторым кодированием различных информационных объектов. Аналогично, универсальная система кодирования требуется для того, чтобы большое количество различных видов информации можно было бы обработать на компьютере
Подготовка данных для обработки на компьютере (представление данных) в информатике имеет свою специфику, связанную с электроникой. Например, мы хотим проводить расчеты на компьютере. При этом нам придется закодировать цифры, которыми записаны числа. На первый взгляд, представляется вполне естественным кодировать цифру ноль состоянием электронной схемы, где напряжение на некотором элементе будет равно 0 вольт, цифру единица – 1 вольт, двойку – 2 вольт и т.д., девятку – 9 вольт. Для записи каждого разряда числа в этом случае потребуется элемент электронной схемы, имеющий десять состояний. Однако элементная база электронных схем имеет разброс параметров, что может привести к появлению напряжения, скажем, 3,5 вольт, а оно может быть истолковано и как тройка и как четверка, т.е. потребуется на уровне электронных схем объяснить компьютеру, где заканчивается тройка, а где начинается четверка. Кроме того, придется создавать весьма непростые электронные элементы для производства арифметических, операций с числами, т.е. на схемном уровне должны быть созданы таблица умножения – 10x10 = 100 схем и таблица сложения – тоже 100 схем. Для электроники 40-х гг. (время, когда появились первые вычислительные машины) это была непосильная задача. Еще сложнее выглядела бы задача обработки текстов, ведь русский алфавит содержит 33 буквы. Очевидно, такой путь построения вычислительных систем не состоятелен.
В то же время весьма просто реализовались электронные схемы с двумя устойчивыми состояниями: есть напряжение – 1, нет напряжения – 0, есть электрическое (магнитное) поле – 1, нет – 0. Взгляды создателей вычислительной техники были обращены на двоичное кодирование как универсальную форму представления данных для дальнейшей обработки их средствами вычислительной техники. Предполагается, что данные располагаются в некоторых ячейках, представляющих упорядоченную совокупность из двоичных разрядов, а каждый может временно содержать одно из состояний 0 или 1. Тогда группа из двух двоичных разрядов (двух бит) может закодировать 22= 4 различные комбинации кодов (00 01 10 11); аналогично, восемь бит или 1 байт – 28 = 256 и т.д.
Существуют различные способы записи чисел, например: можно записать число в виде текста – сто двадцать три; римской системе счисления СХХШ; арабской 123.
Системы счисления
Совокупность приемов записи и наименования чисел называется системой счисления.
Числа записываются с помощью символов, и по количеству символов, используемых для записи числа, системы счисления подразделяются на позиционные и непозиционные. Если для записи числа используется бесконечное множество символов, то система счисления называется непозиционной. Примером непозиционной системы счисления может служить римская. Например, для записи числа один используется буква I, два и три выглядят как совокупности символов II, III, но для записи числа пять выбирается новый символ V, шесть – VI, десять вводится символ X, сто – С, тысяча – М и т.д. Кроме того, такой способ записи чисел приводит к очень сложным правилам арифметики.
Позиционные системы счисления для записи чисел используют ограниченный набор символов, называемых цифрами, и величина числа зависит не только от набора цифр, но и от того, в какой последовательности записаны цифры, т.е. от позиции, занимаемой цифрой, например, 125 и 215. Количество цифр, используемых для записи числа, называется основанием системы счисления, в дальнейшем его обозначим q.
В повседневной жизни мы пользуемся десятичной позиционной системой счисления, q = 10, т.е. используется 10 цифр: 0 1 2 3 4 5 6 7 8 9.
Число в позиционной системе счисления с основанием q может быть представлено в виде полинома по степеням q. Например, в десятичной системе мы имеем число
123,45 = 1 ( 102+ 2 ( 101+ 3 ( 100+ 4 ( 10-1+ 5 ( 10-2,
Записывая слева направо цифры числа, мы получим закодированную запись числа в q-ичной системе счисления.
В информатике, вследствие применения электронных средств вычислительной техники, большое значение имеет двоичная система счисления, q = 2 . На ранних этапах развития вычислительной техники арифметические операции с действительными числами производились в двоичной системе ввиду простоты их реализации в электронных схемах вычислительных машин. Например, таблица сложения и таблица умножения будут иметь по четыре правила:
0 + 0 = 0
0 x 0 = 0

0 + 1 = 1
0 x 1 = 0

1 + 0 = 1
1 x 0 = 0

1 + 1 = 10
1 x 1 = 1

А значит, для реализации поразрядной арифметики в компьютере потребуются вместо двух таблиц по сто правил в десятичной системе счисления две таблицы по четыре правила в двоичной. Соответственно на аппаратном уровне вместо двухсот электронных схем – восемь.
Но запись числа в двоичной системе счисления длиннее записи того же числа в десятичной системе счисления в log210 раз (примерно в 3,3 раза). Это громоздко и не удобно для использования, так как нормальный объем человеческого внимания составляет примерно три-четыре объекта, т.е. удобно будет пользоваться такими системами счисления, в которых наиболее часто используемые числа (от единиц до тысяч) записывались бы одной-четырьмя цифрами. Как это будет показано далее, перевод числа, записанного в двоичной системе счисления, в восьмеричную и шестнадцатеричную очень сильно упрощается по сравнению с переводом из десятичной в двоичную. Поэтому, наряду с двоичной системой счисления, в информатике имеют хождение восьмеричная и шестнадцатеричная системы счисления.
Восьмеричная система счисления имеет восемь цифр: 0 12 3 4 5 6 7. Шестнадцатеричная – шестнадцать, причем первые 10 цифр совпадают по написанию с цифрами десятичной системы счисления, а для обозначения оставшихся шести цифр применяются большие латинские буквы, т.е. для шестнадцатеричной системы счисления получим набор цифр: 0123456789ABCDEF.
Если из контекста не ясно, к какой системе счисления относится запись, то основание системы записывается после числа в виде нижнего индекса. Например, одно и то же число 231, записанное в десятичной системе, запишется в двоичной, восьмеричной и шестнадцатеричной системах счисления следующим образом:
231(10)=11100111(2)=347(8)=Е7(16).
Запишем начало натурального ряда в десятичной, двоичной, восьмеричной и шестнадцатеричной системах счисления.
Десятичная
Двоичная
Восьмеричная
Шестнадцатеричная

0
0
0
0

1
1
1
1

2
10
2
2

3
11
3
3

4
100
4
4

5
101
5
5

6
110
6
6

7
111
7
7

8
1000
10
8

9
1001
11
9

10
1010
12
А

11
1011
13
В

12
1100
14
С

13
1101
15
D

14
1110
16
Е

15
1111
17
F

16
10000
20
10

17
10001
21
11

Преобразование чисел из одной системы счисления в другую
Преобразование из десятичной в прочие системы счисления проводится с помощью правил умножения и деления. При этом целая и дробная части переводятся отдельно.
Рассмотрим алгоритм на примере перевода десятичного числа 231 в двоичную систему (совершенно аналогичен перевод из десятичной системы в любую q-ичную). Разделим число на два (основание системы): нацело 231 : 2 = 115 и остаток 1, далее 115: 2 = 57 и остаток 1, и т.д. до получения 1.
Таким образом, последовательное деление нацело позволяет разложить число по степеням двойки, а это в краткой записи и есть двоичное изображение числа.
231 = 1 х27+ 1 х26+ 1 х25+ 0 х 24+0 х 23+ 1 х 22+ 1 х 21 +1х20 = 11100111(2).

Эти выкладки можно сократить, записав процесс деления следующим образом:
231 \2
1 Ц4 \57 [2 '56

231(|0)=11100111(2)
Читая частное и остатки от деления в порядке, обратном получению, получим двоичную запись числа. Такой способ перевода чисел называется правилом (алгоритмом) последовательного делении, очевидно, что он применим для любого основания.
Между двоичной системой счисления, с одной стороны, и восьмеричной и шестнадцатеричной (заметим 8 и 16 – есть третья и четвертая степени двойки) – с другой, существует связь, позволяющая легко переводить числа из одной системы в другую.

Для перевода в шестнадцатеричную систему счисления сгруппируем целую и дробную части в группы по четыре цифры (они называются тетрадами), и каждую группу независимо от других перевести в одну шестнадцатеричную цифру.
Аналогичное правило для восьмеричной системы, используя группировку по три цифры.

Представление чисел в двоичном коде
Представление чисел в памяти компьютера имеет специфическую особенность, связанную с тем, что в памяти компьютера они должны располагаться в байтах – минимальных по размеру адресуемых (т.е. к ним возможно обращение) ячейках памяти. Очевидно, адресом числа следует считать адрес первого байта. В байте может содержаться произвольный код из восьми двоичных разрядов, и задача представления состоит в том, чтобы указать правила, как в одном или нескольких байтах записать число.
Очевидно, единого оптимального представления для всех действительных чисел создать невозможно, поэтому создатели вычислительных систем пошли по пути разделения единого по сути множества чисел на типы (например, целые в диапазоне от ... до..., приближенные с плавающей точкой с количеством значащих цифр ...и т.д.). Для каждого в отдельности типа создается собственный способ представления.
Целые числа. Целые положительные числа от 0 до 255 можно представить непосредственно в двоичной системе счисления (двоичном коде). Такие числа будут занимать один байт в памяти компьютера.
Число
Двоичный код

0
0000 0000

]
0000 0001

2
0000 0010

3
0000 0011




255
1111 1111

В такой форме представления легко реализуется на компьютерах двоичная арифметика.
Если нужны и отрицательные числа, то знак числа может быть закодирован отдельным битом, обычно это старший бит; ноль интерпретируется как плюс, единица как минус. В таком случае одним байтом может быть закодированы целые числа в интервале от -127 до +127, причем двоичная арифметика будет несколько усложнена, так как в этом случае существуют два кода, изображающих число ноль 0000 0000 и 1000 0000, и в компьютерах на аппаратном уровне это потребуется предусмотреть. Рассмотренный способ представления целых чисел называется прямым кодом. Положение с отрицательными числами несколько упрощается, если использовать, так называемый, дополнительный код. В дополнительном коде положительные числа совпадают с положительными числами в прямом коде, отрицательные же числа получаются в результате вычитания из 1 0000 0000 соответствующего положительного числа, Например, число – 3 получит код
1 0000 0000
- 0000 0011
1111 1101
В дополнительном коде хорошо реализуется арифметика, так как каждый последующий код получается из предыдущего прибавлением единицы с точностью до бита в девятом разряде. Например, 5 – 3 = 5 + (– 3).
0000 0101
+1111 1101
1 0000 0010,
т.е., отбрасывая подчеркнутый старший разряд, получим 2.
Аналогично целые числа от 0 до 65536 и целые числа от –32768 до +32767 в двоичной (шестнадцатеричной) системе счисления представляются в двухбайтовых ячейках. Существуют представления целых чисел и в четырехбайтовых ячейках (диапазон (4 294 967 295).
Действительные числа. Действительные числа в математике представляются конечными или бесконечными дробями, т.е. точность представления чисел не ограничена. Однако в компьютерах числа хранятся в регистрах и ячейках памяти, которые представляют собой последовательность байтов с ограниченным количеством разрядов.
Для представления действительных чисел, как очень маленьких, так и очень больших, удобно использовать экспоненциальную форму записи чисел в виде произведения
X = m ( qp,
где m мантисса числа;
q основание системы счисления;
р целое число, называемое порядком.
Такой способ записи чисел называется представлением числа с плавающей точкой.
То есть число 1234,56 может быть записано в одном из видов;
1234,56 = 123.456-10' = 12,3456-102 = 1,23456-Ю3 = 0,123456-104.
Очевидно, такое представление не однозначно. Если мантисса 1 / q < |m|< q (0,1 < [m| < 1 для десятичной системы счисления), то представление числа становится однозначным, а такая форма называется нормализованной. Если «плавающая» точка расположена в мантиссе перед первой значащей цифрой, то при фиксированном количестве разрядов, отведенных под мантиссу, обеспечивается запись максимального количества значащих цифр числа, т.е., максимальная точность.
Действительные числа в компьютерах различных типов записываются по-разному, тем не менее, существует несколько международных стандартных форматов, различающихся по точности, но имеющих одинаковую структуру. Рассмотрим на примере 4-байтного числа.
Первый разряд (32-й) представления используется для записи знака мантиссы. За ним следует группа разрядов (8 бит), определяющих порядок, а остальные разряды определяют абсолютную величину мантиссы. Размеры обеих групп разрядов фиксируются.
Так как порядок может быть положительным или отрицательным, нужно решить проблему его знака. Величина порядка представляется с избытком, т.е., вместо истинного значения порядка хранится число, называемое характеристикой (или смещенным порядком). Для получения характеристики необходимо к порядку прибавить смещение. Например, при использовании для хранения порядка восьми бит и значений от – 128 до + 127 используется смещение 128. Тогда для представления порядка будут использоваться значения от 0 до + 255, т.е. только неотрицательные числа.
Так как мантисса нормализованного числа всегда равна единице, некоторые схемы представления ее лишь подразумевают, используя лишний разряд для повышения точности представления мантиссы.
Использование смещенной формы позволяет производить операции над порядками, как над беззнаковыми числами, что упрощает операции сравнения, сложения и вычитания порядков, а также упрощает операцию сравнения самих нормализованных чисел.
Чем больше разрядов отводится под запись мантиссы, тем выше точность представления числа. Чем больше разрядов занимает порядок, тем шире диапазон от наименьшего отличного от нуля числа до наибольшего числа, представимого в компьютере при заданном формате.
Как и в случае целых чисел, в программных системах могут использоваться несколько типов данных, реализующих модель с плавающей точкой. Например, в языке Си применяются три типа данных с разной «длиной». Шестнадцатиразрядные компиляторы для IBM-совместимых персональных компьютеров реализуют эти типы следующим образом.
float 4 байта, из них 23 разряда мантиссы и 8 битов порядка (от 3,4 ( 10-38 до 3,4 ( 10+38, обеспечивает точность с 7 значащими цифрами);
double 8 байтов, из них 52 разряда мантиссы и 11 битов порядка (от 1,7 ( 10-308 до 1,7 ( 10+308, обеспечивает точность с 15 знаками);
long double 10 байтов, из них 65 разрядов мантиссы и 14 битов порядка (от 3,4(10-4932 до 3,4(10+4932 , обеспечивает точность с 19 знаками).
Представление символьных и текстовых данных
Рассмотрим последовательно, как кодируются символы, элементы текстов, текстовые документы.
Символы. Двоичное кодирование символьных данных производится заданием кодовых таблиц, согласно которым каждому символу ставят в соответствие одно- или двухбайтовый код. Помимо этого, кодовая таблица ставит в соответствие кодам клавиши на клавиатуре и начертание символа на экране монитора. Обратная задача интерпретация кодов осложнена тем, что в одном языке, как правило, существуют несколько кодовых таблиц. Это связано с тем, что кодовые таблицы разрабатывались в разных странах в разные времена.
Наиболее популярная таблица ASCII разработана институтом стандартизации США в 1981 г. Ее использовали, в частности, программные продукты, работающие под управлением операционной системы MS-DOS. Для представления одного символа используется один байт (8 бит), т.е. кодовая таблица описывает 28 = 256 различных кодов.
Коды с 0 до 127 составляют базовую (основную) таблицу; коды со 128 по 255 расширенную (дополнительную) таблицу.
В основной таблице располагаются управляющие команды для принтеров (коды 031 «перевод строки», «возврат каретки», им не соответствуют символы), затем спецсимволы, знаки арифметических действий и знаки препинания, цифры, латинские буквы прописные и строчные.
Дополнительная таблица отдана национальным алфавитам, символам псевдографики (с помощью которых форматируются таблицы).
Позднее, при разработке операционной системы Windows, была создана кодовая таблица Windows-1251, в которой базовая таблица осталась прежней, а расширенная – изменилась. В целом, существование в нашей стране нескольких кодовых таблиц порождает задачу межсистемного преобразования данных.
Во многих странах Азии 256 кодов явно не хватило. В 1991 г. производители программных продуктов (Microsoft, IBM, Apple) и стандартизаторы пришли к соглашению о выработке единого стандарта ISO 10646-1 (он же Unicode 3.0). Код построен по 31-битной схеме, но используются только два байта для кодирования одного символа. Два байта (или 16 бит) создают 216=65536 кодов, которые описывают цифры, буквы латинского и многих национальных алфавитов, спецсимволы, знаки арифметических операций и т.д. Все текстовые документы в этой кодировке вдвое длиннее, что сначала задерживало ее внедрение, но современный уровень технических средств допускает такую возможность. В настоящее время распространенный текстовый редактор Word, начиная с версии Word 8.0 (Microsoft Office 97), использует шрифты Unicode 3.0.
Текстовые строки. Текстовая (символьная строки) – это конечная последовательность символов. Записывается в память символьная строка двумя способами: либо число, обозначающее длину текста, затем текст, либо текст, а затем разделитель строк.
Текстовые документы. Текстовые документы используются для хранения и обмена данными в информационных системах, но сплошной, не разбитый на логические фрагменты текст воспринимается тяжело. Структурирование теста достигается форматированием – специфическим расположением текста при подготовке его к печати. Для анализа структуры текста были разработаны языки разметки, которые текстовые метки (маркеры или теги), используемые для обозначения частей документа, записывают вместе с основным текстом в текстовом формате. Программы, анализирующие текст, структурируют его, считывая теги.
Представление звуковых данных в двоичном коде
Звук – это упругая продольная волна в воздушной среде. Чтобы ее представить в виде, читаемом компьютером, необходимо выполнить следующие преобразования (рис. 1.4.). Звуковой сигнал преобразовать в электрический аналог звука с помощью микрофона. Электрический аналог получается в непрерывной форме и не пригоден для обработки на цифровом компьютере. Чтобы перевести сигнал в цифровой код, надо пропустить его через аналого-цифровой преобразователь (АЦП). При воспроизведении происходит обратное преобразование – цифро-аналоговое (через ЦАП). Позже будет показано, что конструктивно АЦП и ЦАП находятся в звуковой карте компьютера.
Во время оцифровки сигнал дискретизируется по времени и по уровню (рис. 1). Дискретизация по времени выполняется следующим образом: весь период времени Т разбивается на малые интервалы времени (t, точками t1, t2, ... tn. Предполагается, что в течение интервала (t уровень сигнала изменяется незначительно и может с некоторым допущением считаться постоянным. Величина
v = 1/(t называется частотой дискретизации. Она измеряется в герцах (Гц) – количество измерений в течение секунды.


Рис. 1. Схема обработки звукового сигнала

Рис. 2. Схема дискретизации звукового сигнала
Дискретизация по уровню называется квантованием и выполняется так: область изменения сигнала от самого малого значения Xmin до самого большого значения Хmах разбивается на N равных квантов, промежутков величиной
AX=(Xmax-Xmin)/N.
Точками X1, Х2, ... Xn, X. = Xmin + (Х (i – 1).
Каждый квант связывается с его порядковым номером, т.е. целым числом, которое легко может быть представлено в двоичной системе счисления. Если сигнал после дискретизации по времени (напомним, его принимаем за постоянную величину) попадает в промежуток Xi-1Возникают две задачи:
первая: как часто по времени надо измерять сигнал,
вторая: с какой точностью надо измерять сигнал, чтобы получить при воспроизведении звук удовлетворительного качества.
Ответ на первую задачу дает теорема Найквиста, которая утверждает, что, если сигнал оцифрован с частотой v, то высшая «слышимая» частота будет не более v/2. Вторая задача решается подбором числа уровней так, чтобы звук не имел высокого уровня шума и «электронного» оттенка звучания (точнее, это характеризуется уровнем нелинейных искажений). Попутно заметим, что число уровней берется как 2n. Чтобы измерение занимало целое число байт; v выбирают n = 8 или n = 16, т.е. каждое измерение занимает один или два байта.
Высокое качество воспроизведения получается в формате лазерного аудиодиска при следующих параметрах оцифровки: частота дискретизации – 44,1 кГц, квантование – 16 бит. Таким образом, 1 с стерео звука займет 2 байт ( 44100 байт/с ( 2 канала ( 1 с = 176 400 байт дисковой памяти. Качество звука при этом получается очень высоким.
Для телефонных переговоров удовлетворительное качество получается при частоте дискретизации 8 кГц и частоте квантования 255 уровней.
Представление графический данных в двоичном коде
Есть два основных способа представления изображений.
Первый графические объекты создаются как совокупности линий, векторов, точек называется векторной графикой.
Второй графические объекты формируются в виде множества точек (пикселей) разных цветов и разных яркостей, распределенных по строкам и столбцам, называется растровой графикой.
Модель RGB. Чтобы оцифровать цвет, его необходимо измерить. Немецкий ученый Грасман сформулировал три закона смешения цветов:
закон трехмерности любой цвет может быть представлен комбинацией трех основных цветов;
закон непрерывности – к любому цвету можно подобрать бесконечно близкий;
закон аддитивности цвет смеси зависит только от цвета составляющих.
За основные три цвета приняты красный (Red), зеленый (Green), синий (Blue). В модели RGB любой цвет получается в результате сложения основных цветов. Каждый составляющий цвет при этом характеризуется сноси яркостью, поэтому модель называется аддитивной. Эта схема применяется для создания графических образов в устройствах, излучающих свет, мониторах, телевизорах.
Модель CMYK. В полиграфических системах напечатанный на бумаге графический объект сам не излучает световых волн. Изображение формируется на основе отраженной волны от окрашенных поверхностей. Окрашенные поверхности, на которые падает белый свет (т.е. сумма всех цветов), должны поглотить (т.е. вычесть) все составляющие цвета, кроме того, цвет которой мы видим. Цвет поверхности можно получить красителями, которые поглощают, а не излучают. Например, если мы видим зеленое дерево, то это означает, что из падающего белого цвета, т.е. суммы красного, зеленого, синего, поглощены красный и синий, а зеленый отражен. Цвета красителей должны быть дополняющими:
голубой (Cyan = В + G), дополняющий красного;
пурпурный (Magenta = R + В), дополняющий зеленого;
желтый (Yellow = R + G), дополняющий синего.
Но так как цветные красители по отражающим свойствам не одинаковы, то для повышения контрастности применяется еще черный (black). Модель CMYK названа по первым буквам слов Cyan, Magenta, Yellow и последней букве слова black. Так как цвета цычи-таются. модель называется субстрактивной.
Оцифровка изображения. При оцифровке изображение с помощью объектива проецируется на светочувствительную матрицу т строк и п столбцов, называемую растром. Каждый элемент матрицы – мельчайшая точка, при цветном изображении состоящая из трех светочувствительных (т.е. регистрирующих яркость) датчиков красного, зеленого, желтого цвета. Далее оцифровывается яркость каждой точки по каждому цвету последовательно по всем строкам растра.
Если для кодирования яркости каждой точки использовать по одному байту (8 бит) на каждый из трех цветов (всего 3 ( 8 = 24 бита), то система обеспечит представление 224 ~ 16,7 млн распознаваемых цветов, что близко цветовосприятию человеческого зрения. Режим представления цветной графики двоичным кодом из 24 разрядов называется полноцветным или True Color. Очевидно, графические данные, также как и звуковые, занимают очень большие объемы на носителях. Например, скромный по современным меркам экран монитора имеет растр 800 х 600 точек, изображение, представленное в режиме True Color, займет 800 х 600 х 3 = 1 440 000 байт.
В случае, когда не требуется высокое качество отображения цвета, применяют режим High Color, который кодирует одну точку растра двумя байтами (16 разрядов дают 216 = 65,5 тысячи цветов).
Режим, который при кодировании одной точки растра использует один байт, называется индексным, в нем различаются 256 цветов. Этого недостаточно, чтобы передать весь диапазон цветов. Код каждой точки при этом выражает собственно не цвет, а некоторый номер цвета (индекс) из таблицы цветов, называемой палитрой. Палитра должна прикладываться к файлам с графическими данными и используется при воспроизведении изображения..
Понятие сжатия информации
Еще одна проблема, тесно связанная с моделями представления информации сжатие информации.
При архивировании и передаче по каналам связи объем информации является основным параметром. Поэтому модели представления дополняются процедурами сжатия, т.е. плотной упаковкой информации.
Разработаны и применяются два типа алгоритмов сжатия: сжатие с изменением структуры данных (оно происходит без потери данных) и сжатие с частичной потерей данных. Алгоритмы первого типа предусматривают две операции: сжатие информации для хранения, передачи и восстановление данных точно в исходном виде, когда их требуется использовать. Такой тип сжатия применяется, например, для хранения текстов (наиболее известны алгоритмы Хаффмена и Лемпеля-Зива). Алгоритмы второго типа не позволяют полностью восстановить оригинал и применяются для хранения графики или звука; для текстов, чисел или программ они неприменимы.

13PAGE 15


13PAGE 14715







j Заголовок 1h Заголовок 2\ Заголовок 3^ Заголовок 4Ў: 15тV Основной текст с отступомN Основной текст с отступом 2J Основной текст с отступом 3,
Оглавление 14
Оглавление 9L Оглавление 24
Оглавление 34
Оглавление 44
Оглавление 54
Оглавление 64
Оглавление 74
Оглавление 8B Нижний колонтитул, Номер страницыT Основной текст.

Приложенные файлы

  • doc 7090678
    Размер файла: 154 kB Загрузок: 0

Добавить комментарий