АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

ТЕКСТОВЫЕ И БИНАРНЫЕ ФАЙЛЫ

Читайте также:
  1. Глава 10. Текстовые разночтения в Коране
  2. Специализированные текстовые процессоры
  3. Специализированные текстовые процессоры.

Данные, которыми обмениваются программы обычно представляют собой последовательности байтов. При таком подходе представляется побайтовое хранение данных в файлах. Исторически связь между компьютерами развивалась таким образом, что неиспользуемые для обозначения символов значения байтов либо отстранялись (отрас-сь), либо использовались в специальных целях. В результате многие виды компьютерной связи включают большинство почтовых систем и соединений по телефонной линии поддерживают лишь ограниченный набор значений байтов.

Текстовым называется файлов, содержащий только разрешенные значения байтов, соответствующие кодам отображаемых символов, цифр, знаков пунктуации и специальных команд. Наборы разрешенных символов фиксируются специальными соглашениями, которые называются табличными символов.

Файлы, которые могут содержать все возможные значения байтов называются двоичными.

Форматом файла называется способ отображения его данных в последовательность байт, составляющих файл. Существует множество различных форматов файлов. Некоторые из них являются универсальными, служат для обмена данными между различными прикладными программами, в том числе программами различных производителей. Такие форматы стали универсальными de facto, т.е. появившись один раз и выиграв в конкурентной борьбе с другими файловыми форматами, они стали использоваться повсеместно. Форматы файлов организованы так, чтобы прикладные программы могли хранить в них свои данные и использовать эти данные по назначению. Существуют следующие параметры, исходя из которых выбирают тот или иной формат данных:

1. Размер. Предполагается, что файлы должны занимать минимально возможное пространство во внешней памяти. Эта цель может быть достигнута за счет удачного кодирования данных, либо за счет отбрасывания избыточной информации. Как правило, существует корреляция между плотностью хранения данных в том или ином формате и скоростью доступа к ним. Это обратная зависимость.

2. Быстрая запись. Многие программы предохраняют данные от различного рода аварий, записывая их через регулярные промежутки времени на диск. Т.к. такие данные редко читаются, скорость их чтения не важна, однако эта информация должна записываться быстро, чтобы не тормозить работу пользователя. В том случае, если объем данных велик или должен быть произведены сложные преобразования (сжатие, шифрование) перед записью на диск, запись может занимать много времени. Пример: Page Maker.

3. Быстрое чтение. Другие типы файлов читаются чаще, чем записываются. В этом случае важна скорость чтения. Здесь примером могут быть видеоданные: при сохранении видеоинформации в цифровой форме все подготовительные операции направлены на то, чтобы обеспечить как можно более быстрое чтение данных при воспроизведении.

4. Произвольный доступ. При работе с большими файлами, например с графическими данными или электронными таблицами, содержащиеся в них данные обычно копируются в оперативную память. Если все данные одновременно не могут быть скопированы, то программа должна находить и модифицировать производные части файла. Такая же проблема (произвольного доступа) возникает, если файл обрабатывается на многопроцессорной платформе. При этом каждый процессор обрабатывает свой фрагмент данных.

5. Мобильность файлов с точки зрения прикладных программ. Чтобы файлы могли использоваться различными приложениями они не должны опираться на какие-либо предположения о внутренней структуре программы. В этой связи существуют так называемые открытые, универсальные форматы, не опирающиеся на соглашения о структуре использующих их программ и закрытые форматы, данные в которых организованы таким образом, что с целью повышения быстродействия, или с целью уменьшения занимаемого на диске места, или с целью защиты данных от несанкционированного доступа, или с какой-либо другой целью, ориентированы на особенности использующих их программ. Файлы, использующие форматы такого рода очень удобны в работе с конкретной прикладной программой, но не являются универсальными.

6. Мобильность файлов с точки зрения архитектуры вычислительной системы. Каждая компьютерная система имеет свои собственные соглашения относительно следующих вещей: формат чисел с плавающей точкой, порядок байтов внутри многобайтовых значений, организация сложных структур данных в памяти. Чтобы файл мог переноситься с одной платформы на другую, следует избегать системно специфических приемов кодирования.

7. Расширяемость предполагает, что формат может с течением времени изменяться путем добавления данных новых типов, оставаясь при этом прозрачным для старых программ, т.е. совместимым с ними.

Часто требования к форматам файлов являются противоречивыми, например, один из способов уменьшения формата файла состоит в использовании стандартного алгоритма сжатия, который сжимает данные уже после их записи. Однако, в результате уменьшается скорость чтения и записи и становится невозможным осуществить прямой доступ к данным на диске.

Другой пример. Мобильность часто требует использование явных преобразований данных при чтении и записи, что приводит к замедлению файловых операций. Попытки нахождения золотой середины при выборе формата многообразны, однако самым продуктивным подходом является использование различных форматов одних и тех же данных для различных целей: один формат используется для оперативной работы, другой для долговременного хранения обработанных данных, третий для быстрого просмотра и передачи по линиям связи и т.п.

 


1 | 2 | 3 | 4 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.003 сек.)