• 7. Экономическая информатика. Экономическая информация.
  • 8. Информационный продукт. Информационные ресурсы.
  • 9. Архитектура эвм. Принципы построения эвм.
  • 10. Основные характеристики модулей эвм.
  • 11. Классификация программного обеспечения эвм.
  • 12. Проблемы и перспективы развития эвм.
  • 13. Понятие операционной системы, ее функции. Пользовательский интерфейс.
  • 14. Понятие файла. Форматы и типы файлов. Иерархическая структура данных на компьютере.
  • 15. Основные технологические принципы работы в графической операционной системе.
  • 16. Сервисные программы. Архиваторы.
  • 17. Типы прикладных программ. Примеры. Прикладное программное обеспечение для экономистов.
  • 18. Назначение и основные возможности программы обработки текстов. Элементы окна программы.
  • 19. Ввод и редактирование текста. Проверка правописания. Автозамена текста.
  • 20. Форматирование страницы, абзацев, символов.
  • 21. Операции над документами (создание, сохранение, предварительный просмотр и т.Д.) в текстовом редакторе.
  • 22. Работа со списками. Работа со сносками.
  • 23. Включение в текст графических изображений.
  • 24. Автоформатирование и стили в текстовом редакторе.
  • 25. Работа с колонками и таблицами в текстовом редакторе.
  • 26. Технология решения задач на эвм.
  • 27. Назначение и основные возможности табличного процессора. Элементы окна программы.
  • 28. Ввод данных в таблицу табличного процессора. Корректировка табличных документов.
  • 29. Оформление таблиц в табличном процессоре. Использование возможностей автоформатирования.
  • 30. Операции над документами в табличном процессоре. Работа с диаграммами.
  • 31. Сортировка и фильтрация данных в табличном процессоре.
  • 32. Работа с именами ячеек. Вставка формул в табличном процессоре.
  • 33. Использование функций для суммирования ячеек по определенному критерию, подсчета количества значений, пустых и непустых ячеек в диапазоне в табличном процессоре.
  • 34. Расчет среднего, максимального, минимального значений. Определение ранга и процентной нормы числа в табличном процессоре.
  • 35. Функции прогнозирования в табличном процессоре.
  • 36. Функции для работы с матрицами в табличном процессоре.
  • 37. Функции даты и времени в табличном процессоре.
  • 38. Функция проверки условия. Использование логических функций в табличном процессоре.
  • 39. Функция поиска данных в некотором диапазоне. Пример финансовых функций в табличном процессоре.
  • 40. Операции над рабочими листами. Связывание листов в табличном процессоре.
  • 41. Консолидация данных. Обмен данными в табличном процессоре.
  • 42. Анализ данных. Подбор параметра, поиск решения в табличном процессоре.
  • 43. Назначение и основные возможности системы управления базами данных. Элементы окна программы.
  • 44. Этапы проектирования базы данных. Создание новой базы данных.
  • 45. Создание таблицы базы данных, определение структуры, ввод записей.
  • 46. Работа с данными таблицы. Обновление структуры базы данных. Поиск и замена данных. Сортировка записей. Использование фильтра.
  • 47. Создание связей между таблицами. Типы связей в базе данных.
  • 48. Создание и открытие запроса в базе данных.
  • 49. Создание форм и отчетов.
  • 50. Понятие технологии мультимедиа. Подготовка мультимедийных презентаций.
  • 51. Назначение и основные возможности программы создания презентаций. Элементы окна программы.
  • 52. Способы создания презентаций. Работа с файлом презентации.
  • 53. Просмотр и демонстрация презентации. Управление процессом презентации и временем показа слайда.
  • 54. Понятие безопасности компьютерной информации. Объекты и элементы защиты данных в компьютерных системах и сетях.
  • 55. Обеспечение безопасности и сохранности информации в вычислительных машинах исетях.
  • 56. Правовые, технические и программные методы защиты информации.
  • 14. Понятие файла. Форматы и типы файлов. Иерархическая структура данных на компьютере.

    Все программы и данные хранятся в долговременной (внешней) памяти компьютера в виде файлов.

    Файл - это определенное количество информации (программа или данные), имеющее имя и хранящееся в долговременной (внешней) памяти.

    Имя файла состоит из двух частей, разделенных точкой: собственно имя файла и расширение, определяющее его тип (программа, данные и т. д.). Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании.

    Исполняемые программы exe, com

    Текстовые файлы txt, rtf,

    Графические файлы bmp, gif, jpg, png, pds

    Web-страницы htm, html

    Звуковые файлы wav, mp3, midi, kar, ogg

    Видеофайлы avi, mpeg

    Код (текст) программы на языках программирования bas, pas, cpp

    В различных операционных системах существуют различные форматы имен файлов. В операционной системе MS-DOS собственно имя файла должно содержать не более восьми букв латинского алфавита и цифр, а расширение состоит из трех латинских букв, например: proba.txt

    В операционной системе Windows имя файла может иметь до 255 символов, причем допускается использование русского алфавита, например: Единицы измерения информации.doc

    Файловая система

    На каждом носителе информации (гибком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске определяется установленной файловой системой.

    Файловая система - это система хранения файлов и организации каталогов.

    Для дисков с небольшим количеством файлов (до нескольких десятков) удобно применять одноуровневую файловую систему, когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов.

    Если на диске хранятся сотни и тысячи файлов, то для удобства поиска файлы организуются в много уровневую иерархическую файловую систему, которая имеет «древовидную» структуру.

    Начальный, корневой, каталог содержит вложенные каталоги 1-го уровня, в свою очередь, в каждом из них бывают вложенные каталоги 2-го уровня и т. д. Необходимо отметить, что в каталогах всех уровней могут храниться и отдельные файлы.

    15. Основные технологические принципы работы в графической операционной системе.

    В течение многих лет фирма развивался новый технологический подход к обработке данных, основанный на работе с данными в графическом режиме. ОС семейства Windows основаны на объектно-ориентированном подходе к работе с данными. Это среда управления событиями. Каждое событие – это некоторый пакет информации (сообщение). Сообщение воспринимается объектом-окном, которое в ответ на сообщение выполняет какое-то действие. Windows обеспечивает многозадачную и многопоточную обработку программ. Многозадачность – возможность одновременной работы с несколькими приложениями. Многопоточность – это возможность организовать обработку нескольких потоков данных конкурирующих за время процессора. при этом допускается параллельное выполнение нескольких приложений. Существует 2 класса ОС Windows – многопользовательские ОС на базе OC Windows NT: Windows 2000/ XP и однопользовательские ОС на базе Windows 95: Windows 98/Me. Главным отличием многопользовательских систем от однопользовательских является наличие средств защиты информации каждого пользователя от несанкционированного доступа других пользователей. Основные технологические принципы Windows Стандартный графический интерфейс пользователя. До появления Windows каждый программист при разработке программ придумывал свой собственный интерфейс - систему меню, способы диалога (ввод данных, выбор вариантов и т. д.). Каждый интерфейс мог быть по своему хорош, но такой подход заставлял пользователя переучиваться при переходе к новому программному продукту. Интерфейс Windows часто называют интуитивным: о технике выполнения многих операции можно просто догадаться, если знать базовые принципы построения интерфейса. Стандартный интерфейс Windows базируется на понятии окна. Окно – это прямоугольная область экрана. Можно выделить три типа окон: окно приложения, окно документа и диалоговое окно. Окно приложения всегда содержит два стандартных элемента: заголовок и горизонтальное меню. Кроме них в окне могут отображаться панели инструментов. Панель инструментов можно настраивать по своему вкусу с помощью команд главного меню (Сервис/Настройка). Панели инструментов дублируют команды главного меню. С помощью переключателей можно отображать или не отображать панели инструментов на экране. Необязательным элементом окна приложения является строка статуса, в которой отображается справочная информация. Кроме того, с помощью правой кнопки мыши можно вызвать меню, которое называется контекстным, т. к. оно зависит от того, для какого объекта его вызывают. Окно документа содержит заголовок, полосы прокрутки (вертикальная и горизонтальная), линейки. Полосы прокрутки появляются, если документ не помещается в окне. Линейки можно выключать. Диалоговое окно используется для ввода данных необходимых для работы программы. Диалоговые окна бывают модальными и немодальными. Модальное окно блокирует работу приложения пока оно не закрыто, т. е. все операции с ним должны быть завершены. Не модальное окно не останавливает работу приложения. В состав диалоговых окон входят: командные кнопки; переключатели; поля выбора; текстовые поля (поля ввода); списки; демонстрационные окна (образец); вкладки; поясняющие надписи. Принцип WYSIWYG (что вы видите, то и имеете). При подготовке текстовых документов страница текста на экране выглядит так же, как и на бумаге после распечатки. Текстовая информация на экране монитора и бумаге принтера отображается следующим образом. В кодовой таблице (ASCII) каждому символу присвоен определенный десятичный код. Чтобы отобразить полученный тем или иным способом код символа, компьютер может: найти в памяти по этому коду изображение символа и вывести его на экран; переслать код символа принтеру, который, пользуясь при_мерно тем же механизмом, отпечатает изображение символа на бумаге. Монитор и принтер работают под управлением разных драйверов, т. е. то, что появляется на экране монитора не имеет никакого отношения к принтеру. Технология работы с экранными шрифтами целиком определяется режимом монитора – текстовым или графическим. В текстовом режиме экран разбивается на 25 строк по 80 символов каждая, и в каждую позицию (знакоместо) экрана можно вывести произвольный символ кодовой таблицы, все символы имеют одинаковые размеры. Чтобы закодировать изображение такого символа его представляют в виде матрицы, например, 8х16 и закрасить часть клеток так, чтобы получилось изображение символа. Если в закрашенных клетках проставить 1, а в пустых - 0, то каждую строку матрицы можно будет представить де_сятичным числом от 0 до 255 (8 бит или один байт). Если записать эти числа в 16 последовательных байтов, то мы получим битовую карту символа, сам шрифт называется растровым. Если матрица одного символа занимает 16 байтов, то для представления всех 256 символов потребуется 4096 байтов. Подготовленный таким образом растровый шрифт записывается в файл (обычно с расширением.FNT). До появления Windows при подготовке текстовых файлов использовался текстовый режим монитора, полиграфические возможности этого режима очень ограничены. Если мы с помощью команды ОС DOS будем печатать файл на принтере, то DOS просто перешлет файл принте_ру, символ за символом (включая символы возврата каретки и новой строки), а принтер напечатает его тем шрифтом, на кото_рый он был настроен перед печатью. В зависимости от размеров шрифта, наличия русских букв, ширины каретки, ширины сим_волов и т. п., бумажный текст может весьма отличаться от эк_ранного (вплоть до полного искажения внешнего вида). Напри_мер, при узкой каретке одна экранная строка может превратить_ся в две-три строки на бумаге; если принтер настроен на пропор_циональный шрифт (см. ниже), неизбежно нарушится выравнивание текста и т.д. Поэтому, чтобы управлять распечаткой (например, оператив_но менять шрифт), в текстовый файл приходилось включать специальные команды форматирования. Эти команды искажали вид текста на экране, кроме того, подбирать поля на листе тоже приходилось на глаз, путем проб и ошибок. (2) Графическая технология Windows резко изменила ситуацию. Основой представления символов является та же самая кодовая таблица, принцип работы монитора и принтера также не изменились. Однако программное обес_печение Windows, вывело нашу работу с текстами на качественно иной уровень. Используя различные шрифты и стили, графические эффекты, мы можем отныне готовить на своем принтере документы высокого качества. При этом в процессе работы над документом мы видим его на экране именно так, как он будет выглядеть на экране. В приложениях Windows используются сотни разнообразных шрифтов, и число их постоянно растет. Если ранее мы имели дело с одним-единственным экранным шрифтом и несколькими принтерными, то сейчас существует огромное количество шрифтов. Шрифты можно классифицировать по способу формирования рисунка символов. По способу формирования рисунка символов шрифты делятся на растровые и векторные. Изображение растрового символа кодируется в явном виде (по точкам) в битовой карте (матрице), а затем без изменений отображается на экране или бумаге принтера. Растровый шрифт в графике создается точно так же, как и экранный шрифт для текстового режима монитора, только матрица символа чаще всего квадратная (16x16). Основной недостаток растрового шрифта - заметное ухудшение качества при увели_чении (масштабировании) символа: изображение приобретает ступенчатые очертания. Поэтому необходимо, либо создавать отдельные шрифты для разных размеров (а это не только дополнительная работа, но и затраты памяти), либо мириться с ухудшением качества. Кроме того, растровые шрифты в значительной мере зависят от конкретных характери_стик устройства отображения. При создании векторного шрифта рисунок символа не коди_руется явно по точкам, а описывается совокупностью геометри_ческих фигур, которые и определяют контур рисунка, т. е он описывается по определенным формулам, не зависящим ни размера шрифта, ни от разрешающей способности устройства. Поэтому векторные шрифты легко масштабировать без потери качества изображения. Иногда векторные шрифты называют масштабируемыми, но это не совсем точно, так как масштабиро_вать можно и растровые шрифты. В среде Windows для работы с документами, как правило, используются векторные шрифты специального формата TrueType. При этом один и тот же шрифт применяется и при выводе экранного текста, и при распечатке на принтере, т. е. функции монитора и принтера как бы «интегрируются». Технология TrueType, в сочетании с рядом дополнительных функций, позволяет реализовать на экране так называемый принцип WYSIWYG (What You See Is What You Get) т. е. страница документа со всеми ее атрибутами - рисунками, разметкой, сти_лями и т. п. - выглядит на экране так же, как и на бумаге после распечатки.

    Формат файла обычно указывается в его имени, как часть, отделённая точкой (обычно эту часть называют расширением имени файла, хотя, строго говоря, это неверно). Например, окончание имени (расширение) «.txt» обычно используют для обозначения файлов, содержащих только текстовую информацию, а «.doc» - содержащих текстовую информацию, структурированную в соответствии со стандартами программы Microsoft Word. Файлы, содержимое которых соответствует одному формату (реже - одному семейству форматов), иногда называют файлами одного типа .

    Так как общепринятая в вычислительной технике концепция файла - неструктурированная последовательность байтов , компьютерные программы , сохраняющие в файлах структурированные данные, должны как-то преобразовывать их в последовательность байтов и наоборот (в ООП эти операции называются, соответственно, «сериализацией » и «десериализацией»; для текстовой информации последнее также называется «разбор» или «парсинг»). Алгоритм этого преобразования, а также соглашения о том, как различные фрагменты информации располагаются внутри файла, и составляют его «формат».

    Различные форматы файлов могут различаться степенью детализации, один формат может быть «надстройкой» над другим или использовать элементы других форматов. Например, текстовый формат накладывает только самые общие ограничения на структуру данных. Формат HTML устанавливает дополнительные правила на внутреннее устройство файла, но при этом любой HTML-файл является в то же время текстовым файлом.

    Спецификации

    Для многих форматов файлов существуют опубликованные спецификации , в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.

    Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример - форматы файлов пакета Microsoft Office . В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.

    Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой . В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате GIF использовался патентованный алгоритм (срок действия патентов в разных странах истек в 2003-2004 гг.), что привело к разработке альтернативного формата PNG .

    Определение типа файла

    Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.

    Расширение имени файла

    Некоторые операционные системы, например, CP/M , DOS , и Microsoft Windows используют для определения типа файла часть его имени , т. е. «расширение имени файла ». В старых операционных системах это были три символа, отделённые от имени файла точкой (в файловых системах семейства FAT имя и расширение хранились отдельно, точка добавлялась уже на уровне ОС); в более новых системах расширение может являться просто частью имени, и тогда его длина ограничена только неиспользованной длиной имени (которая может составлять, например, 255 символов). Например, HTML-файлам может соответствовать расширение «.htm» или «.html».

    Пользователь может свободно изменить расширение файла. Поскольку многие оболочки пользователя используют расширение, чтобы определить программу, с помощью которой нужно открыть файл, это может сделать последний недоступным для работы или вообще «потерять», если пользователь забудет исходное расширение. Поэтому Windows Explorer по умолчанию скрывает расширения. Эта практика имеет и обратную сторону: так как расширение файла не видно, можно обмануть пользователя, заставив его думать, что, например, файл с расширением.exe - изображение с другим расширением. В то же время, опытный пользователь может использовать возможность изменить назначенный файлу тип, просто сменив расширение, чтобы открыть его в другой программе, не указывая её напрямую. Это может быть полезно, если в программе не предусмотрено открытие файлов с каким‑то расширением, а пользователь знает, что их формат подходит для обработки в данной программе.

    Магические числа

    Другой способ, широко используемый в UNIX -подобных операционных системах, заключается в том, чтобы сохранить в самом файле некое «магическое число» (сигнатуру) - последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-байтовых идентификаторов, сохраняемых в начале файла (эта практика перекочевала и в другие ОС, например, в MS-DOS), однако, любая последовательность символов, характерная для данного формата, может быть использована как «магическое число».

    Для определения формата файла служит команда file, которая использует файл /usr/share/misc/magic

    $ file /bin/ls /bin/ls: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked (uses shared libs), for GNU/Linux 2.6.18, stripped $ file notes.txt notes.txt: UTF-8 Unicode text $ file leave_2009-10-12.odt leave_2009-10-12.odt: OpenDocument Text

    Метаданные

    Некоторые файловые системы позволяют сохранять дополнительные атрибуты для каждого файла, т. е. «метаданные ». Эти метаданные можно использовать для хранения информации о типе файла. Такой подход используется в компьютерах Apple Macintosh . Метаданные поддерживаются такими современными файловыми системами как HPFS , NTFS , ext2 , ext3 и другими. Недостатком этого метода является плохая переносимость - при копировании файлов между файловыми системами разных типов метаданные могут быть потеряны.

    MIME

    Типы данных, определённые стандартом MIME , широко используются в различных сетевых протоколах , однако в файловых системах они пока применяются редко.

    См. также

    Ссылки

    • Энциклопедия форматов файлов (англ.)
    • (англ.)
    • Magic signature database - Standard file format information and FFID registry (англ.)
    • Format wars File formats for websites and print explained
    • File signatures (aka magic numbers) found in files to indicate their file type (англ.)
    • dotwhat.net - File extension and format information (англ.)
    • PRONOM technical registry (англ.)
    • Library of Congress file format information (англ.)

    Wikimedia Foundation . 2010 .

    Смотреть что такое "Формат файла" в других словарях:

      формат файла - файловый формат Кодированный поток и дополнительные данные и информация, не явно требуемые для декодирования кодированного потока. Примерами таких данных являются поля текста с титрами, информация о защите и предыстории; данные о размещении… …

      формат файла - способ (метод) и структура хранения информации в файле … Русский индекс к Англо-русскому словарь по музыкальной терминологии

      формат файла архива - архивировать в tar архив От англ. tape archive. Формат битового потока или файла архива, а также название традиционной для Unix программы для работы с такими архивами. Первоначально программа tar использовалась для создания архивов на магнитной… … Справочник технического переводчика

      формат файла для аудио-видео данных со сжатием фирмы Microsoft - Формат AVI (от англ. Audio Video Interleave) является основным для хранения видеофайлов в ОС Windows. AVI позволяет сочетать различные виды компрессии (особой популярностью пользуется пара: DivX для видео и WMA для аудио).… … Справочник технического переводчика

      формат файла MPEG-4 - (МСЭ Т J.124). Тематики электросвязь, основные понятия EN MPEG 4 file formatMP4 … Справочник технического переводчика

    Задания

    1. Сколько Кб составляет сообщение, содержащее 12288 битов?
    2. Письмо занимает 2 страницы по 25 строк. В каждой строке записано по 40 символов. Каков объём информации в письме?

    Основное назначение файлов - хранить информацию. Οʜᴎ также предназначены для передачи данных от программы к программе и от системы к системе. Другими словами, файл - это хранилище стабильных и мобильных данных. Но, файл - это нечто большее, чем просто хранилище данных. Обычно файл имеет имя, атрибуты, время модификации и время создания .

    Понятие файла менялось с течением времени. Операционные системы первых больших ЭВМ представляли файл, как хранилище для базы данных и, в связи с этим файл являлся набором записей. Обычно всœе записи в файле были одного размера, часто по 80 символов каждая. При этом много времени уходило на поиск и запись данных в большой файл.

    В конце 60-х годов наметилась тенденция к упрощению операционных систем, что позволило использовать их на менее мощных компьютерах. Это нашло свое отражение и в развитии операционной системы Unix. В Unix под файлом понималась последовательность байтов . Стало легче хранить данные на диске, так как не нужно было запоминать размер записи.

    Unix оказал очень большое влияние на другие операционные системы персональных компьютеров. Почти всœе они поддерживают идею Unix о том, что файл - это просто последовательность байтов. Файлы, представляющие собой поток данных, стали использоваться при обмене информацией между компьютерными системами. В случае если используется более сложная структура файла (как в операционных системах OS/2 и Macintosh), она всœегда должна быть преобразована в поток байтов, передана и на другом конце канала связи воссоздана в исходном виде.

    Файловая структура представляет собой систему хранения файлов на запоминающем устройстве, к примеру, диске. Файлы организованы в каталоги (иногда называемые директориями или папками). Любой каталог может содержать произвольное число подкаталогов, в каждом из которых могут храниться файлы и другие каталоги.

    Способ, которым данные организованы в файлы, принято называть форматом файла .

    Для того чтобы прочесть файл, к примеру, электронной таблицы, крайне важно знать, каким образом байты представляют числа (формулы, текст) в каждой ячейке; чтобы прочесть файл текстового редактора, нужно знать, какие байты представляют символы, а какие шрифты или поля, а также другую информацию.

    Программы могут хранить данные в файле таким способом, какой выберет программист. Зачастую предполагается, однако, что файлы будут использоваться различными программами. По этой причинœе многие прикладные программы поддерживают некоторые наиболее распространенные форматы, так что другие программы могут понять данные в файле. Компании по производству программного обеспечения (которые хотят, чтобы их программы стали "стандартами"), часто публикуют информацию относительно форматов, которые они создали, чтобы их можно было бы использовать в других приложениях.

    Все файлы условно можно разделить на две части - текстовые и двоичные.

    Текстовые файлы - наиболее распространенный тип данных во всœем компьютерном мире. Для хранения каждого символа чаще всœего отводится один байт, а кодирование текстовых файлов выполняют с помощью специальных таблиц, в которых каждому символу соответствует определœенное число, не превышающее 255. Файл, для кодировки которого используется только 127 первых чисел, принято называть ASCII-файлом (сокращение от American Standard Code for Information Interchange - американский стандартный код для обмена информацией), но в таком файле не бывают представлены буквы, отличные от латиницы (в том числе и русские). Большинство национальных алфавитов можно закодировать с помощью восьмибитной таблицы. Для русского языка наиболее популярны на данный момент три кодировки: Koi8-R, Windows-1251 и, так называемая, альтернативная (alt) кодировка. Подробнее о кодировании русского текста рассказано в главе "Обработка документов".

    Такие языки, как китайский, содержат значительно больше 256 символов, в связи с этим для кодирования каждого из них используют несколько байтов. Для экономии места зачастую применяется следующий прием: некоторые символы кодируются с помощью одного байта͵ в то время как для других используются два или более байтов. Одной из попыток обобщения такого подхода является стандарт Unicode , в котором для кодирования символов используется диапазон чисел от нуля до 65 536. Такой широкий диапазон позволяет представлять в численном виде символы языка людей из любого уголка планеты.

    Но чисто текстовые файлы встречаются всœе реже. Люди хотят, чтобы документы содержали рисунки и диаграммы и использовали различные шрифты. В результате появляются форматы, представляющие собой различные комбинации текстовых, графических и других форм данных.

    Двоичные файлы, в отличие от текстовых, не так просто просмотреть и в них, обычно, нет знакомых нам слов - лишь множество непонятных символов. Эти файлы не предназначены непосредственно для чтения человеком. Примерами двоичных файлов являются исполняемые программы и файлы с графическими изображениями.

    Форматы файлов - понятие и виды. Классификация и особенности категории "Форматы файлов" 2014, 2015.

    , хотя, строго говоря, это неверно [прояснить ] .

    Например, окончание имени (расширение) «.txt » обычно используют для обозначения файлов, содержащих только текстовую информацию , а «.doc » - содержащих текстовую информацию, структурированную в соответствии со стандартами программы Microsoft Word . Файлы, содержимое которых соответствует одному формату (реже - одному семейству форматов), иногда называют файлами одного типа .

    Так как общепринятая в вычислительной технике концепция файла - неструктурированная последовательность байтов , компьютерные программы , сохраняющие структурированные данные в файлы, должны как-то преобразовывать их в последовательность байтов и наоборот (в ООП эти операции называются, соответственно, «сериализацией » и «десериализацией»; для текстовой информации последнее также называется «разбор» или «парсинг »). Алгоритм этих преобразований, а также соглашения о том, как различные фрагменты структурированных данных располагаются внутри файла, и составляют его «формат».

    Различные форматы файлов могут различаться степенью детализации, один формат может быть «надстройкой» над другим или использовать элементы других форматов. Например, текстовый формат накладывает только самые общие ограничения на структуру данных. Формат HTML устанавливает дополнительные правила на внутреннее устройство файла, но при этом любой HTML-файл является в то же время текстовым файлом.

    Другой пример - структура самих компьютерных программ - исполняемых файлов : она должна строго соответствовать некоторым ожиданиям запускающей её операционной системы .

    Спецификации

    Для многих форматов файлов существуют опубликованные спецификации , в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.

    Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример - форматы файлов пакета Microsoft Office . В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.

    Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой . В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате GIF использовался патентованный алгоритм (срок действия патентов в разных странах истек в 2003-2004 гг.), что привело к разработке альтернативного формата PNG .

    Определение типа файла

    Тип файла - это информация для быстрой идентификации содержимого файла операционной системой и пользователем без необходимости считывания всего содержимого файла. Благодаря этой информации пользователь приблизительно знает тип содержащейся информации в файле, а в операционной системе может быть сопоставлена программа для обработки файлов данного типа. Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.

    Расширение имени файла

    Некоторые операционные системы, например, CP/M , DOS , и Microsoft Windows используют для определения типа файла часть его имени , то есть «расширение имени файла ». В старых операционных системах это были три символа, отделённые от имени файла точкой (в файловых системах семейства FAT имя и расширение хранились отдельно, точка добавлялась уже на уровне ОС); в более новых системах расширение может являться просто частью имени, и тогда его длина ограничена только неиспользованной длиной имени (которая может составлять, например, 255 символов). Например, HTML-файлам может соответствовать расширение «.htm» или «.html».

    Пользователь может свободно изменить расширение файла. Поскольку многие оболочки пользователя используют расширение, чтобы определить программу, с помощью которой нужно открыть файл, это может сделать последний недоступным для работы или вообще «потерять», если пользователь забудет исходное расширение. Поэтому Windows Explorer по умолчанию скрывает расширения. Эта практика имеет и обратную сторону: так как расширение файла не видно, можно обмануть пользователя, заставив его думать, что, например, файл с расширением.exe - изображение с другим расширением. В то же время опытный пользователь может использовать возможность изменить назначенный файлу тип, просто сменив расширение, чтобы открыть его в другой программе, не указывая её напрямую. Это может быть полезно, если в программе не предусмотрено открытие файлов с каким‑то расширением, а пользователь знает, что их формат подходит для обработки в данной программе.

    Магические числа

    Другой способ, широко используемый в UNIX -подобных операционных системах, заключается в том, чтобы сохранить в самом файле некое «магическое число» (сигнатуру) - последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-



    Эта статья также доступна на следующих языках: Тайский

    • Next

      Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

      • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

        • Next

          В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

    • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
      https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png