Понятие файла. Имя, расширение и спецификация файла. Файл: имена файлов. Полное, короткое, длинное, корректное и некорректное имя файла, его состав, шаблон и маска

Файл - это определенное количество информации (программа или данные), имеющее имя и хранящееся в долговременной (внешней) памяти.

Имя файла состоит из двух частей, разделенных точкой: собственно имя файла и расширение, определяющее его тип (программа, данные и т. д.). Собственно имя файлу дает пользователь, а тип файла обычно задается программой автоматически при его создании. Расширение файла - часть имени файла, отделённая самой правой точкой в имени.

При записи имени файла разрешается использовать только буквы английского алфавита и цифры. Начинаться имя должно с буквы. Пробелы и знаки препинания не допускаются, за исключением восклицательного знака (!), тильды (~) и символа подчеркивания (_).

После введения в действие операционной системы Windows 95 требования к именам файлов стали существенно мягче. Они действуют и во всех последующих версия операционных систем Windows.

1. Разрешается использовать до 255 символов.

2. Разрешается использовать символы национальных алфавитов, в частности русского.

3. Разрешается использовать пробелы и другие ранее запрещенные символы, за исключением следующих девяти: /\:*?"<>|.

4. В имени файла можно использовать несколько точек. Расширением имени считаются все символы, стоящие за последней точкой.

Роль расширения имени файла чисто информационная, а не командная. Если файлу с рисунком присвоить расширение имени ТХТ, то содержимое файла от этого не превратится в текст. Его можно просмотреть в программе, предназначенной для работы с текстами, но ничего вразумительного такой просмотр не даст.

Файловая система. На каждом носителе информации (гибком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске определяется установленной файловой системой.

Файловая система - это система хранения файлов и организации каталогов. Она определяет формат физического хранения информации, которую принято группировать в виде файлов. Конкретная файловая система определяет размер имени файла, максимальный возможный размер файла, набор атрибутов файла. Некоторые файловые системы предоставляют сервисные возможности, например, разграничение доступа или шифрование файлов.

Для дисков с небольшим количеством файлов (до нескольких десятков) удобно применять одноуровневую файловую систему, когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов. Для отыскания файла на диске достаточно указать лишь имя файла. Такая одноуровневая схема использовалась в первых версиях MS-DOS. Сегодня её можно встретить, например, в некоторых цифровых фотоаппаратах: все сделанные фотографии складываются в один каталог.

Если на диске хранятся сотни и тысячи файлов, то для удобства поиска файлы организуются в многоуровневую иерархическую файловую систему, которая имеет «древовидную» структуру (имеет вид перевернутого дерева).

В таком случаи файлы на дисках объединяются в каталоги. Начальный, корневой, каталог содержит вложенные каталоги 1-го уровня, в свою очередь, в каждом из них бывают вложенные каталоги 2-го уровня и т. д. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы. В Windows каталоги называются папкам

Атрибуты файла устанавливаются для каждого файла и указывают системе, какие операции можно производить с файлами. Существует четыре атрибута:

Только чтение (R);

Архивный (A);

Скрытый (H);

Системный (S).

Атрибут файла «Только чтение»

Данный атрибут указывает, что файл нельзя изменять. Все попытки изменить файл с атрибутом «только чтение», удалить его или переименовать завершатся неудачно.

Атрибут файла «Скрытый»

Файл с таким атрибутом не отображается в папке. Атрибут можно применять также и к целым папкам. Надо помнить, что в системе предусмотрена возможность отображения скрытых файлов, для этого достаточно в меню Проводника Сервис – Свойства папки – вкладка Вид – Показывать скрытые файлы и папки.

Атрибут файла «Архивный»

Такой атрибут имеют практически все файлы, его включение/отключение практически не имеет никакого смысла. Использовался атрибут программами резервного копирования для определения изменений в файле.

Атрибут файла «Системный»

Этот атрибут устанавливается для файлов, необходимых операционной системе для стабильной работы. Фактически он делает файл скрытым и только для чтения. Самостоятельно выставить системный атрибут для файла невозможно.

СПЕЦИФИКАЦИЯ ФАЙЛА

Чтобы опеpационная система могла обнаpужить файл, ей нужно сообщить

его имя. Кpоме этого, необходимо указать диск, где находится файл. Для

обозначения диска используется шифp устpойства (дисковода), на котоpом

он установлен. Шифp устpойства пpедставляет собой букву алфавита, за

котоpой следует двоеточие. Пеpвому дисководу в системе пpисваивается

шифp "A:", втоpому - "B:". Пеpвый дисковод для жесткого диска обычно

помечается шифpом "C:". Дисководы pазличаются по шифpу устpойства и

называются: дисковод A, дисковод В и т.д.

Шифp устpойства, записанный в комбинации с именем файла, пpедставляет

собой спецификацию файла. Спецификация вводится в фоpмате: ("шифp

устpойства""пpостое имя.pасшиpение"). Напpимеp, спецификация файла с

пpостым именем "instruct" и pасшиpением "txt", находящегося на диске A,

выглядит следующим обpазом: "A:instruct.txt".

Типы файловых систем

По способу идентификации данных различают:

Тривиальные ФС, определяющие хранение файлов в единственной «куче», корневом каталоге носителя. Эти системы практически вымерли, и замещены на иерархические. Из применяющихся можно назвать TR-DOS на компьютере Sinclair ZX-Spectrum.

Иерархические ФС, обеспечивающие хранение файлов в древовидной структуре каталогов. Являются самым распространёным видом ФС. В настольных системах начиная с 1990-х применяются практически только они.

Реляционные, ассоциативные, (?) прочие ФС, обеспечивающие другие методы идентификации данных. Применяются крайне редко по причине узкой области применения.

Файловые системы различаются по устойчивости к сбоям:

Неустойчивые к сбоям как правило представляю собой тривиальные структуры, полная согласованность которых обеспечивается во время работы не всегда. При сбое системы в моменты несогласованности возможна потеря данных, или даже разрушение всей ФС целиком. Восстановление часто требует длительных и нетривиальных действий.

Устойчивые к сбоям системы представляют полностью согласованные структуры в любой момент времени существования файловой системы, таким образом, отстутствуют моменты, когда сбой может привестик потерям данных или разрушению ФС. Как правило это журналируемые ФС, дублирующие все изменения структуры в специальной области - журнале, таким образом, в случае сбоя имеющие возможность завершить незавершённую операцию или откратить состояние ФС до сбоя.

Компьютер работает с информацией, которая может быть текстовой, графической, аудио- или видео-формата. Вся информация, обрабатываемая на компьютере, хранится в файлах. Понятие файла является одним из базовых понятий компьютерной грамотности.

Файл – это поименованная область памяти на компьютерном носителе. Другими словами, файлом называется набор данных на компьютерном носителе (жёсткий диск, CD и DVD диск, флешка и т.п.), у которого есть свое имя (имя файла ).

Какие можно использовать символы в имени файла? В именах файлов рекомендуется использовать русские и латинские буквы, цифры, пробелы и знаки препинания. Однако имя файла не следует начинать с точки, а также использовать в имени квадратные или фигурные { } скобки. Недопустимыми для имен файлов являются следующие служебные символы / \ | : * ? “ < >

Существует ли максимальная длина имени файла? Длина имени файла не должна превышать 255 символов. На самом деле, обычно хватает 20-25 символов.

Windows не делает различий между строчными и прописными буквами для имен файлов. Это означает, что не получится хранить в одном и том же каталоге файлы, имена которых различаются только регистром. Например, два имени файла «Название.doc» и «НАЗВАНИЕ.doc» для Windows будет одним именем для одного и того же файла.

Как Вы считаете, могут ли быть в одном каталоге несколько файлов с одинаковым именем PRIMER? Это возможно при условии, что у имени PRIMER будут разные расширения.

Расширение имени файла указывает на тип файла (иногда еще говорят – формат файла ). Таким образом,

  • “тип файла”,
  • “формат файла”,
  • “расширение файла”,
  • “расширение имени файла” –

это, по большому счету, одно и то же.

Например,

PRIMER.doc(x) – типом файла является документ Word (или файл в формате Ворда),

PRIMER.bmp – типом файла является рисунок,

PRIMER.avi – типом файла является видеофайл,

PRIMER.wav – типом файла является аудиофайл.

Все эти файлы имеют разные имена (за счет разных расширений имени файла) и могут храниться в одном и том же месте, т.е. в одном каталоге. Если проводить аналогию с именами людей, то имя файла совпадает с именем человека, а расширение имени файла – с фамилией человека. Соответственно, PRIMER.doc и PRIMER.bmp по этой аналогии то же самое, что Иван Петров и Иван Сидоров. Файлы с именами PRIMER.doc и VARIANT.doc – это два брата из одного семейства документов (с одинаковым расширением.doc), так же как, например, Иван Петров и Федор Петров – братья из одной семьи Петровых.

Расширение имени файла – это часть имени файла, которая начинается с точки, после которой стоят несколько символов.

Распространены расширения, состоящие из трех букв – .doc, .txt, .bmp, .gif и.т.д. Регистр не имеет значения, поэтому.doc и.DOC – это одно и то же расширение документа.

Расширение является необязательным атрибутом в имени файла, т.е. его может и не быть. В таком случае в конце имени файла точка, как правило, не ставится. Расширение хоть и не обязательно, но все-таки желательно, т.к. оно указывает Windows на тип файла. Проще говоря, тип файла является подсказкой для Windows, с помощью какой программы следует этот файл открывать. Например, расширение.doc указывает, что файл следует открывать с помощью редактора Word, а расширение.cdr – на то, что файл открывается графической программой Corel Draw.

Есть зарезервированные (служебные) имена, которые нельзя использовать в качестве имен файлов, так как они являются именами устройств:

PRN – принтер,

COM1-COM4 – устройства, присоединяемые к последовательным портам 1-4,

AUX – то же, что COM1,

LPT1-LPT4 – устройства, присоединяемые к параллельным портам 1-4 (как правило, принтеры),

CON (consol) – при вводе – клавиатура, при выводе – экран,

NUL – «пустое» устройство.

Приведу примеры имен файлов, которые являются недопустимыми:

5<>8/7.txt – символы «<», «>» и «/» запрещены,

В чем вопрос? – символ «?» запрещен,

PRN.bmp – здесь PRN зарезервированное имя.

В зависимости от типа файла на экран Windows выводятся различные значки (иконки):

Проводник Windows (Пуск-Программы-Стандартные-Проводник) по умолчанию имеет режим, когда расширения имен файлов на экран не выводятся, но при этом выводятся значки (иконки) файлов.

При сохранении файла достаточно написать его имя и выбрать тип файла из имеющегося списка. Выбранное расширение автоматически добавится к имени файла. Например, на рисунке ниже к имени файла программа сама добавит расширение.jpg. В результате Windows запомнит этот файл с именем «рисунок в paint.jpg».

Во избежание недоразумений при сохранении файлов всегда обращайте внимание на строку «тип файла», если она есть. Ведь тип файла является для Windows подсказкой, с помощью которого система определяет какой именно программой этот файл можно открыть.

Если Вы скачали из Интернета файл, например, с расширением.rar, но на вашем компьютере не установлена программа-архиватор для работы с такими «сжатыми, заархивированными» файлами, то не удивляйтесь, что файл не открывается. Другими словами, надо отдавать себе отчет, что если открывать файлы, например, в видеоформате, то на компьютере должна быть в наличии соответствующая программа для работы с таким форматом.

Можно провести аналогию между файлом (точнее, между типом файла) и программой, работающей с таким типом файлов. Файл – замок, а программа, открывающая этот файл – ключик. Замок без ключика не открывается, да и ключик без замка особой ценности не представляет.

Упражнения по компьютерной грамотности:

1) Попробуйте на Рабочем столе создать две папки с именами: PRIMER и primer. Для этого на Рабочем столе кликните правой кнопкой мыши на свободном месте, а в появившемся окне – по опции «Создать» и, наконец, клик по опции «Папку». Вместо слов «Новая папка» введите «PRIMER». Затем все это повторяете для создания второй папки с именем «primer». Windows дал Вам «добро» на открытие второй папки?

2) Зайдите, например, в редактор Word и попробуйте сохранить документ с именем PRN. Windows разрешил такое имя для нового файла?

3) Как решить проблему: “С инета скачиваю файлы, а они в формате хsd (PM)/RAR и на компе не открываются, не читаются. Что делать?”

P.S. Статья закончилась, но можно еще прочитать:

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик .
Уже более 3.000 подписчиков

.

Файловая система

Файл – это любой набор информации, сохраненный на диске под собственным именем. Файлом могут быть программы, тексты, рисунки, наборы данных и т.п. Файлы хранятся на диске в виде иерархической древовидной структуры.

Диски обозначаются буквами латинского алфавита и знаком двоеточия. Жесткий диск может быть разбит на несколько логических дисков, которые обозначаются буквами С:, D:, E: и т.д.

По существу папка представляет собой особый тип файла, в котором содержится информация о находящихся в ней файлах и папках.

Адрес указывает на расположение файла или папки в файловой системе. Он начинается с имени диска, а затем записывается последовательность названий папок. Имя диска называют корневым каталогом . Адрес имеет еще одно название «полный путь».

Формат записи адреса: Имя диска:\Папка1\Папка2\ .

Полное имя файла состоит из имени файла и полного пути. Каждый файл, хранящийся в компьютере, имеет уникальное полное имя. В одной папке не может быть двух файлов с одинаковыми именами, в разных папках это допустимо.

Запись файлов на диск производится частями. Наименьшее место, которое могут занимать на диске записываемые данные, составляет один кластер – это минимальный адресуемый элемент диска. Кластер может состоять из одного или нескольких секторов. Объем сектора составляет 512 байт.

Система организации хранения файлов называется файловой системой . Windows поддерживает три файловые системы: FAT16 (или просто FAT), FAT32 и NTFS. Выбор файловой системы осуществляется при установке Windows и форматировании диска.

При форматировании на диске выделяется системная область, которая состоит из трех частей: загрузочного сектора, таблицы размещения файловой и корневого каталога.

В загрузочном секторе (Boot Record) хранятся данные о формате диска и его файловой системе.

В корневом каталоге содержится перечень файлов, находящихся на диске. Запись о файле содержит имя файла, адрес первого кластера, объем файла, а также время и дату его создания.

Таблица размещения файлов (File Allocation Table, сокращенно FAT) содержит описание порядка расположения всех файлов в кластерах данного диска, а также информацию о дефектных участках диска. Количество ячеек FAT-таблицы соответствует количеству кластеров на диске, а значениями ячеек являются цепочки размещения файлов, т.е. последовательность адресов кластеров, в которых хранятся файлы. Порядковый номер ячейки FAT-таблицы соответствует адресу кластера.

Имя файла состоит из двух частей, разделенных точкой, - это название файла и его расширение.

Расширение в имени файла служит для обозначения его типа. По расширению файла ОС определяет программу. С помощью которой был создан файл. Некоторые расширения показывают, что файл является программой.


Файлы программ называются исполняемыми файлами. Они имеют расширение com или exe .

В имени файла запрещено использование следующих служебных символов: \ / : * ? “ < > |.

Имеются некоторые отличия в задании имен файлов в ОС MS DOS и Windows. В MS DOS длина имени не должна превышать 8 символов, в Windows – 256 символов. В MS DOS нельзя использовать символы русского алфавита и пробелы, а в Windows можно.

Для обозначения группы файлов применяются шаблоны, в которых используются подстановочные символы. Звездочка (*) обозначает любое количество любых символов, вопросительный знак (?) – один любой символ. Например, шаблон p* означает, что имя файла начинается на букву р, шаблон р???л – что в имени файла между буквами р и л находятся три любых знака, а шаблон *.txt обозначает все файлы с расширением txt.

В некоторых программах используется знак вертикальной черточки (|), обозначающий исключение некоторых шаблонов. Например, *.*|*.bak означает все файлы, кроме файлов с расширением bak.

Файловые системы ext2 и ext3 допускают наличие в именах файлов практически любых символов, кроме разделителя директорий (/). Однако я не советую использовать имена, содержащие русские буквы, знаки пунктуации (кроме точки), пробелы, псевдографику, экзотические знаки вроде символа перехода на новую строку. Не стоит также начинать имена файлов с дефиса (-). Тут дело в том, что многие программы, работающие с файлами, принимают в командной строке ключи (опции), начинающиеся с дефиса. Например, вы хотите пролистать каталог по имени -lR командой ls -lR . Но -lR будет воспринято программой ls не как имя каталога, а как ключи -l (выдать подробный листинг) и -R (рекурсивно), и в результате вы получите листинг текущего каталога (так как каталог не указан, программа ls по умолчанию работает с текущим). Во всех остальных случаях дефис в именах файлов вполне допустим и часто используется. Советуем ограничиться следующим набором символов - латинские буквы (большие и маленькие), цифры, знак подчёркивания, дефис (но не в начале), точка.

Термин «расширение» сохранился со времён, когда операционная система Microsoft DOS была самой популярной для персональных компьютеров типа IBM PC. Файловая система DOS позволяла в именах файлов не более 11 знаков; первые не более 8 из них считались основным именем (base name), а не более 3 последних - расширением (extension ) имени. Для отделения основной части имени от расширения использовалась точка (кроме специальных имён - . и..). Сама точка не считалась частью имени. Имена WORK и WORK. означали одно и то же. Вот пример имени файла наиболее длинного имени: AUTOEXEC.BAT . Многие программы для DOS и Windows придают расширениям чересчур большое значение - например, Microsoft Word будет упорно пытаться открыть файл с расширением.DOC как документ в его родном формате, даже если в файле содержится простой текст. В файловых системах Linux точка - такая же часть имени, что и любой другой символ. Теперь уже WORK и WORK. станут ссылаться на разные файлы. Если угодно, можно по-прежнему называть часть имени файла, следующую за точкой, расширением, хотя точек в имени может быть и несколько. Например, файловому архиву в формате tar , сжатому компрессором lzma , часто дают суффикс.tar.lzma . Большинство программ для Linux не связывают расширение имени файла с его содержимым, либо связывают, но позволяют явно указать тип содержимого файла с помощью опций. Тот же Perl будет запускать свои программы по имени, независимо от того, какое расширение использовано - .pl , .plx или.cgi , и есть ли оно вообще.

Некоторые программы вроде текстовых редакторов, работающие с файлами, и «на месте» изменяющие их содержимое, способны оставлять резервные копии. Имена таких копий обычно получаются из исходных имён добавлением знака ~ в конце, например, linux.html~ .




Top