Lo cual no era el caso en los primeros sistemas de archivos. Sistemas de archivos. Tipos de sistemas de archivos. Operaciones de archivos. Catálogos. Operaciones con directorios. (5). Leer en una matriz

L 5.1. ARQUITECTURA DEL SO

Palabras clave: archivo, extensión de nombre de archivo, atributos de archivo, estructura de archivo, directorio (carpeta), ruta de archivo, formato, sector, pista, cilindro, tabla de asignación de archivos (tabla FAT), clúster, sistema de archivos, FAT 16, FAT 32, NTFS, MTF , CDFS, comandos del sistema operativo, escritorio, barra de tareas, icono de objeto y acceso directo, menú principal ventanas, ventana ventanas, barra de título, barra de herramientas, arrastrar y soltar, arrastrar, " Conductor", portapapeles, " Comandante Norton", plantillas para seleccionar y buscar archivos.

Sistema operativo es un complejo de software de sistema y servicio. Por un lado, se apoya en el software informático básico incluido en su sistema. BIOS ( sistema básico entrada-salida); por otro lado, ella misma es un apoyo para software niveles superiores: aplicaciones y la mayoría de las aplicaciones de servicio. Aplicaciones del sistema operativo Es habitual llamar a programas diseñados para funcionar bajo el control de un sistema determinado.

La función principal de todos sistemas operativos- intermediario. Consiste en proporcionar varios tipos de interfaz:

· interfaz entre el usuario y el hardware de la computadora (interfaz de usuario);

interfaz entre software y hardware (interfaz hardware-software);

· interfaz entre diferentes tipos de software (interfaz de software).

Incluso para una plataforma de hardware, como
PC IBM, Existen varios sistemas operativos (SO). Por ejemplo, veamos la estructura de archivos, objetos principales y técnicas de gestión de los sistemas operativos más comunes: MS-DOS Y WindowsXP.

Estructura de archivos de una computadora personal. Al almacenar datos, se resuelven dos problemas: cómo almacenar datos en la forma más compacta y cómo proporcionar un acceso conveniente y conveniente a ellos. acceso rápido(si no se proporciona acceso, entonces esto no es almacenamiento). Para garantizar el acceso, los datos deben tener una estructura ordenada. Esto genera datos de dirección. Sin ellos no puedes acceder los elementos necesarios datos incluidos en la estructura.

Un objeto se toma como unidad de almacenamiento de datos. longitud variable, llamado archivo.

Un archivo es una secuencia con nombre de bytes de longitud arbitraria. Dado que un archivo puede tener una longitud cero, crear un archivo implica darle un nombre y registrarlo en el sistema de archivos; esta es una de las funciones del sistema operativo.

Normalmente, los datos que pertenecen al mismo tipo se almacenan en un archivo separado. En este caso, el tipo de datos determina tipo de archivo.

Dado que no hay límite de tamaño en la definición del archivo, se puede imaginar un archivo que tenga 0 bytes. (archivo vacío), y un archivo que tiene cualquier número de bytes.



En la definición del archivo atención especial dado al nombre. En realidad, contiene datos de dirección, sin los cuales los datos almacenados en el archivo no se convertirán en información debido a la falta de un método para acceder a ellos. Además de las funciones relacionadas con las direcciones, un nombre de archivo también puede almacenar información sobre el tipo de datos que contiene. Para medios automáticos Al trabajar con datos, esto es importante porque por el nombre del archivo (o más bien por su extensión) pueden determinar automáticamente un método adecuado para extraer información del archivo.

Según los métodos de denominación de archivos, distinguen “ corto"(Se asignan 8 caracteres para el nombre del archivo y 3 caracteres para su extensión) y " largo» nombre (hasta 256 caracteres). El nombre del archivo y su extensión están separados por un punto. La extensión del archivo es un parámetro opcional y es posible que falte.

En sistema operativo MS-DOS El nombre (no más de 8 caracteres) y la extensión (no más de 3 caracteres) pueden consistir en mayúsculas y minúsculas. letras latinas, números y símbolos:

- _ $ # & @ ! % () { } " ~ ^

Cabe recordar que para las líneas del sistema operativo MS-DOS:

Se coloca un punto entre el nombre y la extensión, que no está incluido ni en el nombre ni en la extensión;

El nombre del archivo se puede escribir en cualquier caso, porque para el sistema todas las letras están en minúsculas;

Caracteres no utilizados en los nombres de archivos.

* = + \ ; : , . < > / ?

Los nombres de dispositivos no se pueden utilizar como nombres de archivos:

AUX - nombre dispositivo adicional entrada-salida;

CON: nombre del teclado para entrada o visualización para salida;

LPT1 ... LPT3 - nombres de puertos paralelos;

COM1 ... COM3 - nombres de los puertos serie;

PRN: nombre del dispositivo de impresión;

NUL es el nombre de un dispositivo ficticio que emula operaciones de salida sin salida real.

Con la llegada del sistema operativo Windows 95 el concepto “ largo" nombre. Este nombre puede tener hasta 256 caracteres, lo que es suficiente para crear nombres de archivos significativos. " Largo"El nombre puede contener cualquier carácter excepto nueve especiales:

\ / : * ? " < > |

Se permiten espacios y múltiples puntos en el nombre. La extensión del nombre incluye todos los caracteres después del último punto.

Junto con " largo» Nombre del sistema operativo ventanas También se crean 95/98/Me/2000/XP. corto nombre del archivo: es necesario para poder trabajar con este archivo en estaciones de trabajo con sistemas operativos obsoletos.

Uso " largo» nombres de archivos en el último sistema operativo ventanas tiene un numero características.

1. Si " largo"El nombre del archivo incluye espacios, luego en operaciones de servicio debe ir entre comillas. Se recomienda no utilizar espacios, sino sustituirlos por guiones bajos.

2. No es recomendable almacenar archivos con nombres largos en la carpeta raíz del disco (en el nivel superior de la estructura jerárquica de archivos); a diferencia de otras carpetas, la cantidad de unidades de almacenamiento está limitada (cuanto más largos sean los nombres, cuantos menos archivos se puedan colocar en la carpeta raíz).

3. Además del límite de longitud del nombre del archivo (256 caracteres), existe un límite de longitud mucho más estricto. nombre de archivo completo(Esto incluye la ruta de acceso al archivo, comenzando desde la parte superior de la estructura jerárquica). El nombre completo no puede tener más de 260 caracteres.

4. Está permitido utilizar caracteres de cualquier alfabeto, incluido el ruso, pero si el documento se está preparando para su transmisión, es necesario acordar con el cliente la posibilidad de reproducir archivos con dichos nombres en su equipo.

5. Capitales y letras minúsculas El sistema operativo no difiere. Nombres Letra.txt Y carta. TXT corresponden al mismo archivo.

6. Los programadores han aprendido durante mucho tiempo a utilizar extensiones de nombres de archivos para transmitir al sistema operativo, al programa en ejecución o al usuario información sobre qué tipo de datos contiene el archivo y el formato en el que está escrito. Las aplicaciones del sistema ofrecen seleccionar solo la parte principal del nombre y especificar el tipo de archivo, y la extensión del nombre correspondiente se asigna automáticamente.

Dependiendo de la extensión, todos los archivos se dividen en dos grupos grandes: ejecutable Y no ejecutable .

Archivos ejecutables - estos son archivos que se pueden ejecutar de forma independiente, es decir. No requieren ningún programa especial para ejecutarlos. Tienen las siguientes extensiones:

· exe- archivo listo para su ejecución ( winrar.exe; winword.exe);

· centenar - archivo del sistema operativo ( comando.com);

· sistema- archivo del sistema operativo ( io.sys) - normalmente se trata de un controlador de dispositivo externo;

· murciélago- archivo por lotes Sistema operativo MS-DOS (autoexec.bat).

Los archivos no ejecutables requieren la instalación de programas especiales para ejecutarse. Entonces, por ejemplo, para ver un documento de texto, necesita tener algún tipo de editor de texto. Por la extensión de un archivo no ejecutable, puede juzgar el tipo de datos almacenados en este archivo. Aquí hay algunos extensiones estándar y los nombres de los programas diseñados para trabajar con archivos de las extensiones especificadas:

A.S.M.- texto del programa en idioma ensamblador;

AVI, MPEG, MPG, WMV etc. - varios formatos de archivos de vídeo, para verlos puede utilizar, por ejemplo, ventanas Reproductor multimedia - tipo de datos: imagen;

hornear - versión antigua archivo;

BAJO- texto del programa en idioma BÁSICO;

BMP- un documento creado en editor gráfico, Por ejemplo, Pintar- tipo de datos: imagen;

do- texto del programa en idioma Si;

CDR CorelDraw- tipo de datos: imagen;

CPP- texto del programa en idioma do++;

dbf- un archivo de base de datos creado, por ejemplo, en un DBMS FoxPro;

DOC- un documento creado en procesador de textos Microsoft Word - tipo de datos: texto;

DWG, DXF- archivos gráficos creados en autocad;

HTML- un documento destinado a ser publicado en Internet;

LIBRO- biblioteca (normalmente módulos de objetos);

MDB- archivo de base de datos creado en el DBMS Acceso Microsoft;

MP3, MEDIO, WMA, WAV– varios formatos archivos de sonido- tipo de datos: sonido;

O.B.J.- módulo de objeto;

P.A.S.- texto del programa en idioma Pascal;

PDF - PDF-un documento creado y destinado a ser visto en un programa Lector de Adobe;

PPT- archivo de presentación creado en PowerPoint de Microsoft;

PSD- un archivo gráfico creado en GPU Adobe Photoshop;

RAR winrar;

rtf- un documento creado en un editor de texto WordPad;

TIF, GIF, JPG- varios formatos de archivos gráficos;

TMP- archivo temporal;

TXT - archivo de texto, por ejemplo, creado en el programa Computadora portátil;

XLS - libro electrónico, creado en procesador de mesa Excel- tipo de datos: caracteres (texto o números);

CREMALLERA- archivo de almacenamiento creado por el programa de archivado WinZip.

Además del nombre y la extensión del nombre del archivo, el sistema operativo almacena para cada archivo la fecha de su creación (cambio) y varios valores de bandera llamados atributos del archivo. Los atributos son opciones adicionales, definiendo las propiedades del archivo. El sistema operativo le permite controlarlos y cambiarlos. El estado de los atributos se tiene en cuenta al realizar operaciones automáticas con archivos.

Hay cuatro atributos principales:

· Sólo lectura(Solo lectura);

· Oculto(Oculto);

· Sistema(Sistema);

· Archivo(Archivo).

Atributo " Solo lectura" limita la capacidad de trabajar con el archivo. Configurarlo significa que el archivo no debe modificarse.

Atributo " Oculto" indica al sistema operativo que el archivo no está debe aparecer en la pantalla al realizar operaciones con archivos. Esta es una medida de protección contra daños accidentales (intencionales o no) al archivo.

Atributo " Sistema" archivos que tienen funciones importantes para el funcionamiento del propio sistema operativo. Su característica distintiva El problema es que no se puede cambiar mediante el sistema operativo. Como regla general, la mayoría de los archivos que tienen la extensión " Sistema", también tiene el atributo “ Oculto".

Atributo " Archivo" utilizado en el pasado para ejecutar programas de respaldo. Se suponía que cualquier programa que modificara un archivo estableciera automáticamente este atributo, y se suponía que la herramienta de copia de seguridad lo restablecería. Por lo tanto, sólo aquellos archivos para los que se configuró este atributo estuvieron sujetos a la siguiente copia de seguridad. Programas modernos las copias de seguridad utilizan otros medios para determinar si un archivo ha cambiado, y este atributo no se tiene en cuenta y cambiarlo manualmente mediante el sistema operativo no tiene importancia práctica.

El almacenamiento de archivos está organizado en una estructura jerárquica, que en este caso se llama estructura de archivos(Figura 1) .

Arroz. 1. Estructura jerárquica del disco

Estructura de archivos - Estructura jerárquica en la que el sistema operativo muestra archivos y directorios (carpetas).

Sirve como parte superior de la estructura. nombre del transportista, donde se guardan los archivos. A continuación, los archivos se agrupan en directorios (carpetas), dentro del cual se puede crear directorios anidados(Figura 1) .

Nombres medios externos información. Los discos en los que se almacena la información en la computadora tienen sus propios nombres: cada disco lleva el nombre de una letra del alfabeto latino, seguida de dos puntos. Entonces, a los disquetes siempre se les asignan letras. A: Y EN:. Las unidades lógicas del disco duro se nombran comenzando con la letra CON:. Todos los nombres de unidades lógicas van seguidos de los nombres de las unidades de CD. Por ejemplo, instalado: una disquetera, un disco duro dividido en 3 unidades lógicas y una unidad de CD. Identificar las letras de todos los medios de almacenamiento. A:- unidad de disquete; CON:, D:, MI: - unidades lógicas disco duro; F:- Unidad de CD.

Catalogar (carpeta) - espacio en disco (especial archivo del sistema), que almacena información de servicio sobre archivos (nombre, extensión, fecha de creación, tamaño, etc.). Los directorios de niveles inferiores están anidados dentro de directorios de niveles superiores y son para ellos. anidado. Catalogar nivel superior(superdirectorio) en relación con los directorios de nivel inferior, se denomina padre. El nivel superior de anidamiento de la estructura jerárquica es directorio raíz disco (Fig. 1). El directorio con el que el usuario está trabajando actualmente se llama actual.

Las reglas para nombrar un directorio no son diferentes de las reglas para nombrar un archivo, aunque no es habitual especificar extensiones de nombre para los directorios. Al escribir una ruta de acceso a un archivo a través de un sistema de subdirectorios, todos los directorios intermedios están separados por un símbolo específico. Muchos sistemas operativos utilizan "\" (barra invertida) como este carácter.

El requisito de un nombre de archivo único es obvio: sin él es imposible garantizar un acceso inequívoco a los datos. en medios tecnología informática el requisito de unicidad del nombre se garantiza automáticamente: ni el usuario ni la automatización pueden crear un archivo con un nombre idéntico a uno existente.

Cuando se utiliza un archivo que no está en el directorio actual, el programa que accede al archivo debe indicar dónde se encuentra exactamente el archivo. Esto se hace especificando la ruta al archivo.

La ruta a un archivo es el nombre del medio (disco) y una secuencia de nombres de directorio, separados por el carácter "\" en el sistema operativo Windows (el carácter "/" se usa en el sistema operativo de línea UNIX). Esta ruta especifica la ruta al directorio en el que se encuentra el archivo deseado.

Para especificar la ruta al archivo, utilice dos varios metodos. En el primer caso, se proporciona cada archivo. nombre de ruta absoluta ( nombre completo archivo), que consta de los nombres de todos los directorios desde la raíz hasta el que contiene el archivo, y el nombre del archivo en sí. Por ejemplo, el camino C:\Abby\Doc\otchet.doc significa que el directorio raíz del disco CON: contiene un directorio Abby, que a su vez contiene un subdirectorio Doc donde se encuentra el archivo informe.doc. Nombres absolutos Las rutas siempre comienzan con el nombre del medio y el directorio raíz y son únicas. Aplica también nombre de ruta relativa. Se utiliza junto con el concepto. directorio actual. El usuario puede designar uno de los directorios como directorio de trabajo actual. En este caso, todos los nombres de ruta que no comienzan con un carácter delimitador se consideran relativos y se cuentan en relación con el directorio actual. Por ejemplo, si el directorio actual es Taxista, luego al archivo con ruta absoluta Taxista\ se puede contactar como Doc\otchet.doc.

Sistemas de archivos. Cada archivo en el disco tiene su propia dirección. Para comprender el principio de acceso a la información almacenada en un archivo, necesita saber cómo se registran los datos en los medios de almacenamiento.

Todos los sistemas operativos de disco modernos prevén la creación de un sistema de archivos diseñado para almacenar datos en discos y brindar acceso a ellos. El principio de organización de un sistema de archivos es tabular. Superficie disco duro se considera como una matriz tridimensional, cuyas dimensiones son números superficie, cilindro Y sectores.

Antes de su uso, el disco se marca en pistas y sectores ( formateado). Desde el punto de vista del hardware, el marcado es el proceso de registrar información del servicio en un medio que marca el final y el comienzo de cada sector.

Los sectores son bloques en los que se almacenan datos. Numerados a partir del uno. Además de la información del usuario, los sectores contienen información de servicio, por ejemplo, su propio número.

Pista: un círculo concéntrico a lo largo del cual se mueven los cabezales de lectura y escritura cuando se mueven o buscan datos. Las pistas están numeradas desde cero. La pista más externa del disco tiene el número cero.

El tamaño típico del sector es de 512 bytes. Hay 80 pistas en un lado. Cada pista contiene 18 sectores.

Bajo Se entiende por cilindro el conjunto de todas las pistas pertenecientes a diferentes superficies y situadas a igual distancia del eje de rotación.. La estructura física del almacenamiento de datos se muestra en la Figura 2.

Arroz. 2. Estructura física del almacenamiento de información.

Los datos sobre en qué parte del disco se graba un archivo en particular se almacenan en el área del sistema del disco en especial tablas de asignación de archivos(GORDO-tablas). Desde la violación GORDO-la tabla conduce a la imposibilidad de utilizar los datos grabados en el disco; requisitos especiales confiabilidad y existe en dos copias, cuya identidad es monitoreada periódicamente por las herramientas del sistema operativo.

La unidad física más pequeña de almacenamiento de información es un sector. porque el tamaño GORDO- La tabla es limitada, entonces, para discos cuyo tamaño exceda los 32 MB, no es posible proporcionar direccionamiento a cada sector individual. En este sentido, los grupos de sectores se combinan condicionalmente en clusters. Un clúster es la unidad más pequeña de información de direccionamiento. El tamaño del clúster, a diferencia del tamaño del sector, no es fijo y depende de la capacidad del disco.

Como se mencionó anteriormente, la información en los discos se escribe en sectores de una longitud fija, y cada sector y la ubicación de cada registro físico (sector) en el disco se identifica de forma única mediante tres números: números de superficie del disco, cilindro Y sectores en la pista. Y el controlador de disco trabaja con el disco exactamente en estos términos. Y el usuario no quiere utilizar sectores, cilindros y superficies, sino archivos y directorios. Por lo tanto, al realizar operaciones con archivos y directorios en discos, de alguna manera es necesario traducir esto en acciones comprensibles para el controlador: leer y escribir ciertos sectores del disco. Y para ello es necesario establecer las reglas por las cuales se realiza esta traducción, es decir, en primer lugar, determinar cómo se debe almacenar y organizar la información en los discos. El conjunto de estas reglas se llama sistema de archivos.

Sistema de archivos- Es un conjunto de convenciones que definen la organización de los datos en los medios de almacenamiento.. La presencia de estas convenciones permite que el sistema operativo, otros programas y usuarios trabajen con archivos y directorios, y no solo con secciones (sectores) de discos. El sistema de archivos define:

· cómo se almacenan los archivos y directorios en el disco;

· qué información sobre archivos y directorios se almacena;

· ¿Cómo saber qué partes del disco están libres y cuáles no?

· formato de directorios y otra información de servicio en disco.

Para utilizar discos escritos (particionados) utilizando algún sistema de archivos, el sistema operativo o programa especial debe soportar este sistema de archivos.

El sistema de archivos más común en PC IBM-Computadoras compatibles, se introdujo a principios de los años 80 en los sistemas operativos. MS-DOS 1.0 y 2.0. Este sistema de archivos es bastante primitivo, ya que fue creado para almacenar datos en disquetes. Este sistema de archivos generalmente se llama GORDO, ya que la mayoría estructura importante los datos que contiene son una tabla de ubicación de archivos en el disco, en inglés - tabla de asignación de archivos, abreviado - GORDO. Esta tabla contiene información sobre qué áreas (racimos) los discos son libres, y sobre las cadenas de clusters que forman archivos y directorios.

En el sistema de archivos GORDO Los nombres de archivos y directorios no deben tener más de 8 caracteres, más tres caracteres en la extensión del nombre. Conduce a pérdidas significativas (hasta un 20%) de espacio en disco debido a tallas grandes clústeres en discos de alta capacidad. Esto se debe al hecho de que al final del último grupo del archivo queda espacio libre, en promedio igual a la mitad del grupo. Y en discos grandes del tamaño de los clusters. GORDO puede alcanzar los 32 KB . Así, en un disco con capacidad
2 GB con 20.000 archivos perderán 320 MB, es decir, alrededor del 16%. Finalmente, el sistema de archivos. GORDO de bajo rendimiento, especialmente para discos grandes, no apto para tareas múltiples (todas las operaciones requieren acceso a la tabla de asignación de archivos y, por lo tanto, no puede iniciar otra antes de que se complete una operación).

Durante el desarrollo Windows 95 firme microsoft decidió no introducir un nuevo sistema de archivos, sino parchear el sistema de archivos existente GORDO, permitiéndole asignar archivos y directorios largo nombres. Este sistema de archivos se conoció como grasa 32. Aceptado en Windows 95 Lo bueno de este enfoque es que permite utilizar discos antiguos con un sistema de archivos. GORDO- Los nombres largos simplemente comienzan a escribirse en ellos. Pero aún así, esta solución es muy artificial y muchos programas sirven para reparar el sistema de archivos del disco, “comprimir” discos, hacer copias de seguridad, etc. - puede provocar la pérdida de nombres largos en el disco. grasa 32 Admite tamaños de clúster más pequeños, lo que permite un uso más eficiente del espacio en disco.

Al desarrollar un sistema operativo Windows NT se creó un nuevo sistema de archivos - NTFS. Estaba dirigido a discos grandes que contenían muchos archivos y se tomaron medidas importantes para garantizar un almacenamiento de datos eficiente y un control de acceso. Este sistema de archivos admite nombres de archivos largos. En unidades lógicas con una capacidad de 1 a 2 GB, el sistema de archivos NTFS le permite almacenar en promedio entre un 10 y un 15% más de información que GORDO. Y acceder a los archivos que contiene es notablemente más rápido, especialmente en un entorno multitarea.

Al formar un sistema de archivos. NTFS El programa de formateo crea el archivo. Tabla de archivos maestros(DM) y otras áreas para almacenar metadatos. Se utilizan metadatos NTFS para implementar la estructura del archivo. Las primeras 16 entradas en DM reservado por ella misma NTFS. La ubicación de los archivos de metadatos se registra en el sector de arranque del disco. Si la primera entrada en DM dañado, NTFS lee el segundo registro para encontrar una copia del primero. copia completa El sector de arranque se encuentra al final del volumen. EN DM se almacenan metadatos, como una copia de los primeros cuatro registros (garantiza el acceso a DM en caso de que el primer sector esté dañado). DM contiene información sobre el volumen: etiqueta y número de versión. EN DM hay una tabla de nombres y descripciones de atributos, el directorio raíz, etc. Las líneas restantes DM contiene entradas para cada archivo y directorio ubicado en este volumen. Desarrolladores NTFS Sin olvidarse de la eficiencia, también intentaron garantizar la confiabilidad del sistema de archivos y la recuperabilidad de los datos en caso de fallas. Para esto, en particular, NTFS duplica todo críticamente información importante y garantiza que todos los cambios en los discos se registren en un archivo de registro especial, y para cada cambio también se recuerda el método para cancelarlo. Como resultado, en casi cualquier falla NTFS restaurado automáticamente. NTFS también (a diferencia de GORDO) puede funcionar con unidades lógicas y archivos de más de 2 GB; el tamaño máximo de unidades lógicas y archivos es 4x10 18 bytes.

Características comparativas sistemas de archivos se presentan en la tabla. 1. Si el sistema de archivos del disco no es compatible con un sistema operativo determinado, toda la información de este disco será inaccesible (cuando se trabaja en este sistema operativo, por supuesto). Para dichas unidades lógicas, es posible que no haya ninguna letra asignada (es decir, no se puede acceder a la unidad) o cualquier acceso a la unidad generará un mensaje de error.

Se ha desarrollado un sistema de archivos especial para CD ( CD-ROM). Esto resultó ser necesario, ya que la estructura física de los CD en sí no es la misma que la de los discos duros o disquetes: en ellos la información no se graba en pistas circulares, sino en una única pista en forma de espiral (como los CD de audio). Este sistema de archivos se llama CDFS.

Tabla 1

Características comparativas de los sistemas de archivos.

NTFS grasa 32 GORDO
Sistemas operativos compatibles Windows NT con Service Pack 4, Windows 2000, Windows XP MS-DOS, Windows 95 OSR2, Windows 98, Windows Millennium Edition, Windows NT, Windows 2000, Windows XP
Posibles tamaños de unidad lógica Recomendado tamaño mínimo El disco lógico (volumen) es de aproximadamente 10 MB. Se permiten tamaños de volumen superiores a 2 TB. No se puede utilizar para disquetes. Disco lógico (volumen) con una capacidad de 512 MB a 2 TB. Se puede utilizar para disquetes.
Disco lógico (volumen) hasta 4 GB. Se puede utilizar para disquetes. Posibles tamaños de archivos almacenados. El tamaño máximo de archivo está limitado únicamente por el tamaño del volumen. El tamaño máximo de archivo es 4 GB

El tamaño máximo de archivo es 2 GB

      General. En teoría de la informática, se definen los siguientes tres tipos principales de estructuras de datos: lineal, tabular y jerárquica. Libro de ejemplo: secuencia de hojas - estructura lineal. Partes, secciones, capítulos, párrafos - jerarquía. Tabla de contenidos – tabla – conecta – jerárquico con lineal. Los datos estructurados tienen un nuevo atributo: Dirección. Entonces: Estructuras lineales (listas, vectores). Listas regulares. La dirección de cada elemento está determinada únicamente por su número. Si todos los elementos de la lista tienen– vector de datos.

      Estructuras tabulares (tablas, matrices). La diferencia entre una tabla y una lista (cada elemento) está determinada por una dirección, que consta no de uno, sino de varios parámetros. El ejemplo más común es una matriz - dirección - dos parámetros - número de fila y número de columna. Tablas multidimensionales.

      Estructuras jerárquicas. Se utiliza para presentar datos irregulares. La dirección está determinada por la ruta, desde la cima del árbol. Sistema de archivos - computadora. (La ruta puede exceder – la cantidad de datos, dicotomía – siempre hay dos ramas – izquierda y derecha).

Ordenar estructuras de datos. El método principal es la clasificación. ! Al agregar un nuevo elemento a una estructura ordenada, es posible cambiar la dirección de los existentes. Para estructuras jerárquicas (indexación), cada elemento tiene un número único, que luego se utiliza para ordenar y buscar.

    Elementos básicos de un sistema de archivos.

El primer paso histórico en el almacenamiento y gestión de datos fue el uso de sistemas de gestión de archivos.

Un archivo es un área con nombre de la memoria externa en la que se puede escribir y leer. Tres parámetros:

    secuencia de un número arbitrario de bytes,

    un nombre propio único (en realidad una dirección).

    datos del mismo tipo: tipo de archivo.

Las reglas para nombrar archivos, cómo se accede a los datos almacenados en un archivo y la estructura de esos datos dependen del sistema de administración de archivos en particular y posiblemente del tipo de archivo.

Primero, en comprensión moderna IBM desarrolló un sistema de archivos avanzado para su serie 360 ​​(1965-1966). Pero en los sistemas actuales prácticamente no se utiliza. Estructuras de datos de lista utilizadas (volumen EC, sección, archivo).

La mayoría de ustedes está familiarizado con los sistemas de archivos de los sistemas operativos modernos. Se trata principalmente de MS DOS, Windows y algunos con la construcción de un sistema de archivos para varias opciones UNIX.

Estructura de archivos. Un archivo representa una colección de bloques de datos ubicados en medios externos. Para intercambiar con un disco magnético a nivel de hardware, debe especificar el número de cilindro, el número de superficie, el número de bloque en la pista correspondiente y el número de bytes que deben escribirse o leerse desde el principio de este bloque. Por lo tanto, todos los sistemas de archivos asignan explícita o implícitamente algún nivel básico que garantiza el trabajo con archivos que representan un conjunto de bloques directamente direccionables en el espacio de direcciones.

Nombrar archivos. Todos los sistemas de archivos modernos admiten la denominación de archivos de varios niveles manteniéndolos en la memoria externa. archivos adicionales con una estructura especial: directorios. Cada directorio contiene los nombres de los directorios y/o archivos contenidos en ese directorio. Por lo tanto, un nombre de archivo completo consta de una lista de nombres de directorio más el nombre del archivo en el directorio que contiene inmediatamente el archivo. La diferencia entre la forma en que se nombran los archivos en diferentes sistemas de archivos es donde comienza la cadena de nombres. (Unix, DOS-Windows)

Protección de archivos. Los sistemas de gestión de archivos deben proporcionar autorización para el acceso a los archivos. En general, el enfoque es que en relación a cada usuario registrado de un determinado sistema informático, para cada archivo existente se indican las acciones que están permitidas o prohibidas para este usuario. Ha habido intentos de implementar este enfoque en su totalidad. Pero esto provocó demasiados gastos generales tanto en el almacenamiento de información redundante como en el uso de esta información para controlar la elegibilidad de acceso. Por lo tanto, en la mayoría sistemas modernos La gestión de archivos utiliza un enfoque para la protección de archivos implementado por primera vez en UNIX (1974). En este sistema, a cada usuario registrado se le asocia un par de identificadores enteros: el identificador del grupo al que pertenece dicho usuario, y su propio identificador en el grupo. En consecuencia, para cada archivo, se almacena el identificador completo del usuario que creó este archivo y se anota qué acciones él mismo puede realizar con el archivo, qué acciones con el archivo están disponibles para otros usuarios del mismo grupo y qué Los usuarios de otros grupos pueden hacer con el archivo. Esta información es muy compacta al verificarla, no es necesario. gran número acciones, y este método de control de acceso es satisfactorio en la mayoría de los casos.

Modo de acceso multiusuario. Si el sistema operativo admite el modo multiusuario, es muy posible que dos o más usuarios intenten trabajar simultáneamente con el mismo archivo. Si todos estos usuarios sólo van a leer el archivo, no pasará nada malo. Pero si al menos uno de ellos cambia el archivo, se requiere sincronización mutua para que este grupo funcione correctamente. Históricamente, los sistemas de archivos han adoptado el siguiente enfoque. En la operación de apertura de un archivo (la primera y obligatoria operación con la que debe iniciarse una sesión de trabajo con un archivo), entre otros parámetros, se indicaba el modo de funcionamiento (lectura o cambio). + existen procedimientos especiales para sincronizar las acciones del usuario. ¡No permitido por los registros!

    Registro en diario en sistemas de archivos. Principios generales.

Ejecutar una verificación del sistema (fsck) en sistemas de archivos grandes puede llevar mucho tiempo, lo cual es desafortunado dados los sistemas de alta velocidad actuales. La razón por la cual no hay integridad en el sistema de archivos puede ser un desmontaje incorrecto, por ejemplo, se estaba escribiendo en el disco en el momento de la terminación. Las aplicaciones podrían actualizar los datos contenidos en los archivos y el sistema podría actualizar los metadatos del sistema de archivos, que son "datos sobre los datos del sistema de archivos", en otras palabras, información sobre qué bloques están asociados con qué archivos, qué archivos están ubicados en qué directorios, y similares. Los errores (falta de integridad) en los archivos de datos son malos, pero mucho peores son los errores en los metadatos del sistema de archivos, que pueden provocar la pérdida de archivos y otros problemas graves.

Para minimizar los problemas de integridad y minimizar el tiempo de reinicio del sistema, un sistema de archivos registrado mantiene una lista de los cambios que realizará en el sistema de archivos antes de escribir los cambios. Estos registros se almacenan en una parte separada del sistema de archivos llamada "diario" o "registro". Una vez que estas entradas de diario (registro) se escriben de forma segura, el sistema de archivos de registro realiza estos cambios en el sistema de archivos y luego elimina estas entradas del "registro" (registro). Las entradas de registro se organizan en conjuntos de cambios relacionados en el sistema de archivos, de forma muy similar a la forma en que los cambios agregados a una base de datos se organizan en transacciones.

Un sistema de archivos registrado aumenta la probabilidad de integridad porque las entradas del archivo de registro se realizan antes de que se realicen cambios en el sistema de archivos y porque el sistema de archivos conserva esas entradas hasta que se aplican de forma completa y segura al sistema de archivos. Al reiniciar una computadora que utiliza un sistema de archivos registrado por diario, el programa de montaje puede garantizar la integridad del sistema de archivos simplemente verificando el archivo de registro en busca de cambios esperados pero no realizados y escribiéndolos en el sistema de archivos. En la mayoría de los casos, el sistema no necesita verificar la integridad del sistema de archivos, lo que significa que una computadora que utilice un sistema de archivos registrado estará disponible para su uso casi inmediatamente después de reiniciar. En consecuencia, las posibilidades de pérdida de datos debido a problemas en el sistema de archivos se reducen significativamente.

La forma clásica de un sistema de archivos con diario es almacenar los cambios en los metadatos del sistema de archivos en un diario (registro) y almacenar los cambios en todos los datos del sistema de archivos, incluidos los cambios en los archivos mismos.

    Archivo sistema MS-DOS(GORDO)

El sistema de archivos MS-DOS es un sistema de archivos basado en árbol para discos pequeños y estructuras simples directorios, en la raíz de los cuales está el directorio raíz, y las hojas son archivos y otros directorios, posiblemente vacíos. Los archivos administrados por este sistema de archivos se asignan en clústeres, cuyo tamaño puede oscilar entre 4 KB y 64 KB en múltiplos de 4, sin utilizar la propiedad de adyacencia en un método de asignación mixta. memoria de disco. Por ejemplo, la figura muestra tres archivos. File1.txt es bastante grande: involucra tres próximo amigo detrás de otra cuadra. El archivo pequeño File3.txt utiliza el espacio de un solo bloque asignado. El tercer archivo es File2.txt. Es un archivo fragmentado de gran tamaño. En cada caso, el punto de entrada apunta al primer bloque asignable propiedad del archivo. Si un archivo utiliza varios bloques asignados, el bloque anterior apunta al siguiente de la cadena. El valor FFF se identifica con el final de la secuencia.

partición de disco FAT

Para acceder a los archivos de manera eficiente, use tabla de asignación de archivos– Tabla de asignación de archivos, que se encuentra al principio de la partición (o unidad lógica). Del nombre de la tabla de asignación proviene el nombre de este sistema de archivos, FAT. Para proteger la partición, se almacenan dos copias de FAT en caso de que una de ellas se dañe. Además, las tablas de asignación de archivos deben ubicarse en direcciones estrictamente fijas para que los archivos necesarios para iniciar el sistema se ubiquen correctamente.

La tabla de asignación de archivos consta de elementos de 16 bits y contiene la siguiente información sobre cada clúster de discos lógicos:

    el grupo no se utiliza;

    el archivo utiliza el clúster;

    grupo malo;

    último grupo de archivos;.

Dado que a cada clúster se le debe asignar un número único de 16 bits, FAT admite un máximo de 216, o 65,536 clústeres en un disco lógico (y también reserva algunos de los clústeres para sus propias necesidades). Por lo tanto, obtenemos el tamaño máximo de disco servido por MS-DOS de 4 GB. El tamaño del clúster se puede aumentar o disminuir según el tamaño del disco. Sin embargo, cuando el tamaño del disco excede un cierto valor, los clústeres se vuelven demasiado grandes, lo que provoca la desfragmentación del disco interno. Además de información sobre archivos, la tabla de asignación de archivos también puede contener información sobre directorios. Esto trata los directorios como archivos especiales con entradas de 32 bytes para cada archivo contenido en ese directorio. El directorio raíz tiene un tamaño fijo: 512 entradas para un disco duro y, para los disquetes, este tamaño está determinado por el tamaño del disquete. Además, el directorio raíz se encuentra inmediatamente después de la segunda copia del FAT porque contiene los archivos que necesita el cargador de arranque de MS-DOS.

Al buscar un archivo en un disco, MS-DOS se ve obligado a buscar en la estructura del directorio para encontrarlo. Por ejemplo, para ejecutar el archivo ejecutable C:\Program\NC4\nc.exe busca el archivo ejecutable haciendo lo siguiente:

    lee el directorio raíz de la unidad C: y busca el directorio del programa en él;

    lee el programa del cluster inicial y busca en este directorio una entrada sobre el subdirectorio NC4;

    lee el grupo inicial del subdirectorio NC4 y busca una entrada para el archivo nc.exe en él;

    Lee todos los grupos del archivo nc.exe.

Este método de búsqueda no es el más rápido entre los sistemas de archivos actuales. Además, cuanto mayor sea la profundidad de los directorios, más lenta será la búsqueda. Para acelerar la operación de búsqueda, debe mantener una estructura de archivos equilibrada.

Ventajas de la GRASA

    Es la mejor opción para unidades lógicas. tamaño pequeño, porque comienza con gastos generales mínimos. En discos cuyo tamaño no supere los 500 MB, funciona con un rendimiento aceptable.

Desventajas de la GRASA

    Dado que el tamaño de entrada del archivo está limitado a 32 bytes y la información debe incluir el tamaño del archivo, la fecha, los atributos, etc., el tamaño del nombre del archivo también está limitado y no puede exceder los 8+3 caracteres para cada archivo. El uso de los llamados nombres de archivos cortos hace que FAT sea menos atractivo que otros sistemas de archivos.

    Usar FAT en discos de más de 500 MB es irracional debido a la desfragmentación del disco.

    El sistema de archivos FAT no tiene ninguna característica de seguridad y admite capacidades mínimas de seguridad de la información.

    La velocidad de las operaciones en FAT es inversamente proporcional a la profundidad del anidamiento de directorios y al espacio en disco.

    Sistema de archivos UNIX - sistemas (ext3)

El moderno, potente y gratuito sistema operativo Linux proporciona una amplia área para el desarrollo de sistemas modernos y software personalizado. Algunos de los desarrollos más interesantes en los kernels de Linux recientes son las nuevas tecnologías de alto rendimiento para administrar el almacenamiento, la ubicación y la actualización de datos en el disco. Uno de los mecanismos más interesantes es el sistema de archivos ext3, que está integrado en el kernel de Linux desde la versión 2.4.16, y que ya está disponible por defecto en Distribuciones de Linux de empresas sombrero rojo y SuSE.

El sistema de archivos ext3 es un sistema de archivos de diario que es 100% compatible con todas las utilidades diseñadas para crear, administrar y sintonia FINA Sistema de archivos ext2, que se utiliza en varios sistemas Linux. últimos años. Antes de describir en detalle las diferencias entre los sistemas de archivos ext2 y ext3, aclaremos la terminología de los sistemas de archivos y el almacenamiento de archivos.

A nivel del sistema, todos los datos de una computadora existen como bloques de datos en algún dispositivo de almacenamiento, organizados mediante estructuras de datos especiales en particiones (conjuntos lógicos en un dispositivo de almacenamiento), que a su vez se organizan en archivos, directorios y no utilizados (gratuitos). espacio.

Los sistemas de archivos se crean en particiones de disco para simplificar el almacenamiento y la organización de datos en forma de archivos y directorios. Linux, al igual que el sistema Unix, utiliza un sistema de archivos jerárquico formado por archivos y directorios, que contienen respectivamente archivos o directorios. Los archivos y directorios en un sistema de archivos de Linux se ponen a disposición del usuario montándolos (el comando "montar"), que suele ser parte del proceso de arranque del sistema. La lista de sistemas de archivos disponibles para su uso se almacena en el archivo /etc/fstab (FileSystem TABle). La lista de sistemas de archivos que el sistema no monta actualmente se almacena en el archivo /etc/mtab (Mount TABle).

Cuando se monta un sistema de archivos durante el arranque, se borra un bit en el encabezado (el "bit limpio"), lo que indica que el sistema de archivos está en uso y que las estructuras de datos utilizadas para controlar la ubicación y organización de archivos y directorios dentro de ese sistema de archivos sujeto a cambios.

Un sistema de archivos se considera completo si todos los bloques de datos que contiene están en uso o libres; cada bloque de datos asignado está ocupado por un solo archivo o directorio; Se puede acceder a todos los archivos y directorios después de procesar una serie de otros directorios en el sistema de archivos. Cuando un sistema Linux se apaga deliberadamente mediante comandos del operador, todos los sistemas de archivos se desmontan. Desmontar un sistema de archivos durante el apagado establece un "bit de limpieza" en el encabezado del sistema de archivos, lo que indica que el sistema de archivos se desmontó correctamente y, por lo tanto, puede considerarse intacto.

Años de depuración y reelaboración del sistema de archivos y el uso de algoritmos mejorados para escribir datos en el disco han reducido en gran medida la corrupción de datos causada por las aplicaciones o el propio kernel de Linux, pero han eliminado la corrupción y la pérdida de datos debido a cortes de energía y otros problemas sistémicos sigue siendo una tarea desafiante. En caso de falla o simple apagado de un sistema Linux sin utilizar los procedimientos de apagado estándar, el "bit de limpieza" no se establece en el encabezado del sistema de archivos. La próxima vez que se inicia el sistema, el proceso de montaje detecta que el sistema no está marcado como "limpio" y verifica físicamente su integridad utilizando la utilidad de verificación del sistema de archivos Linux/Unix "fsck" (File System CheckK).

Hay varios sistemas de archivos de diario disponibles para Linux. Los más famosos son: XFS, un sistema de archivos de diario desarrollado por Silicon Graphics pero ahora lanzado. fuente abierta(código abierto); RaiserFS, un sistema de archivos de diario diseñado específicamente para Linux; JFS, un sistema de archivos de diario desarrollado originalmente por IBM pero ahora lanzado como código abierto; ext3 es un sistema de archivos desarrollado por el Dr. Stephan Tweedie en Red Hat y varios otros sistemas.

El sistema de archivos ext3 es una versión de Linux con registro diario del sistema de archivos ext2. El sistema de archivos ext3 tiene una ventaja significativa sobre otros sistemas de archivos de diario: es totalmente compatible con el sistema de archivos ext2. Esto hace posible utilizar todas las aplicaciones existentes diseñadas para manipular y personalizar el sistema de archivos ext2.

El sistema de archivos ext3 es compatible con los kernels de Linux versión 2.4.16 y posteriores, y debe habilitarse mediante el cuadro de diálogo Configuración de sistemas de archivos al compilar el kernel. Distribuciones de Linux como Red Hat 7.2 y SuSE 7.3 ya incluyen soporte nativo para el sistema de archivos ext3. Sólo puedes usar un sistema de archivos ext3 si el soporte ext3 está integrado en tu kernel y tienes últimas versiones Utilidades "mount" y "e2fsprogs".

En la mayoría de los casos, convertir sistemas de archivos de un formato a otro implica hacer una copia de seguridad de todos los datos contenidos, reformatear las particiones o volúmenes lógicos que contienen el sistema de archivos y luego restaurar todos los datos en ese sistema de archivos. Debido a la compatibilidad de los sistemas de archivos ext2 y ext3, no es necesario realizar todos estos pasos y la traducción se puede realizar mediante un único comando (ejecutar con privilegios de root):

# /sbin/tune2fs -j<имя-раздела >

Por ejemplo, convertir un sistema de archivos ext2 ubicado en la partición /dev/hda5 a un sistema de archivos ext3 se puede realizar usando el siguiente comando:

# /sbin/tune2fs -j /dev/hda5

La opción "-j" del comando "tune2fs" crea un diario ext3 en un sistema de archivos ext2 existente. Después de convertir el sistema de archivos ext2 a ext3, también debe realizar cambios en las entradas del archivo /etc/fstab para indicar que la partición ahora es un sistema de archivos "ext3". También puede utilizar la detección automática del tipo de partición (la opción "automática"), pero aún así se recomienda especificar explícitamente el tipo de sistema de archivos. El siguiente ejemplo de archivo /etc/fstab muestra los cambios antes y después de una transferencia del sistema de archivos para la partición /dev/hda5:

/dev/ hda5 /opt ext2 valores predeterminados 1 2

/dev/ hda5 /opt ext3 valores predeterminados 1 0

El último campo en /etc/fstab especifica el paso del proceso de arranque durante el cual se debe verificar la integridad del sistema de archivos usando la utilidad "fsck". Cuando utilice el sistema de archivos ext3, puede establecer este valor en "0" como se muestra en el ejemplo anterior. Esto significa que el programa "fsck" nunca verificará la integridad del sistema de archivos, debido a que la integridad del sistema de archivos está garantizada al revertir el diario.

La conversión del sistema de archivos raíz a ext3 requiere un enfoque especial y se realiza mejor en modo de usuario único después de crear un disco RAM que admita el sistema de archivos ext3.

Además de ser compatible con las utilidades del sistema de archivos ext2 y traducción sencilla sistema de archivos de ext2 a ext3, el sistema de archivos ext3 también ofrece varios tipos diferentes de registro en diario.

El sistema de archivos ext3 admite tres modos de registro en diario diferentes que se pueden activar desde el archivo /etc/fstab. Estos modos de registro son los siguientes:

    Diario/diario: registra todos los cambios en los datos y metadatos del sistema de archivos. El más lento de los tres modos de registro. Este modo minimiza la posibilidad de perder los cambios de archivos que realice en el sistema de archivos.

    Secuencial/ordenado: escribe cambios en los metadatos del sistema de archivos únicamente, pero escribe actualizaciones de datos de archivos en el disco antes de realizar cambios en los metadatos del sistema de archivos asociados. Este modo de registro ext3 está instalado de forma predeterminada.

    Escritura diferida: solo se escriben los cambios en los metadatos del sistema de archivos, según proceso estándar registrar cambios en estos archivos. Esto es lo mas método rápido explotación florestal.

Las diferencias entre estos modos de registro son sutiles y profundas. El uso del modo diario requiere que el sistema de archivos ext3 escriba cada cambio en el sistema de archivos dos veces: primero en el diario y luego en el propio sistema de archivos. Esto puede reducir el rendimiento general de su sistema de archivos, pero los usuarios prefieren este modo porque minimiza la posibilidad de perder cambios de datos en sus archivos, ya que tanto los cambios de metadatos como los cambios de datos de archivos se escriben en el diario ext3 y pueden ser se repite cuando se reinicia el sistema.

Al utilizar el modo "secuencial", solo se registran los cambios en los metadatos del sistema de archivos, lo que reduce la redundancia entre la escritura en el sistema de archivos y en el diario, razón por la cual este método es más rápido. Aunque los cambios en los datos del archivo no se escriben en el diario, deben realizarse antes de que el demonio de registro en diario ext3 realice cambios en los metadatos del sistema de archivos asociados, lo que puede reducir ligeramente el rendimiento de su sistema. El uso de este método de registro en diario garantiza que los archivos del sistema de archivos nunca dejen de sincronizarse con los metadatos del sistema de archivos asociados.

El método de reescritura es más rápido que los otros dos métodos de registro en diario porque solo almacena cambios en los metadatos del sistema de archivos y no espera a que los datos asociados al archivo cambien al escribir (antes de actualizar aspectos como el tamaño del archivo y la información del directorio). Dado que los datos de los archivos se actualizan de forma asincrónica con respecto a los cambios registrados en los metadatos del sistema de archivos, los archivos en el sistema de archivos pueden mostrar errores en los metadatos, por ejemplo, un error al indicar el propietario de los bloques de datos (cuya actualización no se completó en la hora en que se reinició el sistema). Esto no es fatal, pero puede interferir con la experiencia del usuario.

La especificación del modo de registro en diario utilizado en un sistema de archivos ext3 se realiza en el archivo /etc/fstab para ese sistema de archivos. El modo "Secuencial" es el predeterminado, pero puede especificar diferentes modos de registro cambiando las opciones de la partición deseada en el archivo /etc/fstab. Por ejemplo, una entrada en /etc/fstab que indique el uso del modo de registro de reescritura tendría este aspecto:

/dev/hda5 /opt ext3 datos=escritura 1 0

    Sistema de archivos familia de ventanas Nuevo Testamento (NTFS)

      Estructura física de NTFS

Comencemos con hechos generales. Una partición NTFS, en teoría, puede tener casi cualquier tamaño. Por supuesto, hay un límite, pero ni siquiera lo indicaré, ya que será suficiente para los próximos cien años de desarrollo de la tecnología informática, a cualquier ritmo de crecimiento. ¿Cómo funciona esto en la práctica? Casi lo mismo. El tamaño máximo de una partición NTFS actualmente está limitado únicamente dimensiones de duro discos. NT4, sin embargo, experimentará problemas al intentar instalar en una partición si alguna parte tiene más de 8 GB desde el comienzo físico del disco, pero este problema solo afecta a la partición de arranque.

Digresión lírica. El método de instalación de NT4.0 en un disco vacío es bastante original y puede llevar a ideas equivocadas sobre las capacidades de NTFS. Si le dice al instalador que desea formatear la unidad a NTFS, el tamaño máximo que le ofrecerá es de sólo 4 GB. ¿Por qué tan pequeña si el tamaño de una partición NTFS es prácticamente ilimitado? El hecho es que la sección de instalación simplemente no conoce este sistema de archivos :) El programa de instalación formatea este disco en un FAT normal, cuyo tamaño máximo en NT es de 4 GB (usando un clúster enorme de 64 KB no del todo estándar), y NT se instala en este FAT. Pero ya durante el primer arranque del sistema operativo (aún en la fase de instalación), la partición se convierte rápidamente a NTFS; por lo que el usuario no nota nada excepto la extraña “limitación” en el tamaño de NTFS durante la instalación. :)

      Estructura de sección - vista general

Como cualquier otro sistema, NTFS divide todo el espacio útil en grupos: bloques de datos utilizados a la vez. NTFS admite casi cualquier tamaño de clúster, desde 512 bytes hasta 64 KB, mientras que un clúster de 4 KB se considera un estándar determinado. NTFS no tiene anomalías en la estructura del clúster, por lo que no hay mucho que decir sobre este tema, en general, bastante banal.

Un disco NTFS se divide convencionalmente en dos partes. El primer 12% del disco se asigna a la llamada zona MFT, el espacio en el que crece el metarchivo MFT (más sobre esto a continuación). No es posible escribir ningún dato en esta área. La zona MFT siempre se mantiene vacía; esto se hace para que el archivo de servicio (MFT) más importante no se fragmente a medida que crece. El 88% restante del disco es espacio de almacenamiento de archivos normal.

El espacio libre en disco, sin embargo, incluye todo el espacio físicamente libre; allí también se incluyen las partes no ocupadas de la zona MFT. El mecanismo para utilizar la zona MFT es el siguiente: cuando los archivos ya no se pueden escribir en el espacio normal, la zona MFT simplemente se reduce (en versiones actuales sistemas operativos exactamente dos veces), liberando así espacio para escribir archivos. Cuando se libera espacio en el área MFT normal, el área puede expandirse nuevamente. Al mismo tiempo, es posible que en esta zona queden archivos normales: aquí no hay ninguna anomalía. Bueno, el sistema intentó mantenerla libre, pero nada funcionó. La vida continúa... El metarchivo MFT aún puede fragmentarse, aunque esto no sería deseable.

      MFT y su estructura.

El sistema de archivos NTFS es un logro sobresaliente en materia de estructuración: cada elemento del sistema es un archivo, incluso la información de servicio. El archivo más importante en NTFS se llama MFT o Master File Table, una tabla general de archivos. Está ubicado en la zona MFT y es un directorio centralizado de todos los demás archivos del disco y, paradójicamente, de sí mismo. MFT se divide en registros tamaño fijo(normalmente 1 KB), y cada entrada corresponde a un archivo (en el sentido general de la palabra). Los primeros 16 archivos son de naturaleza de servicio y son inaccesibles para el sistema operativo; se denominan metarchivos, siendo el primer metarchivo el propio MFT. Estos primeros 16 elementos MFT son la única parte del disco que tiene una posición fija. Curiosamente, la segunda copia de los primeros tres registros, por razones de confiabilidad (son muy importantes), se almacena exactamente en el medio del disco. El resto del archivo MFT se puede ubicar, como cualquier otro archivo, en lugares arbitrarios del disco; puede restaurar su posición usando el archivo mismo, "enganchando" sobre la base: el primer elemento MFT.

        Metarchivos

Los primeros 16 archivos NTFS (metarchivos) son de naturaleza de servicio. Cada uno de ellos es responsable de algún aspecto del funcionamiento del sistema. La ventaja de este enfoque modular es su asombrosa flexibilidad: por ejemplo, en FAT, el daño físico en el área FAT es fatal para el funcionamiento de todo el disco, y NTFS puede desplazar, incluso fragmentar, todo su servicio en todo el disco. áreas, evitando cualquier falla superficial, excepto los primeros 16 elementos MFT.

Los metarchivos se encuentran en el directorio raíz de un disco NTFS; comienzan con el símbolo del nombre "$", aunque es difícil obtener información sobre ellos utilizando medios estándar. Es curioso que estos archivos también tengan indicado un tamaño muy real: puedes saber, por ejemplo, cuánto gasta el sistema operativo en catalogar todo tu disco mirando el tamaño del archivo $MFT. La siguiente tabla muestra los metarchivos utilizados actualmente y su propósito.

una copia de los primeros 16 registros MFT colocados en el medio del disco

archivo de soporte de registro (ver más abajo)

información de servicio: etiqueta de volumen, versión del sistema de archivos, etc.

lista de atributos de archivo estándar en el volumen

directorio raíz

mapa de espacio libre de volumen

sector de arranque (si la partición es de arranque)

un archivo que registra los derechos del usuario para usar el espacio en disco (comenzó a funcionar solo en NT5)

archivo: una tabla de correspondencia entre letras mayúsculas y minúsculas en los nombres de archivos del volumen actual. Es necesario principalmente porque en NTFS los nombres de archivos están escritos en Unicode, lo que equivale a 65 mil caracteres diferentes, cuya búsqueda de equivalentes grandes y pequeños no es trivial.

        Archivos y transmisiones

Entonces, el sistema tiene archivos, y nada más que archivos. ¿Qué incluye este concepto en NTFS?

    En primer lugar, un elemento obligatorio es la grabación en MFT porque, como se mencionó anteriormente, todos los archivos del disco se mencionan en MFT. Toda la información sobre el archivo se almacena en este lugar, a excepción de los datos en sí. Nombre del archivo, tamaño, ubicación en el disco de fragmentos individuales, etc. Si un registro MFT no es suficiente para obtener información, se utilizan varios, y no necesariamente seguidos.

    Elemento opcional: flujos de datos de archivos. La definición de "opcional" puede parecer extraña, pero, sin embargo, aquí no hay nada extraño. En primer lugar, es posible que el archivo no contenga datos; en este caso, no consume el espacio libre del disco. En segundo lugar, es posible que el archivo no sea muy grande.

La situación con los datos del archivo es bastante interesante. Cada archivo en NTFS, en general, tiene una estructura algo abstracta: no tiene datos como tales, pero sí flujos. Una de las corrientes tiene el significado que conocemos: datos de archivos. ¡Pero la mayoría de los atributos de los archivos también son transmisiones! Por lo tanto, resulta que el archivo tiene solo una entidad básica: el número en MFT, y todo lo demás es opcional. Esta abstracción se puede utilizar para crear cosas bastante convenientes; por ejemplo, puede "adjuntar" otra secuencia a un archivo escribiendo cualquier dato en él; por ejemplo, información sobre el autor y el contenido del archivo, como se hace en Windows 2000. (la pestaña más a la derecha en las propiedades del archivo, vista desde el Explorador). Curiosamente, estos flujos adicionales no son visibles por medios estándar: el tamaño del archivo observado es sólo el tamaño del flujo principal que contiene los datos tradicionales. Puede, por ejemplo, tener un archivo de longitud cero que, cuando se borre, liberará 1 GB de espacio libre, simplemente porque algún programa o tecnología astuto ha insertado en él un flujo adicional del tamaño de un gigabyte (datos alternativos). Pero, de hecho, por el momento prácticamente no se utilizan hilos, por lo que no hay que tener miedo de este tipo de situaciones, aunque hipotéticamente son posibles. Sólo tenga en cuenta que un archivo en NTFS es más profundo y concepto global de lo que puedes imaginar simplemente navegando por los directorios del disco. Y finalmente: el nombre del archivo puede contener cualquier carácter, incluido un conjunto completo de alfabetos nacionales, ya que los datos se presentan en Unicode, una representación de 16 bits que da 65535. diferentes personajes. La longitud máxima del nombre de archivo es de 255 caracteres.

      Catálogos

Un directorio NTFS es un archivo específico que almacena enlaces a otros archivos y directorios, creando una estructura jerárquica de datos en el disco. El archivo del catálogo se divide en bloques, cada uno de los cuales contiene el nombre del archivo, los atributos básicos y un enlace al elemento MFT, que ya proporciona información completa sobre el elemento del catálogo. La estructura del directorio interno es un árbol binario. Esto es lo que esto significa: para encontrar un archivo con un nombre determinado en un directorio lineal, como un FAT, el sistema operativo tiene que buscar en todos los elementos del directorio hasta encontrar el correcto. Un árbol binario organiza los nombres de los archivos de tal manera que la búsqueda de un archivo se realiza de forma más rápida, obteniendo respuestas de dos dígitos a las preguntas sobre la ubicación del archivo. La pregunta que puede responder un árbol binario es: ¿en qué grupo, en relación con un elemento dado, está el nombre que busca: arriba o abajo? Comenzamos con dicha pregunta hasta el elemento del medio y cada respuesta reduce el área de búsqueda en un promedio de dos veces. Los archivos, por ejemplo, se ordenan simplemente alfabéticamente y la pregunta se responde de la manera más obvia: comparando las letras iniciales. El área de búsqueda, reducida a la mitad, comienza a explorarse de manera similar, comenzando nuevamente desde el elemento central.

Conclusión: para buscar un archivo entre 1000, por ejemplo, FAT tendrá que hacer un promedio de 500 comparaciones (lo más probable es que el archivo se encuentre en medio de la búsqueda), y un sistema basado en árbol solo Tienes que hacer alrededor de 10 (2 ^ 10 = 1024). El ahorro de tiempo de búsqueda es obvio. Sin embargo, no debe pensar que en los sistemas tradicionales (FAT) todo está tan descuidado: en primer lugar, mantener una lista de archivos en forma de árbol binario requiere bastante mano de obra y, en segundo lugar, incluso FAT realizado por un sistema moderno (Windows2000 o Windows98) utiliza una búsqueda de optimización similar. Este es sólo otro dato para agregar a su base de conocimientos. También me gustaría disipar la idea errónea común (que yo mismo compartí recientemente) de que agregar un archivo a un directorio en forma de árbol es más difícil que a un directorio lineal: estas son operaciones bastante comparables en el tiempo; el hecho es que para agregar un archivo al directorio, primero debe asegurarse de que aún no exista un archivo con ese nombre :) - y aquí, en un sistema lineal, tendremos dificultades para encontrar un archivo, descrito anteriormente, que compensa con creces la simplicidad de agregar un archivo al directorio.

¿Qué información se puede obtener simplemente leyendo un archivo de catálogo? exactamente lo que dice comando directorio. Para realizar una navegación sencilla en el disco, no es necesario acceder a MFT para cada archivo, solo necesita leer el más información general sobre archivos de archivos de directorio. El directorio principal del disco, la raíz, no se diferencia de los directorios normales, excepto por un enlace especial desde el principio del metarchivo MFT.

      Explotación florestal

NTFS es un sistema tolerante a fallas que puede restaurarse fácilmente a un estado correcto en caso de casi cualquier falla real. Cualquier sistema de archivos moderno se basa en el concepto de transacción: una acción realizada completa y correctamente o no realizada en absoluto. NTFS simplemente no tiene estados intermedios (erróneos o incorrectos): la cantidad de cambios de datos no se puede dividir en antes y después de la falla, lo que genera destrucción y confusión: se confirma o se cancela.

Ejemplo 1: los datos se están escribiendo en el disco. De repente resulta que no era posible escribir en el lugar donde acabábamos de decidir escribir la siguiente porción de datos: daño físico en la superficie. El comportamiento de NTFS en este caso es bastante lógico: la transacción de escritura se revierte por completo: el sistema se da cuenta de que la escritura no se realizó. La ubicación se marca como fallida y los datos se escriben en otra ubicación: comienza una nueva transacción.

Ejemplo 2: más caso dificil- los datos se están escribiendo en el disco. De repente, suena: se apaga la alimentación y el sistema se reinicia. ¿En qué fase se detuvo la grabación, dónde están los datos y dónde están las tonterías? Otro mecanismo del sistema viene al rescate: el registro de transacciones. El hecho es que el sistema, al darse cuenta de su deseo de escribir en el disco, marcó este estado en el metarchivo $LogFile. Al reiniciar, este archivo se examina en busca de transacciones incompletas que fueron interrumpidas por un accidente y cuyo resultado es impredecible: todas estas transacciones se cancelan: el lugar donde se realizó la escritura se marca nuevamente como libre, índices y elementos MFT vuelven al estado en el que se encontraban antes del fallo y el sistema en su conjunto permanece estable. Bueno, ¿qué pasa si ocurre un error al escribir en el registro? También está bien: la transacción aún no ha comenzado (solo hay un intento de registrar las intenciones de llevarla a cabo) o ya ha finalizado, es decir, hay un intento de registrar que la transacción en realidad ya se ha realizado. terminado. En el último caso, en el próximo arranque, el propio sistema comprenderá completamente que, de hecho, todo se escribió correctamente de todos modos y no prestará atención a la transacción "inconclusa".

Aún así, recuerde que el registro no es una panacea absoluta, sino sólo un medio para reducir significativamente la cantidad de errores y fallas del sistema. Es poco probable que el usuario medio de NTFS note algún error del sistema o se vea obligado a ejecutar chkdsk; la experiencia demuestra que NTFS se restaura a un estado completamente correcto incluso en caso de fallos en momentos de mucha actividad del disco. Incluso puede optimizar el disco y presionar restablecer en medio de este proceso; la probabilidad de pérdida de datos incluso en este caso será muy baja. Es importante entender, sin embargo, que el sistema recuperación NTFS garantiza la exactitud del sistema de archivos, no de sus datos. Si estaba escribiendo en un disco y se bloqueó, es posible que sus datos no se escriban. No hay milagros.

Los archivos NTFS tienen un atributo bastante útil: "comprimido". El hecho es que NTFS tiene soporte integrado para la compresión de disco, algo para lo que antes era necesario utilizar Stacker o DoubleSpace. Cualquier archivo o directorio se puede almacenar individualmente en el disco en forma comprimida; este proceso es completamente transparente para las aplicaciones. La compresión de archivos tiene una velocidad muy alta y sólo una gran propiedad negativa: la enorme fragmentación virtual de los archivos comprimidos, que, sin embargo, no molesta a nadie. La compresión se lleva a cabo en bloques de 16 clusters y utiliza los llamados "clusters virtuales", nuevamente una solución extremadamente flexible que le permite lograr efectos interesantes- por ejemplo, la mitad del archivo se puede comprimir, pero la otra mitad no. Esto se logra debido al hecho de que almacenar información sobre la compresión de ciertos fragmentos es muy similar a la fragmentación de archivos normal: por ejemplo, un registro típico del diseño físico de un archivo real sin comprimir:

los grupos de archivos del 1 al 43 se almacenan en grupos de discos a partir de 400, los grupos de archivos del 44 al 52 se almacenan en grupos de discos a partir de 8530...

Diseño físico de un archivo comprimido típico:

Los grupos de archivos del 1 al 9 se almacenan en grupos de discos a partir de 400. Los grupos de archivos del 10 al 16 no se almacenan en ningún lugar. Los grupos de archivos del 17 al 18 se almacenan en grupos de discos a partir de 409. Los grupos de archivos del 19 al 36 no se almacenan en ningún lugar. ...

Esta claro que archivo comprimido tiene clusters “virtuales”, en los que no hay información real. Tan pronto como el sistema ve tales grupos virtuales, inmediatamente comprende que los datos del bloque anterior, un múltiplo de 16, deben descomprimirse y los datos resultantes simplemente llenarán los grupos virtuales; ese, de hecho, es todo el algoritmo. .

      Seguridad

NTFS contiene muchos medios para delimitar los derechos de los objetos; se cree que este es el sistema de archivos más avanzado de todos los que existen actualmente. En teoría, esto es indudablemente cierto, pero en las implementaciones actuales, desafortunadamente, el sistema de derechos está bastante lejos de ser ideal y, aunque rígido, no siempre presenta un conjunto lógico de características. Los derechos asignados a cualquier objeto y claramente respetados por el sistema están evolucionando: ya se han realizado cambios y adiciones importantes a los derechos varias veces, y en Windows 2000 finalmente llegaron a un conjunto bastante razonable.

Los derechos del sistema de archivos NTFS están indisolublemente ligados al propio sistema; es decir, en términos generales, no es necesario que otro sistema los respete si se le da acceso físico al disco. Para evitar el acceso físico, Windows 2000 (NT5) aún introdujo una característica estándar; consulte a continuación para obtener más información al respecto. El sistema de derechos en su estado actual es bastante complejo y dudo que pueda decirle al lector en general algo interesante y útil para él en vida ordinaria. Si está interesado en este tema, encontrará muchos libros sobre arquitectura de red NT que lo describen con más detalle.

En este punto se puede completar la descripción de la estructura del sistema de archivos; sólo queda describir un cierto número de cosas simplemente prácticas u originales.

Esto ha estado en NTFS desde tiempos inmemoriales, pero se usó muy raramente, y aún así: Hard Link es cuando el mismo archivo tiene dos nombres (varios punteros de directorio de archivos o directorios diferentes apuntan al mismo registro MFT). Digamos que un mismo archivo tiene los nombres 1.txt y 2.txt: si el usuario elimina el archivo 1, quedará el archivo 2. Si elimina el 2, quedará el archivo 1, es decir, ambos nombres, desde el momento de su creación. son completamente iguales. El archivo se borra físicamente sólo cuando se elimina su apellido.

      Enlaces simbólicos (NT5)

Una característica mucho más práctica que le permite crear directorios virtuales, exactamente igual que discos virtuales con el comando subst en DOS. Las aplicaciones son bastante variadas: en primer lugar, simplificar el sistema de catálogo. Si no le gusta el directorio Documentos y configuración\Administrador\Documentos, puede vincularlo al directorio raíz; el sistema aún se comunicará con el directorio con una ruta comodín y tendrá un nombre mucho más corto que es completamente equivalente. lo. Para crear dichas conexiones, puede utilizar el programa de unión (junction.zip(15 Kb), 36 kb), escrito por el famoso especialista Mark Russinovich (http://www.sysinternals.com). El programa sólo funciona en NT5 (Windows 2000), al igual que la función en sí. Para eliminar una conexión, puede utilizar el comando rd estándar. ADVERTENCIA: Intentar eliminar un enlace utilizando Explorer u otros administradores de archivos que no comprendan la naturaleza virtual de un directorio (como FAR) eliminará los datos a los que hace referencia el enlace. Ten cuidado.

      Cifrado (NT5)

Una característica útil para las personas que se preocupan por sus secretos: cada archivo o directorio también puede cifrarse, haciendo imposible que otra instalación de NT pueda leerlo. Combinada con una contraseña estándar y prácticamente irrompible para iniciar el sistema, esta característica proporciona suficiente seguridad para la mayoría de las aplicaciones para los datos importantes que seleccione.

Archivos y estructura de archivos.

En tecnología informática, la unidad de almacenamiento de datos es un objeto de longitud variable llamado archivo. Un archivo es una secuencia de un número arbitrario de bytes que tiene nombre único. Sistemas de archivos crear para los usuarios alguna representación virtual de dispositivos de almacenamiento de computadora externos, permitiéndoles trabajar con ellos a un bajo nivel de comandos de control dispositivos fisicos, y en alto nivel conjuntos y estructuras de datos. Por tanto, el sistema de archivos es un sistema de gestión de datos.

Nombre del archivo tiene un significado especial: en realidad conlleva funciones de direccionamiento en estructuras jerárquicas. Además, el nombre puede tener extensión, que almacena información sobre el tipo de datos. Si el usuario puede establecer los nombres de los archivos creados de forma arbitraria, entonces se debe seguir cierta tradición en el uso de extensiones. Por ejemplo, en el sistema operativo MS DOS, los archivos con extensiones: .com, .exe, .bat son ejecutables; .bat, .txt, .doc – - texto; .pas, .bas, .c, .for – - textos de programa en idiomas conocidos programación: (Pascal, BASIC, C, Fortran, respectivamente); .dbf – - archivo de base de datos. Varios sistemas operativos tienen restricciones en cuanto a la longitud y las extensiones de los nombres de archivos. Entonces, en MS DOS, la longitud del nombre del archivo no debe exceder los ocho caracteres y la extensión, tres, es decir, se utiliza el estándar 8.3. En el sistema operativo Restricciones de Windows mucho menos duro.

Para el usuario, un archivo es el elemento principal e indivisible de almacenamiento de datos que puede encontrarse, modificarse, eliminarse, guardarse o enviarse a un dispositivo u otro ordenador, pero sólo en su totalidad.

El sistema de archivos es parte del sistema operativo de la computadora y, por lo tanto, siempre lleva la huella de las propiedades de un sistema operativo en particular. El sistema de archivos oculta al usuario la imagen de la ubicación real de la información en la memoria externa, garantiza la independencia de los programas de las características de una configuración de computadora específica, es decir. nivel lógico trabajando con archivos. Al trabajar con archivos, el usuario cuenta con herramientas para la creación de nuevos archivos, operaciones de lectura y escritura de información, etc., que no afectan cuestiones específicas de programación del canal para envío de datos o control de dispositivos externos.

El tipo de archivos más común. estructura interna que son proporcionados por los sistemas de archivos de varios sistemas operativos son archivos con una estructura secuencial. Los archivos en este caso se representan como un conjunto de elementos constituyentes llamados registros lógicos de longitud arbitraria y con acceso secuencial. Algunos sistemas operativos prevén el uso de estructuras de archivos lógicas más complejas, como una estructura de árbol. En nivel fisico Los bloques de archivos pueden ubicarse en la memoria como un área contigua o almacenarse de forma no contigua. Toda la información contable sobre la ubicación de los archivos en disco magnético reducido a un solo lugar - - catalogar o directorio disco. Un directorio es una lista de elementos, cada uno de los cuales describe las características de un archivo en particular que se utiliza para organizar el acceso a él: el nombre del archivo, su tipo, ubicación en el disco, tamaño. Los catálogos pueden ser gran número y están vinculados a estructuras de información, por ejemplo, a un sistema de directorio jerárquico (en árbol). Cada directorio se trata como un archivo y tiene su propio nombre. El nombre completo de un directorio o archivo en dicha estructura especifica la ruta de las transiciones entre directorios y archivos en la estructura lógica de directorios (ver Figura 1.5).

Arroz. 1.5. Sistema de directorio jerárquico

La estructura de los archivos en sí puede ser trivial. Por ejemplo, el texto puede almacenarse como una secuencia de bytes correspondientes a la codificación de la tabla ASCII. Sin embargo, en la mayoría de los casos, junto con los datos, es necesario almacenar alguna información adicional.


información personal. La forma en que se organizan los datos en un archivo, es decir, la estructura del archivo, se llama formato. El formato del archivo determina cómo se interpretan correctamente los datos almacenados. Hay bastantes formatos de archivos diferentes. Algunos de ellos están estandarizados y soportados por cualquier sistema operativo, otros son específicos sólo de estos sistemas operativos. A menudo, el encabezado del archivo incluye un identificador de formato de archivo. Moderno sistemas de software Le permite incluir simultáneamente datos en un archivo. diferentes tipos, es decir, el archivo puede tener un formato muy complejo. Por ejemplo, puedes incluir texto, imágenes, tablas, fórmulas y mucho más en un documento de MS Word.

En la mayoría de los casos, el usuario no necesita saber nada sobre estructura interna archivos. Esta es la capa de abstracción de la interfaz del sistema operativo.

Tarde o temprano, un usuario novato de computadora se enfrenta a un concepto como el sistema de archivos (FS). Como regla general, el primer contacto con este término ocurre al formatear un medio de almacenamiento: unidades lógicas y medios conectados (unidades flash, tarjetas de memoria, duro externo disco).

Antes de formatear, el sistema operativo Windows le solicita que seleccione el tipo de sistema de archivos en el medio, el tamaño del clúster y el método de formateo (rápido o completo). Averigüemos qué es un sistema de archivos y por qué es necesario.

Toda la información se registra en el soporte en el formulario, que debe estar ubicado en en un cierto orden, de lo contrario el sistema operativo y los programas no podrán operar con los datos. Este orden lo organiza el sistema de archivos mediante ciertos algoritmos y reglas para colocar archivos en el medio.

Cuando un programa necesita un archivo almacenado en el disco, no necesita saber cómo ni dónde está almacenado. Todo lo que se requiere del programa es conocer el nombre del archivo, su tamaño y atributos para poder transferir estos datos al sistema de archivos, que proporcionará acceso a el archivo requerido. Lo mismo sucede al escribir datos en un medio: el programa transfiere información sobre el archivo (nombre, tamaño, atributos) al sistema de archivos, que lo guarda según sus propias reglas específicas.

Para comprenderlo mejor, imaginemos a un bibliotecario dándole un libro a un cliente basándose en su título. O en el orden inverso: el cliente devuelve el libro que leyó al bibliotecario, quien lo vuelve a guardar. El cliente no necesita saber dónde y cómo se guarda el libro, esto es responsabilidad del empleado del establecimiento. El bibliotecario conoce las reglas de catalogación bibliotecaria y, de acuerdo con estas reglas, busca la publicación o la devuelve, es decir, realiza sus funciones oficiales. En este ejemplo, la biblioteca es el medio de almacenamiento, el bibliotecario es el sistema de archivos y el cliente es el programa.

Funciones básicas del sistema de archivos

Las principales funciones del sistema de archivos son:

  • colocación y organización en un soporte de datos en forma de archivos;
  • determinar la cantidad máxima de datos admitida en el medio de almacenamiento;
  • crear, leer y eliminar archivos;
  • asignar y cambiar atributos de archivo (tamaño, hora de creación y modificación, propietario y creador del archivo, solo lectura, archivo oculto, archivo temporal, archivado, ejecutable, longitud máxima nombre del archivo, etc.);
  • determinar la estructura del archivo;
  • organizar directorios para organización lógica archivos;
  • protección de archivos en caso de falla del sistema;
  • proteger archivos del acceso no autorizado y cambiar su contenido.

Información registrada en disco duro o cualquier otro medio, se ubica en él en base a una organización cluster. Un cluster es una especie de celda de cierto tamaño en la que cabe todo el archivo o parte de él.

Si el archivo tiene el tamaño de un clúster, entonces solo ocupa un clúster. Si el tamaño del archivo excede el tamaño de la celda, se coloca en varias celdas del grupo. Además, es posible que los clústeres libres no estén ubicados uno al lado del otro, sino que estén dispersos sobre la superficie física del disco. Este sistema le permite hacer el uso más eficiente del espacio al almacenar archivos. La tarea del sistema de archivos es distribuir de manera óptima el archivo al escribir en grupos libres, así como ensamblarlo al leerlo y entregárselo al programa o sistema operativo.

Tipos de sistemas de archivos

Durante la evolución de las computadoras, los medios de almacenamiento y los sistemas operativos, una gran cantidad de sistemas de archivos han aparecido y desaparecido. En el proceso de esta selección evolutiva, hoy en día para trabajar con discos duros y dispositivos de almacenamiento externos (unidades flash, tarjetas de memoria, discos duros externos, CD) se utilizan principalmente los siguientes tipos de FS:

  1. FAT32
  2. ISO9660

Los dos últimos sistemas están diseñados para funcionar con CD. Los sistemas de archivos Ext3 y Ext4 funcionan con sistemas operativos basados ​​en Basado en Linux. NFS Plus es un sistema de archivos para los sistemas operativos OS X utilizados en las computadoras Apple.

Los sistemas de archivos más utilizados son NTFS y FAT32, y esto no es de extrañar, porque... están diseñados para los sistemas operativos Windows, que ejecutan la gran mayoría de las computadoras del mundo.

Ahora FAT32 está siendo reemplazado activamente por el sistema NTFS más avanzado debido a su mayor confiabilidad en la seguridad y protección de datos. Además, las últimas versiones del sistema operativo Windows simplemente no permitirán instalarse si la partición del disco duro está formateada en FAT32. El instalador le pedirá que formatee la partición en NTFS.

El sistema de archivos NTFS admite discos con una capacidad de cientos de terabytes y un tamaño de archivo único de hasta 16 terabytes.

El sistema de archivos FAT32 admite discos de hasta 8 terabytes y un tamaño de archivo único de hasta 4 GB. Muy a menudo, este FS se utiliza en unidades flash y tarjetas de memoria. Las unidades externas están formateadas en FAT32 de fábrica.

Sin embargo, la limitación del tamaño de archivo de 4 GB ya es una gran desventaja hoy en día, porque... Debido a la distribución de videos de alta calidad, el tamaño del archivo de la película excederá este límite y no será posible grabarla en el medio.

Compartir.

Buen día, querido usuario, en este artículo hablaremos de un tema como los archivos. Es decir, veremos: Gestión de archivos, tipos de archivos, estructura de archivos, atributos de archivo.

Sistema de archivos

Una de las principales tareas del sistema operativo es brindar comodidad al usuario cuando trabaja con datos almacenados en discos. Para hacer esto, el sistema operativo reemplaza la estructura física de los datos almacenados con algún modelo lógico fácil de usar, que se implementa en forma de árbol de directorios que se muestra en la pantalla mediante utilidades como Norton Commander, Far Manager o Windows Explorer. El elemento básico de este modelo es archivo, que es lo mismo que sistema de archivos en general, puede caracterizarse por una estructura tanto lógica como física.

Gestión de archivos

Archivo– un área con nombre de memoria externa destinada a leer y escribir datos.

Los archivos se almacenan en una memoria independiente de la energía. La excepción es disco electrónico, cuando se crea en el OP una estructura que simula un sistema de archivos.

Sistema de archivos(FS) es un componente del sistema operativo que proporciona organización para la creación, almacenamiento y acceso a conjuntos de datos con nombre: archivos.

El sistema de archivos incluye: El sistema de archivos incluye:

  • La colección de todos los archivos en el disco.
  • Conjuntos de estructuras de datos utilizados para administrar archivos (directorios de archivos, descriptores de archivos, tablas de asignación de espacio en disco libre y usado).
  • Un conjunto de herramientas de software del sistema que implementan diversas operaciones en archivos: creación, destrucción, lectura, escritura, denominación, búsqueda.

Los problemas que resuelve el FS dependen de la forma en que se organiza el proceso informático en su conjunto. El tipo más simple es un sistema de archivos en sistemas operativos de un solo usuario y de un solo programa. Las funciones principales de dicho FS están dirigidas a resolver las siguientes tareas:

  • Nombrar archivos.
  • Interfaz de software para aplicaciones.
  • Pantallas modelo lógico FS para la organización física del almacén de datos.
  • Resistencia FS a fallas de energía, errores de hardware y software.

Las tareas de FS se vuelven más complicadas en los sistemas operativos multitarea de un solo usuario, que están diseñados para el trabajo de un solo usuario, pero permiten ejecutar varios procesos simultáneamente. Además de las tareas enumeradas anteriormente nueva tareaintercambio a un archivo desde múltiples procesos.

El archivo en este caso es un recurso compartido, lo que significa que el FS debe resolver toda la gama de problemas asociados con dichos recursos. En particular: debe haber medios para bloquear un archivo y sus partes, conciliar copias, evitar carreras y eliminar puntos muertos. En los sistemas multiusuario aparece otra tarea: proteger los archivos de un usuario del acceso no autorizado por parte de otro usuario.

Las funciones del FS, que opera como parte de un sistema operativo de red, se vuelven aún más complejas: necesita organizar la protección; archivos un usuario del acceso no autorizado de otro usuario.

Propósito principal sistema de archivos y correspondiente a ello sistemas de gestión de archivos– organización de una gestión conveniente de archivos organizados como archivos: en lugar de acceso de bajo nivel a datos que indican específicos direcciones fisicas el registro que necesitamos, se utiliza el acceso lógico indicando el nombre del archivo y el registro que contiene.

Es necesario distinguir los términos “sistema de archivos” y “sistema de gestión de archivos”: el sistema de archivos define, en primer lugar, los principios de acceso a los datos organizados como archivos. Y el término "sistema de gestión de archivos" debe usarse en relación con una implementación específica del sistema de archivos, es decir. esto es un complejo módulos de software, proporcionando trabajo con archivos en un sistema operativo específico.

Ejemplo

El sistema de archivos FAT (tabla de asignación de archivos) tiene muchas implementaciones como sistema de gestión de archivos.

  • El sistema desarrollado para las primeras PC se llamó simplemente FAT (ahora llamado simplemente FAT-12). Fue diseñado para funcionar con disquetes y durante algún tiempo se utilizó para trabajar con discos duros.
  • Luego se mejoró para trabajar con discos duros más grandes y esta nueva implementación se llamó FAT-16. este nombre también se utiliza en relación con el SUF del propio MS-DOS.
  • La implementación de SUF para OS/2 se llama super-FAT (la principal diferencia es la capacidad de admitir atributos extendidos para cada archivo).
  • Existe una versión de SUF para Windows 9x/NT, etc. (FAT-32).

Tipos de archivos

Archivos regulares: contienen información de naturaleza arbitraria que el usuario ingresa en ellos o que se genera como resultado del funcionamiento del sistema y programas de usuario. El contenido de un archivo normal lo determina la aplicación que trabaja con él.

Los archivos normales pueden ser de dos tipos:

  1. Software(ejecutable): son programas escritos en el lenguaje de comandos del sistema operativo y realizan algunas funciones del sistema (tienen extensiones .exe, .com, .bat).
  2. Archivos de datos– todos los demás tipos de archivos: documentos de texto y gráficos, hojas de cálculo, bases de datos, etc.

Catálogos- es, por un lado, un grupo de archivos combinados por el usuario según determinadas consideraciones (por ejemplo, archivos que contienen programas de juegos o archivos que componen un paquete de software) y, por otro lado, es un grupo especial tipo de archivos que contienen el sistema información de fondo sobre un conjunto de archivos agrupados por los usuarios según algún criterio informal (tipo de archivo, su ubicación en el disco, derechos de acceso, fecha de creación y modificación).

Archivos especiales son archivos ficticios asociados con dispositivos de entrada/salida que se utilizan para unificar el mecanismo de acceso a archivos y dispositivos externos. Los archivos especiales permiten al usuario realizar operaciones de E/S utilizando comandos normales de escritura o lectura de archivos. Estos comandos son procesados ​​​​primero por los programas FS y luego, en alguna etapa de la ejecución de la solicitud, el sistema operativo los convierte en comandos de control para el dispositivo correspondiente (PRN, LPT1 - para el puerto de la impresora (nombres simbólicos, para el sistema operativo - estos son archivos), CON - para el teclado).

Ejemplo. Copiar con text1 (trabajando con el teclado).

Estructura de archivos

Estructura de archivos– el conjunto completo de archivos en el disco y las relaciones entre ellos (el orden en que se almacenan los archivos en el disco).

Tipos de estructuras de archivos:

  • simple, o un solo nivel: Un directorio es una secuencia lineal de archivos.
  • jerárquico o multinivel: un directorio en sí puede ser parte de otro directorio y contener muchos archivos y subdirectorios dentro de él. La estructura jerárquica puede ser de dos tipos: “Árbol” y “Red”. Los directorios forman un "Árbol" si se permite que el archivo se incluya en un solo directorio (OS MS-DOS, Windows) y una "Red", si el archivo se puede incluir en varios directorios a la vez (UNIX).
  • La estructura de archivos se puede representar como un gráfico que describe la jerarquía de directorios y archivos:



Tipos de nombres de archivos

Los archivos se identifican por nombres. Los usuarios dan archivos. nombres simbólicos, esto tiene en cuenta las restricciones del sistema operativo tanto en los caracteres utilizados como en la longitud del nombre. En los primeros sistemas de archivos, estos límites eran bastante estrechos. Entonces en popular sistema de archivos FAT La longitud de los nombres está limitada por el conocido esquema 8.3 (8 caracteres - el nombre en sí, 3 caracteres - la extensión del nombre), y en UNIX System V el nombre no puede contener más de 14 caracteres.

Sin embargo, es mucho más conveniente para el usuario trabajar con nombres largos, ya que le permiten darle al archivo un nombre verdaderamente mnemotécnico, mediante el cual, incluso después de un período de tiempo bastante largo, puede recordar lo que contiene este archivo. Por lo tanto, los sistemas de archivos modernos tienden a admitir nombres de archivos simbólicos largos.

Por ejemplo, Windows NT en su archivo sistema NTFS especifica que un nombre de archivo puede tener hasta 255 caracteres, sin contar el carácter nulo final.

Pasar a nombres largos crea un problema de compatibilidad con aplicaciones creadas anteriormente que usan nombres cortos. Para que las aplicaciones puedan acceder a los archivos según las convenciones previamente aceptadas, el sistema de archivos debe poder proporcionar nombres cortos (alias) equivalentes a los archivos que tienen nombres largos. Así, uno de tareas importantes Generar nombres cortos apropiados se convierte en un problema.

Los nombres simbólicos pueden ser de tres tipos: simples, compuestos y relativos:

  1. nombre sencillo identifica un archivo dentro de un directorio, asignado a archivos teniendo en cuenta la nomenclatura del símbolo y la longitud del nombre.
  2. nombre completo es una cadena de nombres simbólicos simples de todos los directorios a través de los cuales pasa la ruta desde la raíz a un archivo determinado, nombre de disco, nombre de archivo. Entonces el nombre completo es compuesto, en el que nombres simples separados entre sí por el separador adoptado en el sistema operativo.
  3. El archivo también se puede identificar. nombre relativo. El nombre relativo del archivo se determina mediante el concepto de "directorio actual". En cualquier momento dado, uno de los directorios está actual y este directorio lo selecciona el propio usuario según las órdenes del sistema operativo. El sistema de archivos captura el nombre del directorio actual para luego poder usarlo como complemento de los nombres relativos para formar el nombre de archivo completo.

En una estructura de archivos en forma de árbol, existe una correspondencia uno a uno entre un archivo y su nombre completo: "un archivo, un nombre completo". En una estructura de archivos de red, un archivo puede incluirse en varios directorios, lo que significa que puede tener varios nombres completos; La correspondencia aquí es "un archivo, muchos nombres completos".

Para el archivo 2.doc, defina los tres tipos de nombre, siempre que el directorio actual sea el directorio 2008_year.

  • Nombre simple: 2.doc
  • Nombre completo: C:\2008_year\Documents\2.doc
  • Nombre relativo: Documentos\2.doc

Atributos de archivo

Una característica importante de un archivo son sus atributos. Atributos– esta es información que describe las propiedades de los archivos. Ejemplos de posibles atributos de archivo:

  • Atributo de sólo lectura;
  • Firmar “archivo oculto” (Oculto);
  • Firmar “archivo del sistema” (Sistema);
  • Firmar “archivo” (Archivo);
  • Tipo de archivo ( archivo normal, directorio, archivo especial);
  • Titular del fichero;
  • Creador de archivos;
  • Contraseña para acceder al archivo;
  • Información sobre operaciones de acceso a archivos permitidas;
  • Hora de creación, último acceso y última modificación;
  • Tamaño de archivo actual;
  • Tamaño máximo de archivo;
  • Firmar “temporal (eliminar una vez finalizado el proceso)”;
  • Señal de bloqueo.

En diferentes tipos de sistemas de archivos, se pueden usar diferentes conjuntos de atributos para caracterizar los archivos (por ejemplo, en un sistema operativo de un solo usuario, el conjunto de atributos no contendrá características relacionadas con el usuario y la seguridad (el creador del archivo, el contraseña para acceder al archivo, etc.).

El usuario puede acceder a los atributos utilizando las facilidades proporcionadas a tal efecto por el sistema de archivos. Normalmente, puede leer los valores de cualquier atributo, pero solo cambiar algunos; por ejemplo, puede cambiar los derechos de acceso a un archivo, pero no puede cambiar la fecha de creación o el tamaño actual del archivo.

Permisos de archivos

Definir derechos de acceso a un archivo significa definir para cada usuario un conjunto de operaciones que puede aplicar a este archivo. Diferentes sistemas de archivos pueden tener su propia lista de operaciones de acceso diferenciadas. Esta lista puede incluir las siguientes operaciones:

  • creación de archivos.
  • destrucción de archivos.
  • escribiendo en un archivo.
  • abriendo un archivo.
  • cerrando el archivo.
  • lectura del archivo.
  • adición de archivos.
  • buscar en el archivo.
  • obteniendo atributos de archivo.
  • establecer nuevos valores de atributos.
  • cambiando el nombre.
  • ejecución del archivo.
  • leer un catálogo, etc.

En el muy caso general derechos de acceso se puede describir mediante una matriz de derechos de acceso, en la que las columnas corresponden a todos los archivos del sistema, las filas corresponden a todos los usuarios, y en la intersección de filas y columnas se indican las operaciones permitidas:

En algunos sistemas, los usuarios pueden dividirse en categorías separadas. Para todos los usuarios de la misma categoría, se definen derechos de acceso uniformes, por ejemplo, en el sistema UNIX, todos los usuarios se dividen en tres categorías: el propietario del archivo, los miembros de su grupo y todos los demás.




Arriba