Código Ascii de fin de archivo. Codificación ASCII (código estándar americano para el intercambio de información): codificación de texto básica para el alfabeto latino
Superposición de personajesEl carácter BS (retroceso) permite a la impresora imprimir un carácter encima de otro. ASCII permitía agregar signos diacríticos a las letras de esta manera, por ejemplo:
- a BS "→á
- a BS ` → à
- una BS ^ → â
- o BS / → ø
- c BS , → ç
- norte BS ~ → с
Nota: en fuentes más antiguas, el apóstrofe " se dibujaba inclinado hacia la izquierda y la tilde ~ se movía hacia arriba, por lo que encajaban en la función de un agudo y una tilde en la parte superior.
Si se superpone el mismo carácter a un carácter, el resultado es un efecto de fuente en negrita, y si se superpone un subrayado a un carácter, el resultado es un texto subrayado.
- una BS una → una
- abs_→ a
Nota: esto se usa, por ejemplo, en el sistema de ayuda del hombre.
Variantes nacionales de ASCIIEl estándar ISO 646 (ECMA-6) brinda la capacidad de colocar caracteres nacionales en lugar de @ [ \ ] ^ ` ( | ) ~ . Además de esto, £ se puede colocar en el lugar # y ¤ se puede colocar en el lugar $. Este sistema es muy adecuado para idiomas europeos donde sólo se necesitan unos pocos caracteres adicionales. La versión de ASCII sin caracteres nacionales se llama US-ASCII o "Versión de referencia internacional".
Posteriormente, resultó más conveniente utilizar codificaciones de 8 bits (páginas de códigos), donde la mitad inferior de la tabla de códigos (0-127) está ocupada por caracteres US-ASCII y la mitad superior (128-255) por personajes adicionales, incluido un conjunto de personajes nacionales. Por lo tanto, la mitad superior de la tabla ASCII, antes de la adopción generalizada de Unicode, se usaba activamente para representar caracteres localizados, letras del idioma local. La falta de un estándar unificado para colocar caracteres cirílicos en la tabla ASCII causó muchos problemas con las codificaciones (KOI-8, Windows-1251 y otras). Otros idiomas con escrituras no latinas también sufrían de tener varias codificaciones diferentes.
NUL | SOM | AEO | MOE | EQT | WRU | RU | CAMPANA | BKSP | HT | LF | Vermont | FF | CR | ENTONCES | SI. |
CD 0 | CC 1 | CC 2 | CC 3 | CC 4 | ERRAR | SINCRONIZACIÓN | L.E.M. | S 0 | S 1 | T 2 | S 3 | S 4 | S 5 | T 6 | T 7 |
BLANCO | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
@ | A | B | do | D | mi | F | GRAMO | h | I | j | k | l | METRO | norte | oh |
PAG | q | R | S | t | Ud. | V | W. | incógnita | Y | z | [ | \ | ] | ← | |
a | b | do | d | mi | F | gramo | h | i | j | k | yo | metro | norte | oh | |
pag | q | r | s | t | tu | v | w | incógnita | y | z | ESC | DEL |
En aquellas computadoras donde la unidad mínima de memoria direccionable era una palabra de 36 bits, inicialmente se utilizaron caracteres de 6 bits (1 palabra = 6 caracteres). Después de la transición a ASCII, dichas computadoras comenzaron a contener 5 caracteres de siete bits (quedaba 1 bit extra) o 4 caracteres de nueve bits en una palabra.
Los códigos ASCII también se utilizan para determinar qué tecla se presiona durante la programación. Para un teclado QWERTY estándar, la tabla de códigos tiene este aspecto:
[Codificaciones de 8 bits: ASCII, KOI-8R y CP1251] Las primeras tablas de codificación creadas en EE. UU. no utilizaban el octavo bit en un byte. El texto se representó como una secuencia de bytes, pero el octavo bit no se tuvo en cuenta (se utilizó para fines oficiales). La tabla ASCII (Código estándar americano para el intercambio de información) se ha convertido en un estándar generalmente aceptado. Los primeros 32 caracteres de la tabla ASCII (00 a 1F) se utilizaron para caracteres no imprimibles. Fueron diseñados para controlar un dispositivo de impresión, etc. El resto, del 20 al 7F, son caracteres normales (imprimibles). Tabla 1 - Codificación ASCII
Como puede ver fácilmente, esta codificación contiene solo letras latinas y aquellas que se usan en el idioma inglés. También hay símbolos aritméticos y de otros servicios. Pero no hay letras rusas, ni siquiera letras latinas especiales para el alemán o el francés. Esto es fácil de explicar: la codificación se desarrolló específicamente como estándar estadounidense. A medida que las computadoras comenzaron a usarse en todo el mundo, fue necesario codificar otros caracteres. Para ello se decidió utilizar el octavo bit en cada byte. Esto puso a disposición 128 valores más (de 80 a FF) que podrían usarse para codificar caracteres. La primera de las tablas de ocho bits, "ASCII extendido" (ASCII extendido), incluía varias variantes de los caracteres latinos utilizados en algunos idiomas de Europa occidental. También contenía otros símbolos adicionales, incluidos pseudográficos. Los caracteres pseudográficos le permiten proporcionar cierta apariencia de gráficos al mostrar solo caracteres de texto en la pantalla. Por ejemplo, el programa de gestión de archivos FAR Manager funciona mediante pseudografía. No había letras rusas en la tabla ASCII extendida. Rusia (antes URSS) y otros países crearon sus propias codificaciones que permitieron representar caracteres "nacionales" específicos en archivos de texto de 8 bits: letras latinas de los idiomas polaco y checo, cirílico (incluidas las letras rusas) y otros alfabetos. En todas las codificaciones que se han generalizado, los primeros 127 caracteres (es decir, el valor del byte con el octavo bit igual a 0) son los mismos que en ASCII. Entonces un archivo ASCII funciona en cualquiera de estas codificaciones; Las letras del idioma inglés se representan de la misma forma. La organización ISO (Organización Internacional de Normalización) ha adoptado el grupo de normas ISO 8859. Define codificaciones de 8 bits para diferentes grupos de idiomas. Entonces, ISO 8859-1 es una tabla ASCII extendida para EE. UU. y Europa occidental. E ISO 8859-5 es una tabla para el alfabeto cirílico (incluido el ruso). Sin embargo, por razones históricas, la codificación ISO 8859-5 no echó raíces. En realidad, se utilizan las siguientes codificaciones para el idioma ruso: Página de códigos 866 (CP866), también conocida como “DOS”, también conocida como “codificación GOST alternativa”. Muy utilizado hasta mediados de los 90; ahora se utiliza de forma limitada. Prácticamente no se utiliza para distribuir textos en Internet. La principal ventaja del CP866 fue la conservación de caracteres pseudográficos en los mismos lugares que en ASCII extendido; por lo tanto, los programas de texto extranjeros, por ejemplo el famoso Norton Commander, podrían funcionar sin cambios. El CP866 ahora se utiliza para programas de Windows que se ejecutan en ventanas de texto o en modo de texto de pantalla completa, incluido FAR Manager. Los textos en CP866 han sido bastante raros en los últimos años (pero se utiliza para codificar nombres de archivos rusos en Windows). Por lo tanto, nos detendremos con más detalle en otras dos codificaciones: KOI-8R y CP1251. Como puede ver, en la tabla de codificación CP1251, las letras rusas están ordenadas alfabéticamente (con la excepción, sin embargo, de la letra E). Esta disposición hace que sea muy fácil para los programas informáticos ordenar alfabéticamente. Pero en KOI-8R el orden de las letras rusas parece aleatorio. Pero en realidad este no es el caso. En muchos programas antiguos, el octavo bit se perdía al procesar o transmitir texto. (Ahora estos programas están prácticamente "extintos", pero a finales de los 80 y principios de los 90 estaban muy extendidos). Para obtener un valor de 7 bits a partir de un valor de 8 bits, simplemente reste 8 del dígito más significativo; por ejemplo, E1 se convierte en 61. Ahora compare KOI-8R con la tabla ASCII (Tabla 1). Verá que las letras rusas están colocadas en clara correspondencia con las latinas. Si el octavo bit desaparece, las letras rusas minúsculas se convierten en letras latinas mayúsculas y las letras rusas mayúsculas se convierten en letras latinas minúsculas. Entonces, E1 en KOI-8 es la “A” rusa, mientras que 61 en ASCII es la “a” latina. Entonces, KOI-8 le permite mantener la legibilidad del texto ruso cuando se pierde el octavo bit. "Hola a todos" se convierte en "pRIWET WSEM". Recientemente, tanto el orden alfabético de los caracteres en la tabla de codificación como la legibilidad con la pérdida del octavo bit han perdido su importancia decisiva. El octavo bit en las computadoras modernas no se pierde durante la transmisión o el procesamiento. Y la clasificación alfabética se realiza teniendo en cuenta la codificación, y no simplemente comparando códigos. (Por cierto, los códigos CP1251 no están completamente ordenados alfabéticamente; la letra E no está en su lugar). Debido al hecho de que existen dos codificaciones comunes, cuando se trabaja con Internet (correo, navegación por sitios web), a veces se puede ver un conjunto de letras sin sentido en lugar de texto en ruso. Por ejemplo, “YO SOY SBYUFEMHEL”. Estas son sólo las palabras “con respeto”; pero estaban codificados en codificación CP1251 y la computadora decodificó el texto usando la tabla KOI-8. Si, por el contrario, se codificaran las mismas palabras en KOI-8 y la computadora decodificara el texto según la tabla CP1251, el resultado sería “U HCHBTSEOYEN”. A veces sucede que una computadora descifra letras en ruso utilizando una tabla que no está destinada al idioma ruso. Luego, en lugar de letras rusas, aparece un conjunto de símbolos sin significado (por ejemplo, letras latinas de idiomas de Europa del Este); a menudo se les llama "crocozibras". En la mayoría de los casos, los programas modernos se encargan de determinar la codificación de documentos de Internet (correos electrónicos y páginas web) de forma independiente. Pero a veces “fallan” y luego se pueden ver extrañas secuencias de letras rusas o “krokozyabry”. Como regla general, en tal situación, para mostrar texto real en la pantalla, basta con seleccionar la codificación manualmente en el menú del programa. Para este artículo se utilizó información de la página http://open-office.edusite.ru/TextProcessor/p5aa1.html. Material tomado del sitio: Excel para Office 365 Word para Office 365 Outlook para Office 365 PowerPoint para Office 365 Publisher para Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 20 07 PowerPoint 2007 Publisher 2 007 Acceso 2007 Visio 2007 OneNote 2007 Oficina 2010 Visio Estándar 2007 Visio Estándar 2010 Menos En este artículo: Insertar un carácter ASCII o Unicode en un documentoSi solo necesita ingresar algunos caracteres o símbolos especiales, puede usar atajos de teclado. Para obtener una lista de caracteres ASCII, consulte las siguientes tablas o el artículo Inserción de alfabetos nacionales mediante métodos abreviados de teclado. Notas: Insertar caracteres ASCIIPara insertar un carácter ASCII, presione y mantenga presionada la tecla ALT mientras ingresa el código de carácter. Por ejemplo, para insertar un símbolo de grado (º), presione y mantenga presionada la tecla ALT, luego ingrese 0176 en el teclado numérico. Para ingresar números, use el teclado numérico en lugar de los números del teclado principal. Si necesita ingresar números en el teclado numérico, asegúrese de que el indicador BLOQ NUM esté encendido. Insertar caracteres UnicodePara insertar un carácter Unicode, ingrese el código de carácter, luego presione ALT y X. Por ejemplo, para insertar un símbolo de dólar ($), ingrese 0024 y presione ALT y X. Para todos los códigos de caracteres Unicode, consulte. Importante: algunos programas de Microsoft Office, como PowerPoint e InfoPath, no admiten la conversión de códigos Unicode a caracteres. Si necesita insertar un carácter Unicode en uno de estos programas, utilice . Notas: Si aparece el carácter Unicode incorrecto después de presionar ALT+X, seleccione el código correcto y luego presione ALT+X nuevamente. Además, deberás introducir "U+" antes del código. Por ejemplo, si ingresa "1U+B5" y presiona ALT+X, se mostrará el texto "1μ", y si ingresa "1B5" y presiona ALT+X, se mostrará el símbolo "Ƶ". Una tabla de caracteres es un programa integrado en Microsoft Windows que le permite ver los caracteres disponibles para una fuente seleccionada. Usando una tabla de símbolos, puede copiar símbolos individuales o un grupo de símbolos al portapapeles y pegarlos en cualquier programa que admita la visualización de esos símbolos. Abrir la tabla de símbolos En Windows 10, ingrese la palabra "símbolo" en el cuadro de búsqueda de la barra de tareas y seleccione la tabla de símbolos de los resultados de la búsqueda. En Windows 8, escriba la palabra "símbolo" en la pantalla de Inicio y seleccione la tabla de símbolos de los resultados de la búsqueda. En Windows 7, haga clic en el botón Inicio, seleccione Todos los programas, Accesorios, Herramientas del sistema y luego haga clic en Mapa de caracteres. Los caracteres están agrupados por fuente. Haga clic en la lista de fuentes para seleccionar el juego de caracteres apropiado. Para seleccionar un símbolo, haga clic en él y luego haga clic en el botón Seleccionar. Para insertar un símbolo, haga clic derecho en la ubicación deseada en el documento y seleccione Pegar. Códigos de caracteres de uso frecuentePara obtener una lista completa de caracteres, consulte Computadora, Tabla de códigos de caracteres ASCII o Tablas de caracteres Unicode organizadas por conjunto.
El conjunto de caracteres con los que se escribe el texto se llama alfabeto. El número de caracteres del alfabeto es su fuerza. Fórmula para determinar la cantidad de información: norte=2b, donde N es la potencia del alfabeto (número de caracteres), b – número de bits (peso de información del símbolo). El alfabeto con una capacidad de 256 caracteres puede contener casi todos los caracteres necesarios. Este alfabeto se llama suficiente. Porque 256 = 2 8, entonces el peso de 1 carácter es de 8 bits. La unidad de medida de 8 bits recibió el nombre 1 byte: 1 byte = 8 bits. El código binario de cada carácter del texto de la computadora ocupa 1 byte de memoria. ¿Cómo se representa la información textual en la memoria de la computadora?La conveniencia de la codificación de caracteres byte a byte es obvia porque un byte es la parte más pequeña de la memoria direccionable y, por lo tanto, el procesador puede acceder a cada carácter por separado cuando procesa texto. Por otro lado, 256 caracteres es un número suficiente para representar una amplia variedad de información simbólica. Ahora surge la pregunta: qué código binario de ocho bits asignar a cada carácter.Está claro que se trata de una cuestión condicional; se pueden idear muchos métodos de codificación. Todos los caracteres del alfabeto informático están numerados del 0 al 255. Cada número corresponde a un código binario de ocho bits del 00000000 al 11111111. Este código es simplemente el número de serie del carácter en el sistema numérico binario. Una tabla en la que a todos los caracteres del alfabeto informático se les asignan números de serie se denomina tabla de codificación.Los diferentes tipos de computadoras utilizan diferentes tablas de codificación. La mesa se ha convertido en el estándar internacional para PC. ASCII(leer preguntar) (Código estándar americano para el intercambio de información). La tabla de códigos ASCII se divide en dos partes. Sólo la primera mitad de la tabla es la norma internacional, es decir. símbolos con números de 0 (00000000), hasta 127 (01111111). Estructura de la tabla de codificación ASCII
Tenga en cuenta que en la tabla de codificación, las letras (mayúsculas y minúsculas) están ordenadas alfabéticamente y los números en orden ascendente. Esta observancia del orden lexicográfico en la disposición de los símbolos se denomina principio de codificación secuencial del alfabeto. Para las letras del alfabeto ruso, también se observa el principio de codificación secuencial. Segunda mitad de la tabla de códigos ASCIIDesafortunadamente, actualmente existen cinco codificaciones cirílicas diferentes (KOI8-R, Windows, MS-DOS, Macintosh e ISO). Debido a esto, a menudo surgen problemas al transferir texto en ruso de una computadora a otra, de un sistema de software a otro. Cronológicamente, uno de los primeros estándares para codificar letras rusas en computadoras fue KOI8 ("Código de intercambio de información, 8 bits"). Esta codificación se utilizó allá por los años 70 en ordenadores de la serie ES, y desde mediados de los 80 empezó a utilizarse en las primeras versiones rusificadas del sistema operativo UNIX. Desde principios de los años 90, época de dominio del sistema operativo MS DOS, la codificación CP866 permanece ("CP" significa "página de códigos", "página de códigos"). Las computadoras Apple que ejecutan el sistema operativo Mac OS usan su propia codificación Mac. Además, la Organización Internacional de Normalización (ISO) ha aprobado otra codificación denominada ISO 8859-5 como estándar para el idioma ruso. La codificación más común utilizada actualmente es Microsoft Windows, abreviada CP1251. Desde finales de los años 90, el problema de la estandarización de la codificación de caracteres se ha resuelto mediante la introducción de un nuevo estándar internacional llamado Unicódigo. Esta es una codificación de 16 bits, es decir. Asigna 2 bytes de memoria para cada carácter. Por supuesto, esto aumenta 2 veces la cantidad de memoria ocupada. Pero dicha tabla de códigos permite la inclusión de hasta 65536 caracteres. La especificación completa del estándar Unicode incluye todos los alfabetos del mundo existentes, extintos y creados artificialmente, así como muchos símbolos matemáticos, musicales, químicos y de otro tipo. Intentemos usar una tabla ASCII para imaginar cómo se verán las palabras en la memoria de la computadora. Representación interna de palabras en la memoria de la computadora.A veces sucede que un texto que consta de letras del alfabeto ruso recibido de otra computadora no se puede leer; se ve una especie de "abracadabra" en la pantalla del monitor. Esto sucede porque las computadoras usan diferentes codificaciones de caracteres para el idioma ruso. Por cierto, en nuestro sitio web puede convertir cualquier texto a código decimal, hexadecimal o binario utilizando la Calculadora de códigos en línea. tabla ASCIIASCII (Código estándar americano para el intercambio de información) Tabla de códigos de caracteres ASCII de Windows (Win-1251)
Popular en la categoría:
|