Mezerník jaký kód znaku. Kódování ASCII (americký standardní kód pro výměnu informací) - základní kódování textu pro latinku
Podle Mezinárodní telekomunikační unie používalo v roce 2016 internet s různou pravidelností tři a půl miliardy lidí. Většinu z nich ani nenapadne, že všechny zprávy, které posílají přes PC nebo mobilní gadgety, stejně jako texty, které se zobrazují na nejrůznějších monitorech, jsou ve skutečnosti kombinace 0 a 1. Tato reprezentace informací se nazývá kódování. Poskytuje a výrazně usnadňuje realizaci jeho ukládání, zpracování a přenosu. V roce 1963 bylo vyvinuto americké kódování ASCII, které je předmětem tohoto článku.
Reprezentace informací v počítači
Z pohledu každého elektronického počítače je text souborem jednotlivých znaků. Patří mezi ně nejen písmena, včetně velkých písmen, ale také interpunkční znaménka, čísla. Kromě toho se používají speciální znaky "=", "&", "(" a mezery.
Soubor znaků, které tvoří text, se nazývá abeceda a jejich počet se nazývá mocnina (označuje se jako N). K jeho určení se používá výraz N = 2^b, kde b je počet bitů nebo informační váha konkrétního znaku.
Je dokázáno, že abeceda s kapacitou 256 znaků umožňuje reprezentovat všechny potřebné znaky.
Protože 256 je 8. mocnina 2, váha každého znaku je 8 bitů.
Měrná jednotka 8 bitů se nazývá 1 bajt, proto je zvykem říkat, že jakýkoli znak v textu uloženém v počítači zabírá jeden bajt paměti.
Jak se provádí kódování
Jakékoli texty se zapisují do paměti osobního počítače pomocí kláves klávesnice, na které se píší čísla, písmena, interpunkční znaménka a další symboly. Přenášejí se do RAM v binárním kódu, to znamená, že každému znaku je přiřazen desetinný kód známý lidem, od 0 do 255, což odpovídá binárnímu kódu - od 00000000 do 11111111.
Kódování znaků bajt po bajtu umožňuje textovému procesoru přistupovat ke každému znaku jednotlivě. Přitom 256 znaků stačí k reprezentaci jakýchkoli znakových informací.
ASCII kódování znaků
Tato zkratka v angličtině znamená kód pro výměnu informací.
Dokonce i na úsvitu komputerizace bylo zřejmé, že můžete přijít s různými způsoby kódování informací. Pro přenos informací z jednoho počítače do druhého však bylo nutné vyvinout jednotný standard. V roce 1963 se tedy ve Spojených státech objevila kódovací tabulka ASCII. V něm je každému symbolu počítačové abecedy přiřazeno jeho pořadové číslo v binárním vyjádření. Zpočátku se kódování ASCII používalo pouze ve Spojených státech a poté se stalo mezinárodním standardem pro PC.
ASCII kódy jsou rozděleny do 2 částí. Pouze první polovina této tabulky je považována za mezinárodní normu. Obsahuje znaky se sériovými čísly od 0 (kódované jako 00000000) do 127 (kód 01111111).
Sériové číslo | ASCII kódování textu | Symbol |
0000 0000 - 0001 1111 | Znaky s N od 0 do 31 se nazývají řídicí znaky. Jejich funkcí je „řídit“ proces zobrazování textu na monitoru nebo tiskárně, vydávání zvukového signálu atp. |
|
0010 0000 - 0111 1111 | Symboly s N od 32 do 127 (standardní část tabulky) jsou velká a malá písmena latinské abecedy, 10. číslice, interpunkční znaménka a také různé závorky, obchodní a jiné symboly. Symbol 32 označuje mezeru. |
|
1000 0000 - 1111 1111 | Znaky s N od 128 do 255 (alternativní část tabulky nebo kódové stránky) mohou mít různé varianty, z nichž každá má své číslo. Kódová stránka se používá k určení národních abeced, které se liší od latinky. Zejména s jeho pomocí se provádí kódování ASCII pro ruské znaky. |
V tabulce jsou kódování velká a následují za sebou v abecedním pořadí a čísla jsou ve vzestupném pořadí. Tento princip je zachován pro ruskou abecedu.
Řídící znaky
Kódovací tabulka ASCII byla původně vytvořena pro příjem a přenos informací přes takové zařízení, které se dlouho nepoužívalo, jako je dálnopis. V tomto ohledu byly do znakové sady zahrnuty netisknutelné znaky, používané jako příkazy k ovládání tohoto zařízení. Podobné příkazy byly použity v takových předpočítačových metodách zasílání zpráv, jako je Morseova abeceda atd.
Nejběžnějším znakem "dálnopisu" je NUL (00, "nula"). Ve většině programovacích jazyků se dodnes používá a označuje znak konce řádku.
Kde se používá kódování ASCII?
Americký standardní kód je potřebný pro více než jen zadávání textových informací na klávesnici. Používá se také v grafice. Zejména v programu ASCII Art Maker představují obrázky různých rozšíření spektrum ASCII znaků.
Takové produkty jsou dvou typů: ty, které plní funkci grafických editorů převodem obrázku na text a převodem „kreseb“ do grafiky ASCII. Například známý emotikon je ukázkovým příkladem kódovacího znaku.
ASCII lze také použít při vytváření dokumentu HTML. V tomto případě můžete zadat určitou sadu znaků a při prohlížení stránky se na obrazovce objeví znak, který odpovídá tomuto kódu.
ASCII je také nezbytné pro vytváření vícejazyčných stránek, protože znaky, které nejsou zahrnuty v konkrétní národní tabulce, jsou nahrazeny kódy ASCII.
Některé funkce
Ke kódování textových informací v kódování ASCII se původně používalo 7 bitů (jeden zůstal prázdný), ale dnes to funguje jako 8bitové.
Písmena umístěná ve sloupcích umístěných nahoře a dole se od sebe liší pouze jedním bitem. To značně snižuje složitost ověřování.
Použití ASCII v Microsoft Office
V případě potřeby lze tento typ kódování textových informací použít v textových editorech společnosti Microsoft, jako je Poznámkový blok a Office Word. Při psaní v takovém případě ale nebude možné některé funkce využít. Nebudete například moci nastavit tučné písmo, protože ASCII pouze zachovává význam informace a ignoruje její obecný vzhled a formu.
Standardizace
Organizace ISO přijala standardy ISO 8859. Tato skupina definuje osmibitové kódování pro různé jazykové skupiny. Konkrétně ISO 8859-1 je Extended ASCII, což je tabulka pro USA a země západní Evropy. A ISO 8859-5 je tabulka používaná pro azbuku, včetně ruštiny.
Z řady historických důvodů byla norma ISO 8859-5 používána velmi krátkou dobu.
Pro ruský jazyk se v současnosti ve skutečnosti používají kódování:
- CP866 (kódová stránka 866) nebo DOS, což je často označováno jako alternativní kódování GOST. Aktivně byl využíván až do poloviny 90. let minulého století. V současné době se prakticky nepoužívá.
- KOI-8. Kódování bylo vyvinuto v 70. a 80. letech 20. století a v současnosti je obecně uznávaným standardem pro e-mailové zprávy v RuNet. Je široce používán v operačních systémech rodiny Unix, včetně Linuxu. „Ruská“ verze KOI-8 se nazývá KOI-8R. Kromě toho existují verze pro další jazyky azbuky, jako je ukrajinština.
- Kódová stránka 1251 (CP 1251, Windows - 1251). Vyvinutý společností Microsoft, aby poskytoval podporu pro ruský jazyk v prostředí Windows.
Hlavní výhodou prvního standardu CP866 bylo zachování pseudografických znaků na stejných pozicích jako v Extended ASCII. To umožnilo běžet beze změny textové programy zahraniční výroby, jako je například známý Norton Commander. V současné době se CP866 používá pro programy vyvinuté pod Windows, které pracují v textovém režimu na celou obrazovku nebo v textových oknech, včetně FAR Manager.
Počítačové texty psané v kódování CP866 jsou v poslední době poměrně vzácné, ale právě to se používá pro ruské názvy souborů ve Windows.
"unicode"
V současné době je toto kódování nejpoužívanější. Kódy Unicode jsou rozděleny do oblastí. První z nich (U+0000 až U+007F) obsahuje znaky ASCII s kódy. Následují oblasti znaků různých národních písem, ale i interpunkčních znamének a technických symbolů. Kromě toho jsou některé kódy "Unicode" vyhrazeny pro budoucí zahrnutí nových znaků.
Nyní víte, že v kódování ASCII je každý znak reprezentován jako kombinace 8 nul a jedniček. Nespecialistům se tyto informace mohou zdát zbytečné a nezajímavé, ale nechcete vědět, co se děje v „mozcích“ vašeho PC?!
[8bitové kódování: ASCII, KOI-8R a CP1251] První kódovací tabulky vytvořené v USA nepoužívaly osmý bit v bajtu. Text byl prezentován jako sekvence bajtů, ale s osmým bitem se nepočítalo (byl použit pro oficiální účely).
Stůl se stal uznávaným standardem. ASCII(Americký standardní kód pro výměnu informací). Prvních 32 znaků ASCII tabulky (00 až 1F) bylo použito pro netisknutelné znaky. Byly určeny k ovládání tiskového zařízení a podobně. Zbytek - od 20 do 7F - jsou běžné (tisknutelné) znaky.
Tabulka 1 - Kódování ASCII
|
|
Jak můžete snadno vidět, v tomto kódování jsou zastoupena pouze latinská písmena a ta, která se používají v angličtině. Jsou zde také aritmetické a další servisní symboly. Ale neexistují žádná ruská písmena nebo dokonce speciální latinská písmena pro němčinu nebo francouzštinu. To se dá snadno vysvětlit – kódování bylo vyvinuto jako americký standard. Když se po celém světě začaly používat počítače, bylo potřeba zakódovat další znaky.
K tomu bylo rozhodnuto použít osmý bit v každém bajtu. Bylo tedy k dispozici 128 dalších hodnot (od 80 do FF), které bylo možné použít ke kódování znaků. První z osmibitových tabulek je „extended ASCII“ ( rozšířené ASCII) - zahrnoval různé varianty latinských znaků používaných v některých jazycích západní Evropy. Měl také další další znaky, včetně pseudografiky.
Pseudografické znaky umožňují zobrazením pouze textových znaků poskytnout určitou podobu grafiky. Pomocí pseudografiky funguje například program pro správu souborů FAR Manager.
V rozšířené ASCII tabulce nebyla žádná ruská písmena. V Rusku (dříve SSSR) a v dalších státech byla vytvořena vlastní kódování, která umožnila reprezentovat specifické „národní“ znaky v 8bitových textových souborech - latinská písmena polského a českého jazyka, azbuka (včetně ruských písmen) a další abecedy.
Ve všech kódováních, která se rozšířila, je prvních 127 znaků (tj. bajtové hodnoty s osmým bitem rovným 0) stejných jako ASCII. Soubor ASCII tedy funguje v kterémkoli z těchto kódování; písmena anglického jazyka jsou zastoupena stejným způsobem.
Organizace ISO(International Standardization Organization - International Organization for Standards) přijala skupinu norem ISO 8859. Definuje 8bitové kódování pro různé skupiny jazyků. ISO 8859-1 je tedy rozšířená ASCII tabulka pro USA a západní Evropu. A ISO 8859-5 je tabulka pro azbuku (včetně ruštiny).
Z historických důvodů se však kódování ISO 8859-5 neujalo. Ve skutečnosti se pro ruský jazyk používají následující kódování:
Kódová stránka 866 ( CP866), je také „DOS“, je také „alternativní kódování GOST“. Široce používané až do poloviny 90. let; nyní v omezeném používání. Pro distribuci textů na internetu se prakticky nepoužívá.
- KOI-8. Vyvinuto v 70. a 80. letech. Je to obecně uznávaný standard pro odesílání poštovních zpráv na ruském internetu. Je také široce používán v operačních systémech rodiny Unix, včetně Linuxu. Verze KOI-8, určená pro ruštinu, se nazývá KOI-8R; existují verze pro jiné cyrilické jazyky (například KOI8-U je varianta pro ukrajinský jazyk).
- Kódová stránka 1251, CP1251, Windows-1251. Vyvinutý společností Microsoft pro podporu ruského jazyka v systému Windows.
Hlavní výhodou CP866 bylo zachování pseudografických znaků na stejných místech jako v Extended ASCII; cizí textové programy, například slavný Norton Commander, tedy mohly fungovat beze změn. CP866 se v současnosti používá pro programy Windows běžící v textových oknech nebo v textovém režimu na celou obrazovku, včetně FAR Manageru.
Texty v CP866 jsou v posledních letech poměrně vzácné (ale používá se ke kódování ruských názvů souborů ve Windows). Proto se zastavíme u dalších dvou kódování - KOI-8R a CP1251.
Jak vidíte, v kódovací tabulce CP1251 jsou ruská písmena uspořádána v abecedním pořadí (s výjimkou písmene YO). Toto uspořádání velmi usnadňuje abecední řazení počítačových programů.
Ale v KOI-8R se pořadí ruských písmen zdá náhodné. Ale ve skutečnosti tomu tak není.
V mnoha starších programech se při zpracování nebo přenosu textu ztrácel 8. bit. (Nyní jsou takové programy prakticky „vymřelé“, ale koncem 80. a začátkem 90. let byly rozšířeny). Chcete-li získat 7bitovou hodnotu od 8bitové hodnoty, stačí odečíst 8 od číslice vyššího řádu; například E1 se změní na 61.
Nyní porovnejte KOI-8R s ASCII tabulkou (tabulka 1). Zjistíte, že ruská písmena jsou v přísném souladu s latinskými. Pokud osmý bit zmizí, změní se malá ruská písmena na velká písmena latinky a velká ruská písmena na malá latinka. Takže E1 v KOI-8 je ruské „A“, zatímco 61 v ASCII je latinské „a“.
KOI-8 vám tedy umožňuje zachovat čitelnost ruského textu se ztrátou 8. bitu. „Ahoj všichni“ se změní na „pRIWET WSEM“.
V poslední době ztratilo rozhodující význam jak abecední pořadí znaků v kódovací tabulce, tak čitelnost se ztrátou 8. bitu. Osmý bit se v moderních počítačích neztrácí ani při přenosu, ani při zpracování. A abecední řazení se provádí s přihlédnutím ke kódování a ne k jednoduchému porovnání kódů. (Mimochodem, kódy CP1251 nejsou úplně abecedně seřazeny - písmeno Y není na svém místě).
Vzhledem k tomu, že existovala dvě běžná kódování, při práci s internetem (pošta, procházení webových stránek) se někdy místo ruského textu zobrazí nesmyslná sada písmen. Například „Jsem SBYFEMHEL“. Jsou to jen slova "s úctou"; ale byly zakódovány v kódování CP1251 a počítač dekódoval text podle tabulky KOI-8. Pokud by stejná slova byla naopak zakódována v KOI-8 a počítač dekódoval text podle tabulky CP1251, výsledek by byl „U HCHBTSEOEN“.
Někdy se stane, že počítač dešifruje ruská písmena a dokonce i podle tabulky, která není určena pro ruský jazyk. Pak se místo ruských písmen objeví nesmyslná sada znaků (například latinská písmena východoevropských jazyků); často se jim říká „krokos“.
Ve většině případů si moderní programy zvládnou určit kódování internetových dokumentů (e-mailů a webových stránek) samy. Někdy však „selhají“ a pak můžete vidět podivné sekvence ruských písmen nebo „krokodýla“. Pro zobrazení skutečného textu v takové situaci zpravidla stačí kódování vybrat ručně v nabídce programu.
Pro článek byly použity informace ze stránky http://open-office.edusite.ru/TextProcessor/p5aa1.html.
Materiál převzatý z webu:
Excel pro Office 365 Word pro Office 365 Outlook pro Office 365 PowerPoint pro Office 365 Publisher pro Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 7 Access One 7 Publisher 2007 Visio 20 Outlook 2007 Visio 20 PowerPoint 20 Office 2007 2010 Visio Standard 2007 Visio Standard 2010 Méně
V tomto článku
Vložení znaku ASCII nebo Unicode do dokumentu
Pokud potřebujete zadat pouze několik speciálních znaků nebo symbolů, můžete použít klávesové zkratky nebo . Seznam znaků ASCII naleznete v následujících tabulkách nebo v článku Vkládání národních abeced pomocí klávesových zkratek .
Poznámky:
Vkládání znaků ASCII
Chcete-li vložit znak ASCII, stiskněte a podržte klávesu ALT při zadávání kódu znaku. Chcete-li například vložit symbol stupně (º), stiskněte a podržte klávesu ALT a poté na numerické klávesnici zadejte 0176.
K zadávání čísel použijte numerickou klávesnici, nikoli čísla na hlavní klávesnici. Pokud potřebujete zadávat čísla na numerické klávesnici, ujistěte se, že svítí indikátor NUM LOCK.
Vkládání znaků Unicode
Chcete-li vložit znak Unicode, zadejte kód znaku a poté postupně stiskněte ALT + X. Chcete-li například vložit znak dolaru ($), zadejte 0024 a postupně stiskněte ALT + X. Všechny kódy znaků Unicode viz .
Důležité: Některé programy sady Microsoft Office, například PowerPoint a InfoPath, nepodporují převod kódů Unicode na znaky. Pokud potřebujete vložit znak Unicode do jednoho z těchto programů, použijte .
Poznámky:
Pokud se po stisknutí ALT+X zobrazí nesprávný znak Unicode, vyberte správný kód a znovu stiskněte ALT+X.
Kromě toho musíte před kód zadat „U+“. Například zadáním „1U+B5“ a stisknutím ALT+X se zobrazí text „1µ“, zatímco zadáním „1B5“ a stisknutím ALT+X se zobrazí znak „Ƶ“.
Použití tabulky symbolů
Tabulka znaků je program zabudovaný do systému Microsoft Windows, který umožňuje zobrazit znaky dostupné pro vybrané písmo.
Pomocí tabulky symbolů můžete zkopírovat jednotlivé znaky nebo skupinu znaků do schránky a vložit je do libovolného programu, který podporuje zobrazení těchto znaků. Otevření tabulky symbolů
V systému Windows 10 Do vyhledávacího pole na hlavním panelu zadejte slovo „symbol“ a z výsledků vyhledávání vyberte tabulku symbolů.
V systému Windows 8 Na domovské obrazovce zadejte slovo „symbol“ a z výsledků vyhledávání vyberte tabulku symbolů.
V systému Windows 7 zmáčknout tlačítko Start, vyberte postupně Všechny programy, Standard, Servis a klikněte tabulka symbolů.
Znaky jsou seskupeny podle písma. Klepnutím na seznam písem vyberte příslušnou znakovou sadu. Chcete-li vybrat symbol, klikněte na něj a poté klikněte na tlačítko Vybrat. Chcete-li vložit symbol, klepněte pravým tlačítkem na požadované místo v dokumentu a vyberte Vložit.
Často používané kódy znaků
Úplný seznam znaků naleznete na počítači v tabulce kódů znaků ASCII nebo v tabulkách znaků Unicode seřazených podle sad .
Glyph |
Glyph |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Peněžní jednotky |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
zákonné symboly |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Matematické symboly |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zlomky |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Interpunkční a dialektové symboly |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Symboly tvarů |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kódy pro běžně používanou diakritikuÚplný seznam glyfů a odpovídajících kódů viz .
|
prosinec | hex | Symbol | prosinec | hex | Symbol | |
000 | 00 | specialista. NOP | 128 | 80 | Ђ | |
001 | 01 | specialista. SOH | 129 | 81 | Ѓ | |
002 | 02 | specialista. STX | 130 | 82 | ‚ | |
003 | 03 | specialista. ETX | 131 | 83 | ѓ | |
004 | 04 | specialista. EOT | 132 | 84 | „ | |
005 | 05 | specialista. ENQ | 133 | 85 | … | |
006 | 06 | specialista. ACK | 134 | 86 | † | |
007 | 07 | specialista. BEL | 135 | 87 | ‡ | |
008 | 08 | specialista. BS | 136 | 88 | € | |
009 | 09 | specialista. TAB | 137 | 89 | ‰ | |
010 | 0A | specialista. LF | 138 | 8A | Љ | |
011 | 0B | specialista. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | specialista. FF | 140 | 8C | Њ | |
013 | 0D | specialista. ČR | 141 | 8D | Ќ | |
014 | 0E | specialista. TAK | 142 | 8E | Ћ | |
015 | 0F | specialista. SI | 143 | 8F | Џ | |
016 | 10 | specialista. DLE | 144 | 90 | ђ | |
017 | 11 | specialista. DC1 | 145 | 91 | ‘ | |
018 | 12 | specialista. DC2 | 146 | 92 | ’ | |
019 | 13 | specialista. DC3 | 147 | 93 | “ | |
020 | 14 | specialista. DC4 | 148 | 94 | ” | |
021 | 15 | specialista. NAK | 149 | 95 | ||
022 | 16 | specialista. SYN | 150 | 96 | – | |
023 | 17 | specialista. ETB | 151 | 97 | — | |
024 | 18 | specialista. UMĚT | 152 | 98 | ||
025 | 19 | specialista. EM | 153 | 99 | ™ | |
026 | 1A | specialista. SUB | 154 | 9A | љ | |
027 | 1B | specialista. ESC | 155 | 9B | › | |
028 | 1C | specialista. FS | 156 | 9C | њ | |
029 | 1D | specialista. GS | 157 | 9D | ќ | |
030 | 1E | specialista. RS | 158 | 9E | ћ | |
031 | 1F | specialista. NÁS | 159 | 9F | џ | |
032 | 20 | spojka SP (vesmír) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Jo | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | AC | ¬ | |
045 | 2D | - | 173 | INZERÁT | | |
046 | 2E | . | 174 | AE | ® | |
047 | 2F | / | 175 | AF | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | jo | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | BA | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | před naším letopočtem | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | BÝT | ѕ | |
063 | 3F | ? | 191 | bf | ї | |
064 | 40 | @ | 192 | C0 | A | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | V | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | E | 197 | C5 | E | |
070 | 46 | F | 198 | C6 | A | |
071 | 47 | G | 199 | C7 | W | |
072 | 48 | H | 200 | C8 | A | |
073 | 49 | já | 201 | C9 | Y | |
074 | 4A | J | 202 | CA | NA | |
075 | 4B | K | 203 | CB | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4D | M | 205 | CD | H | |
078 | 4E | N | 206 | CE | O | |
079 | 4F | Ó | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | Q | 209 | D1 | S | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | Na | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | U | 213 | D5 | X | |
086 | 56 | PROTI | 214 | D6 | C | |
087 | 57 | W | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | W | |
089 | 59 | Y | 217 | D9 | SCH | |
090 | 5A | Z | 218 | DA | Kommersant | |
091 | 5B | [ | 219 | D.B. | S | |
092 | 5C | \ | 220 | DC | b | |
093 | 5 D | ] | 221 | DD | E | |
094 | 5E | ^ | 222 | DE | YU | |
095 | 5F | _ | 223 | D.F. | já | |
096 | 60 | ` | 224 | E0 | A | |
097 | 61 | A | 225 | E1 | b | |
098 | 62 | b | 226 | E2 | PROTI | |
099 | 63 | C | 227 | E3 | G | |
100 | 64 | d | 228 | E4 | d | |
101 | 65 | E | 229 | E5 | E | |
102 | 66 | F | 230 | E6 | a | |
103 | 67 | G | 231 | E7 | h | |
104 | 68 | h | 232 | E8 | A | |
105 | 69 | i | 233 | E9 | čt | |
106 | 6A | j | 234 | EA | Na | |
107 | 6B | k | 235 | EB | l | |
108 | 6C | l | 236 | EU | m | |
109 | 6D | m | 237 | ED | n | |
110 | 6E | n | 238 | EE | Ó | |
111 | 6F | Ó | 239 | EF | P | |
112 | 70 | p | 240 | F0 | R | |
113 | 71 | q | 241 | F1 | S | |
114 | 72 | r | 242 | F2 | T | |
115 | 73 | s | 243 | F3 | na | |
116 | 74 | t | 244 | F4 | F | |
117 | 75 | u | 245 | F5 | X | |
118 | 76 | proti | 246 | F6 | C | |
119 | 77 | w | 247 | F7 | h | |
120 | 78 | X | 248 | F8 | w | |
121 | 79 | y | 249 | F9 | sch | |
122 | 7A | z | 250 | FA | b | |
123 | 7B | { | 251 | s | ||
124 | 7C | | | 252 | FC | b | |
125 | 7D | } | 253 | FD | uh | |
126 | 7E | ~ | 254 | F.E. | Yu | |
127 | 7F | Specialista. DEL | 255 | FF | já |
ASCII tabulka kódů znaků Windows.
Popis speciálních (řídících) znaků
Je třeba poznamenat, že zpočátku byly řídicí znaky ASCII tabulky používány k výměně dat pomocí dálnopisu, vstupu dat z děrné pásky a k nejjednoduššímu ovládání externích zařízení. V současné době již většina řídicích znaků ASCII tabulky tuto zátěž nenese a lze je použít pro jiné účely.
Kód | Popis |
---|---|
NUL, 00 | Nulové, prázdné |
SO-01 | Začátek Okruhu |
STX 02 | Začátek TeXtu, začátek textu. |
ETX 03 | Konec TeXtu |
EOT, 04 | Konec přenosu |
ENQ, 05 | Zeptejte se. Prosím potvrďte |
ACK, 06 | Potvrzení. Potvrzuji |
B.E.L. 07 | Bell, zavolej |
B.S. 08 | Backspace, návrat o jeden znak zpět |
TAB, 09 | Karta, vodorovná karta |
LF, 0A | Line Feed, line feed. Nyní se ve většině programovacích jazyků označuje jako \n |
VT, 0B | Vertical Tab, vertikální tabulka. |
FF, 0C | Zdroj formuláře, zdroj stránky, nová stránka |
ČR, 0D | Návrat vozíku Nyní se ve většině programovacích jazyků označuje jako \r |
TAK, 0E | Shift Out, změňte barvu barvicí pásky v tiskárně |
SI, 0F | Shift In, vrátí barvu barvicí pásky v tiskovém zařízení zpět |
DLE, 10 | Data Link Escape, přepnutí kanálu na přenos dat |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Ovládání zařízení, symboly ovládání zařízení |
N.A.K. 15 | Negativní potvrzení, nepotvrzuji. |
SYN, 16 | synchronizace. Symbol synchronizace |
ETB, 17 | Konec textového bloku, konec textového bloku |
CAN, 18 | Storno, zrušení dříve prošlé |
EM, 19 | Konec média |
SUB, 1A | Náhradník, náhradník. Umístěno na místo znaku, jehož hodnota byla ztracena nebo poškozena během přenosu |
ESC, 1B | Escape escape sekvence |
FS, 1C | Oddělovač souborů, oddělovač souborů |
GS, 1D | Oddělovač skupin, oddělovač skupin |
RS, 1E | Oddělovač záznamů |
USA, 1F | Unit Separator, unit separator |
DEL, 7F | Smazat, smazat poslední znak. |
Každý počítač má svou vlastní znakovou sadu, kterou implementuje. Taková sada obsahuje 26 velkých a malých písmen, číslic a speciálních znaků (tečka, mezera atd.). Symboly při převodu na celá čísla se nazývají kódy. Standardy byly vyvinuty tak, aby počítače měly stejné sady kódů.
standard ASCII
ASCII (American Standard Code for Inmormation Interchange) je americký standardní kód pro výměnu informací. Každý znak ASCII má 7 bitů, takže maximální počet znaků je 128 (tabulka 1). Kódy 0 až 1F jsou řídicí znaky, které se netisknou. K přenosu dat je potřeba mnoho netisknutelných znaků ASCII. Zpráva se může například skládat z počátečního znaku záhlaví SOH, samotného záhlaví a počátečního znaku textu STX, samotného textu a koncového znaku textu ETX a koncového znaku přenosu EOT. Data se však po síti přenášejí v paketech, které samy odpovídají za začátek a konec přenosu. Takže netisknutelné znaky se téměř nepoužívají.
Tabulka 1 - Tabulka kódů ASCII
Číslo | tým | Význam | Číslo | tým | Význam |
---|---|---|---|---|---|
0 | NUL | nulový ukazatel | 10 | DLE | Opuštění přenosové soustavy |
1 | SOH | začátek záhlaví | 11 | DC1 | Správa zařízení |
2 | STX | Začátek textu | 12 | DC2 | Správa zařízení |
3 | ETX | Konec textu | 13 | DC3 | Správa zařízení |
4 | EOT | Konec přenosu | 14 | DC4 | Správa zařízení |
5 | ACK | Žádost | 15 | NAK | Nepotvrzení přijetí |
6 | BEL | Potvrzení přijetí | 16 | SYN | Jednoduchý |
7 | BS | Symbol zvonu | 17 | ETB | Konec bloku přenosu |
8 | HT | Odsadit zpět | 18 | UMĚT | označit |
9 | LF | Vodorovná karta | 19 | EM | Konec médií |
A | VT | Překlad řádků | 1A | SUB | dolní index |
B | FF | Vertikální záložka | 1B | ESC | Výstup |
C | ČR | Překlad stránky | 1C | FS | Oddělovač souborů |
D | TAK | Návrat vozíku | 1D | GS | Oddělovač skupin |
E | SI | Přechod na další registr | 1E | RS | Oddělovač záznamů |
SI | Přechod na standardní registr | 1F | NÁS | Oddělovač modulů |
Číslo | Symbol | Číslo | Symbol | Číslo | Symbol | Číslo | Symbol | Číslo | Symbol | Číslo | Symbol |
---|---|---|---|---|---|---|---|---|---|---|---|
20 | prostor | 30 | 0 | 40 | @ | 50 | P | 60 | . | 70 | p |
21 | ! | 31 | 1 | 41 | A | 51 | Q | 61 | A | 71 | q |
22 | ‘ | 32 | 2 | 42 | B | 52 | R | 62 | b | 72 | r |
23 | # | 33 | 3 | 43 | C | 53 | S | 63 | C | 73 | s |
24 | φ | 34 | 4 | 44 | D | 54 | T | 64 | d | 74 | t |
25 | % | 35 | 5 | 45 | E | 55 | A | 65 | E | 75 | A |
26 | & | 36 | 6 | 46 | F | 56 | PROTI | 66 | F | 76 | proti |
27 | ‘ | 37 | 7 | 47 | G | 57 | W | 67 | G | 77 | w |
28 | ( | 38 | 8 | 48 | H | 58 | X | 68 | h | 78 | X |
29 | ) | 39 | 9 | 49 | já | 59 | Y | 69 | i | 70 | y |
2A | ‘ | 3A | ; | 4A | J | 5A | Z | 6A | j | 7A | z |
2B | + | 3B | ; | 4B | K | 5B | [ | 6B | k | 7B | { |
2C | ‘ | 3C | < | 4C | L | 5C | \ | 6C | l | 7C | | |
2D | — | 3D | = | 4D | M | 5 D | ] | 6D | m | 7D | } |
2E | 3E | > | 4E | N | 5E | — | 6E | n | 7E | ~ | |
2F | / | 3F | G | 4F | Ó | 5F | _ | 6F | Ó | 7F | DEL |
Standard Unicode
Předchozí kódování je skvělé pro angličtinu, ale není vhodné pro jiné jazyky. Například němčina má přehlásky, zatímco francouzština má akcenty. Některé jazyky mají úplně jiné abecedy. Prvním pokusem o rozšíření ASCII byl IS646, který rozšířil předchozí kódování o dalších 128 znaků. Latinská písmena byla přidána s tahy a diakritikou a byla nazvána - Latin 1. Dalším pokusem byl IS 8859 - který obsahoval kódovou stránku. Stále existovaly pokusy o rozšíření, ale nebylo to univerzální. Bylo vytvořeno kódování UNICODE (je 10646). Myšlenkou kódování je přiřadit každému znaku jednu konstantní 16bitovou hodnotu, která se nazývá − ukazatel kódu. Celkem je získáno 65536 ukazatelů. Abychom ušetřili místo, použili jsme Latin-1 pro kódy 0-255, snadno jsme změnili ASII na UNICODE. Tento standard vyřešil mnoho problémů, ale ne všechny. V souvislosti s příchodem nových slov, např. pro japonštinu, je potřeba navýšit počet výrazů o cca 20 tis.. Dále je potřeba povolit Braillovo písmo.