Modely organizace databáze. Základní modely konstrukce databází

Jakákoli databáze odráží informace o konkrétní oblasti. V závislosti na úrovni abstrakce, na které je problémová doména zastoupena, existují různé úrovně datových modelů. Informační datový model je způsob popisu informací obsažených v předmětné oblasti. V následujícím textu budou uvažovány modely strukturovaných dat. Pro tyto modely existují čtyři hlavní úrovně modelů: infologická (konceptuální), datalogická neboli logická, fyzická a úroveň externích modelů.

Popis předmětné oblasti je na první úrovni konstruován tak, aby byl co nejobecnější, nezávisel na vlastnostech následně zvoleného DBMS a informace byly přístupné široké kategorii uživatelů: od zákazníků po systém programátory, kteří na základě tohoto modelu navrhnou databázi. Za tímto účelem jsou analyzovány počáteční informace o předmětu a prezentovány v nějaké formalizované formě. Tento formalizovaný popis předmětné oblasti by měl odrážet její specifika a měl by být použit v dalších fázích návrhu struktury databáze v kontextu vlastností vybrané konkrétní DBMS. Takový formalizovaný popis předmětné oblasti se nazývá infoologický nebo konceptuální model.

Poté je vytvořen model z hlediska konkrétního DBMS vybraného pro návrh databáze. Tato úroveň se nazývá datalogický (logický) model. Popis datalogické struktury databáze v jazyce zvoleného DBMS se nazývá její schéma.

Další úrovní je fyzický datový model. V rámci tohoto modelu jsou určeny metody pro fyzické umístění dat v úložném prostředí a je vypracováno tzv. schéma ukládání dat. Protože různé DBMS mají různé schopnosti a vlastnosti fyzické organizace dat, fyzické modelování se provádí až po vývoji datalogického modelu.

Řada moderních DBMS má schopnost popsat strukturu databáze z pohledu konkrétního uživatele. Tento popis se nazývá externí model. Pro každý typ uživatele vám externí modelování umožňuje vyvinout podschéma databáze na základě potřeb různých kategorií uživatelů. Tento přístup je výhodný z hlediska usnadnění práce uživatelů s databází, protože uživatel může, aniž by věděl o celé struktuře databáze, pracovat pouze s tou její částí, která se ho přímo týká. Mechanismus pro vytváření podschémat navíc slouží jako další prostředek ochrany informací uložených v databázi.

Pokud tedy DBMS podporuje schopnost vytvářet podschémata, pak se architektura databáze stane tříúrovňovou: úroveň schématu úložiště, úroveň schématu a úroveň podschéma.

Podívejme se nyní na hlavní typy datových modelů.

Hierarchický databázový model je jedním z prvních databázových modelů. Je to dáno především tím, že právě tento model nejpřirozeněji odráží vícenásobné vazby mezi objekty reálného světa, kdy jeden objekt vystupuje jako rodič, se kterým je spojeno velké množství podřízených objektů.

Princip hierarchického databázového modelu spočívá v tom, že všechna spojení mezi daty jsou popsána konstrukcí uspořádaného grafu (stromu). Strom je uspořádán podle hierarchie množin prvků nazývaných uzly. Všechny uzly jsou navzájem propojeny větvemi. V tomto případě se pro popis schématu hierarchické databáze používá pojem „strom“ jako specifický datový typ. Tento datový typ je složený a může zahrnovat podtypy nebo podstromy. Databáze je kolekce stromů, z nichž každý se v jazyce hierarchického modelu nazývá fyzická databáze. Každý strom se skládá z jednoho kořenového (hlavního, nadřazeného) typu a přidružené uspořádané sady podřízených (podřízených) typů. Kořenový typ je takový, který má podtypy a žádné nadřazené typy. Dětské typy, které mají stejný rodičovský typ, se nazývají dvojčata. Každý z podřízených typů pro daný kořenový typ může být buď jednoduchý, nebo složený typ „záznamu“.

Existují tři druhy stromů – vyvážené, nevyvážené a binární stromy. Ve vyváženém stromu má každý uzel stejný počet větví. Tato organizace dat je fyzicky nejjednodušší, ale často logická struktura dat vyžaduje proměnný počet větví na každém uzlu, což odpovídá nevyváženému stromu. Binární stromy umožňují maximálně dvě větve na uzel.

Hierarchický databázový model lze tedy interpretovat jako uspořádanou kolekci stromových instancí, z nichž každá obsahuje instance záznamů. Vlastní obsah databáze je uložen v polích záznamů. Záznamové pole je definováno jako nejmenší, nedělitelná jednotka dat.

Při vytváření hierarchického databázového modelu musíte vždy pamatovat na podporu integrity vztahů, což znamená, že:

  • - vždy existuje alespoň jeden nadřazený typ, který může mít libovolný počet podřízených typů;
  • - podřízené typy nemohou existovat bez přítomnosti nadřazeného typu a pro každý podřízený typ v databázi existuje jedna kořenová vrstva;
  • - kořenový typ nemusí mít nutně podřízené typy.

Je třeba poznamenat, že některé zápisy mohou používat odlišnou terminologii. V zápisu American Database Association DBTG (Data Base Task Group) tedy výraz „záznam“ odpovídá výrazu „segment“ a záznam je celá sada záznamů, které patří k jedné instanci „stromu“ typ.

Hlavní výhodou hierarchického databázového modelu je relativně vysoká rychlost zpracování informací při přístupu k datům. Mezi nevýhody patří jeho těžkopádnost v přítomnosti složitých logických vazeb mezi daty.

Síťový databázový model je v jistém smyslu zobecněním hierarchického modelu. Hlavní rozdíl mezi síťovým modelem a hierarchickým je ten, že v síťovém modelu může mít podřízený typ libovolný počet nadřazených typů. Hlavními pojmy síťového modelu jsou množina, agregace, záznam a datový prvek. V tomto případě by datový prvek měl znamenat totéž, co v hierarchickém modelu – minimální jednotku dat. Existují dva typy datových agregátů: vektorový agregát a opakující se skupinový agregát. Agregát typu vektor odpovídá množině datových prvků. Agregát skupiny opakujících se typů odpovídá kolekci datových vektorů. Záznam je sbírka datových agregátů. Každý záznam má specifický typ a skládá se z kolekce instancí záznamů. Množina je graf, který spojuje dva typy záznamů. Sada tedy odráží hierarchický vztah mezi dvěma typy záznamů. Nadřazený typ záznamu v dané sadě se nazývá vlastník sady a podřízený typ záznamu se nazývá člen stejné sady. Pro libovolné dva typy záznamů lze zadat libovolný počet sad, které je spojují. V tomto případě lze mezi těmito dvěma typy záznamů definovat různý počet sad. Stejný typ záznamu však nemůže být zároveň vlastníkem i členem sady.

Nepochybnou výhodou síťového datového modelu je možnost flexibilnějšího zobrazení více spojení mezi objekty. Jedním z nejvýznamnějších nedostatků je vysoká složitost schématu konstrukce databáze, která je zhoršena oslabením kontroly nad integritou spojení kvůli jejich velkému počtu.

Relační datový model je založen na konceptu vztahu, což je dvourozměrná tabulka obsahující mnoho řádků (dvojic) a sloupců (polí nebo atributů). Tabulka odpovídá konkrétnímu objektu předmětové oblasti, její pole popisují vlastnost tohoto objektu a její řádky popisují konkrétní instance objektu. Každá relace musí vždy obsahovat atribut nebo sadu atributů, které jednoznačně identifikují jedinou n-tici této relace – primární klíč. Aby se odrážel vztah mezi objekty, jsou tabulky propojeny podle určitých pravidel pomocí tzv. cizích klíčů, kterým se budeme podrobně věnovat v následujících částech.

Hlavní výhodou relačního modelu je jeho jednoduchost a logická uzavřenost, nevýhodou je však složitost systému pro popis různých vztahů mezi tabulkami.

Vývoj relačního modelu vedl ke vzniku tzv. postrelačního datového modelu, jehož hlavním rozdílem je přípustnost vícehodnotových polí (polí, jejichž hodnoty se skládají z mnoha podhodnot). Vícehodnotová pole lze interpretovat jako nezávislé tabulky vložené do zdrojové tabulky. Postrelační model navíc podporuje více přidružených polí, která dohromady tvoří přidružení: v každém řádku odpovídá první hodnota jednoho přidruženého sloupce prvním hodnotám všech ostatních přidružených sloupců.

Hlavní výhodou postrelačního modelu je, že umožňuje efektivněji ukládat data a počet tabulek v tomto modelu je oproti relačnímu znatelně menší. Nevýhodou je, že je obtížné udržet logickou konzistenci dat.

Teorie vícerozměrných datových modelů se v poslední době aktivně rozvíjí. Pojem vícerozměrný model znamená mnohorozměrnost logické reprezentace struktury informace. Hlavními pojmy vícerozměrného modelu jsou dimenze a buňka.

Dimenze je množina dat stejného typu, která tvoří plochu n-rozměrné krychle. Buňka je pole, jehož hodnota je určena celou sadou měření. Hodnota buňky může být proměnná nebo vzorec.

Pro práci s vícerozměrnými datovými modely se používají speciální vícerozměrné DBMS, které jsou založeny na konceptech agregovatelnosti, historicity a předvídatelnosti. Agregabilita dat se týká různých úrovní zobecnění informací. Historicita dat znamená vysokou úroveň statičnosti jak dat samotných a vazeb mezi nimi, tak i řazení dat v čase při procesu jejich zpracování a prezentace uživatelům. Zajištění předvídatelnosti je dosaženo použitím speciálních prognostických funkcí.

Multidimenzionální DBMS používají dvě schémata organizace dat – polykubický a hyperkubický. V polykubickém modelu mohou mít n-rozměrné krychle jak různé rozměry, tak různé rozměry-plochy. V hyperkubickém modelu jsou všechny rozměry krychlí stejné a rozměry různých krychlí jsou stejné.

Řez je určitá podmnožina n-rozměrné krychle, definovaná fixováním daného počtu rozměrů. Řez má rozměr menší než n a používá se zejména k prezentaci informací uživatelům ve formě čitelných dvourozměrných tabulek. Rotace se také často používá k reprezentaci dat ve dvou dimenzích a zahrnuje změnu pořadí dimenzí. Agregační a rozbalovací operace znamenají obecnější nebo podrobnější prezentaci informací.

Vícerozměrné datové modely jsou vhodné zejména pro práci s velkými databázemi, protože umožňují efektivní zpracování značného množství informací, a to je jejich nepochybná výhoda.

Hlavním rozdílem mezi objektově orientovaným modelem a výše diskutovanými je použití objektově orientovaných metod manipulace s daty – zapouzdření, dědičnost a polyformismus.

Zapouzdření znamená schopnost rozlišit přístup různých programů, aplikací, metod a funkcí (v širším slova smyslu přístup různých kategorií uživatelů) k různým vlastnostem datových objektů. V souvislosti s pojmem „zapouzdření“ se často používá pojem viditelnost – stupeň přístupnosti jednotlivých vlastností objektu. V moderních objektově orientovaných programovacích systémech (jako je Delphi nebo C++ Builder) existují následující úrovně zapouzdření (viditelnosti), které se obvykle nazývají sekce:

  • 1. Sekce Veřejné, Publikované a Automatizované - s drobnými rozlišovacími znaky jsou vlastnosti objektu popsané jako patřící do těchto sekcí plně přístupné.
  • 2. Soukromá sekce – tato sekce ukládá nejpřísnější omezení viditelnosti vlastností objektu. Tyto vlastnosti jsou zpravidla dostupné pouze vlastníkovi tohoto objektu (programovému modulu, ve kterém byl tento objekt vytvořen).
  • 3. Chráněná sekce - na rozdíl od soukromé sekce jsou vlastnosti objektu dostupné dědicům vlastníka objektu.

Na rozdíl od zapouzdření zahrnuje dědičnost úplný přenos všech vlastností nadřazeného objektu na podřízené objekty. V případě potřeby lze dědění vlastností jednoho objektu rozšířit na objekty, které nejsou jeho potomky.

Polymorfismus znamená schopnost stejné aplikace manipulovat s daty různých typů – aplikace (metody, procedury a funkce), které zpracovávají objekty různých typů, mohou mít stejný název.

Hlavní výhodou objektově orientovaných modelů je schopnost modelovat různé složité vztahy mezi objekty.

Určuje aspekt struktury Co logicky představuje databázi, manipulační aspekt určuje metody přechod mezi státy databáze (tj. metody modifikace data) a metody těžba data z databáze, aspekt integrity určuje prostředky popisů správné stavy databází.

Datový model je abstraktní, samostatná, logická definice objektů, operátorů a dalších prvků, které dohromady tvoří abstraktní stroj pro přístup k datům, se kterým uživatel komunikuje. Tyto objekty umožňují modelovat strukturu dat a operátory - chování dat.

V literatuře, článcích a v běžné řeči se termín „datový model“ někdy používá ve smyslu „databázové schéma“ („databázový model“). Toto použití je nesprávné, jak poukázali mnozí autoritativní odborníci, včetně K. J. Date, M. R. Kogalovsky, S. D. Kuzněcov. Existuje datový model teorie nebo modelovací nástroj, zatímco databázový model (databázové schéma) ano výsledek simulace. Podle K. Data je vztah mezi těmito pojmy podobný vztahu mezi programovacím jazykem a konkrétním programem v tomto jazyce.

M. R. Kogalovsky vysvětluje vývoj významu termínu následovně. Zpočátku koncept datové modely používá se jako synonymum datové struktury v konkrétní databázi. V procesu rozvoje teorie databázových systémů získal pojem „datový model“ nový význam. Bylo potřeba termínu, který by označoval nástroj, a ne výsledek modelování, a ztělesňoval by tak mnoho různých databází určité třídy. Ve druhé polovině 70. let začalo mnoho publikací věnovaných těmto problémům používat pro tyto účely stejný termín „datový model“. V současné době je ve vědecké literatuře pojem „datový model“ interpretován v naprosté většině případů v instrumentálním smyslu (jako modelovací nástroj).

Dlouhou dobu se však termín „datový model“ používal bez formální definice. Jedním z prvních specialistů, kteří zcela formálně definovali tento pojem, byl E. Codd. V článku „Datové modely ve správě databází“ definoval datový model jako kombinaci tří komponent:

Viz také

  • Metamodelování
  • Článek Metamodeling na Wikibooks

Poznámky

Literatura

  • Datum K.J.Úvod do databázových systémů. - 8. vyd. - M.: “Williams”, 2006. - 1328 s. - ISBN 0-321-19784-4
  • Kogalovský M. R. Pokročilé technologie informačních systémů. - M.: DMK Press; IT společnost, 2003. - 288 s. - ISBN 5-279-02276-4
  • Kogalovský M. R. Encyklopedie databázových technologií. - M.: Finance a statistika, 2002. - 800 s. - ISBN 5-279-02276-4
  • Tsikritzis D., Lochowski F. Datové modely = D. Tsichritzis, F. Lochovsky. Datové modely. Prentice Hall, 1982. - M.: Finance a statistika, 1985. - 344 s.

Nadace Wikimedia.

2010.

    Podívejte se, co je „Datový model“ v jiných slovnících: datový model

    - Sada pravidel pro generování datových struktur v databázi, operace s nimi a také omezení integrity, která určují přípustná spojení a hodnoty dat a pořadí jejich změn. Poznámka Pro specifikaci datového modelu použijte... ... Datový model - – metoda reprezentace dat informačního modelu ve výpočetním prostředí. [GOST 2.053 2006] Záhlaví: Technologie Záhlaví encyklopedie: Brusná zařízení, Brusiva, Silnice, Automobilová zařízení...

    Podívejte se, co je „Datový model“ v jiných slovnících: Encyklopedie pojmů, definic a vysvětlení stavebních materiálů

    - 3.1.7 datový model (DM): Grafická a/nebo lexikální reprezentace dat, která určuje jejich vlastnosti, struktury a vztahy. [ISO/IEC TR 11404 3:1996, definice 3.2.11] Zdroj... DATOVÝ MODEL - podle GOST 2.053–2006 ESKD „Elektronická struktura produktu“, – způsob prezentace dat informačního modelu ve výpočetním prostředí...

    Správa a archivace záznamů v pojmech a definicích vícerozměrný datový model - Datový model, který pracuje s vícerozměrnými datovými reprezentacemi ve formě datových kostek. Takové datové modely se začaly široce používat v polovině 90. let díky rozvoji technologií OLAP. Provozní možnosti vícerozměrných datových modelů... ...

    Technická příručka překladatele Datový model Světové celní organizace - Datový model, který pracuje s vícerozměrnými datovými reprezentacemi ve formě datových kostek. Takové datové modely se začaly široce používat v polovině 90. let díky rozvoji technologií OLAP. Provozní možnosti vícerozměrných datových modelů... ...

    - Datový model a datový soubor vytvořený ve Světové celní organizaci na základě adresáře obchodních datových prvků Organizace spojených národů (UNTDED) [usnadnění obchodu: anglicko-ruský glosář pojmů (revidované druhé vydání)… …

    - (RMD) logický datový model, aplikovaná teorie konstrukce databází, která je aplikací na problémy zpracování dat takových odvětví matematiky, jako je teorie množin a logika prvního řádu. Relační datový model se používá k vytvoření... ... Wikipedie

    Tento termín má jiné významy, viz ER. Entity relationship model (ERM) je datový model, který umožňuje popisovat koncepční diagramy předmětné oblasti. Model ER se používá, když... ... Wikipedia

    GOST R ISO/IEC 19778-1-2011: Informační technologie. Školení, vzdělávání a školení. Technologie spolupráce. Sdílený pracovní prostor. Část 1: Datový model sdíleného pracovního prostoru- Terminologie GOST R ISO/IEC 19778 1 2011: Informační technologie. Školení, vzdělávání a školení. Technologie spolupráce. Sdílený pracovní prostor. Část 1: Datový model sdíleného pracovního prostoru původní dokument: 5.4.9 AE CE ID... Slovník-příručka termínů normativní a technické dokumentace

knihy

  • Model elektronového plynu a teorie zobecněných nábojů pro popis meziatomových sil a adsorpce, A. M. Dolgonosov. Tato kniha zkoumá čtyři klíčová témata atomové a molekulární fyziky, kvantové a fyzikální chemie: popis atomového elektronového plynu a následující závěr hlavní...

databáze (DB) je soubor vzájemně propojených, vyznačující se možností použití pro velké množství aplikací, schopností rychle získat a upravit potřebné informace, minimální redundancí informací, nezávislostí na aplikačních programech, obecným způsobem řízeného vyhledávání

Možnost využívat databáze pro mnoho uživatelských aplikací zjednodušuje realizaci složitých dotazů, snižuje redundanci uložených dat a zvyšuje efektivitu využívání informačních technologií. Hlavní vlastností databází je nezávislost na datech a programech, které je využívají. Datová nezávislost znamená, že změna dat nemění aplikační programy a naopak.

Jádrem každé databáze je datový model. - Sada pravidel pro generování datových struktur v databázi, operace s nimi a také omezení integrity, která určují přípustná spojení a hodnoty dat a pořadí jejich změn. Poznámka Pro specifikaci datového modelu použijte... ... je soubor datových struktur a operací jejich zpracování.

Databázové modely jsou založeny na moderním přístupu ke zpracování informací, což znamená, že datové struktury jsou relativně stabilní. Struktura informační báze, která zobrazuje informační model předmětové oblasti ve strukturované podobě, umožňuje vytvářet logické záznamy, jejich prvky a vztahy mezi nimi. Vztahy lze rozdělit do následujících hlavních typů:

– „one to one“, kdy lze propojit jeden záznam
pouze s jedním záznamem;

– „one to many“, kdy je jeden záznam propojen s mnoha dalšími;

– „many to many“, kdy stejný záznam může vstupovat do vztahů s mnoha jinými záznamy různými způsoby.

Použití jednoho nebo druhého typu vztahu určilo tři hlavní databázové modely: hierarchický, síťový a relační.

Pro vysvětlení logické struktury hlavních databázových modelů zvažte tento jednoduchý úkol: je nutné vyvinout logickou strukturu databáze pro ukládání dat o třech dodavatelích: P 1, P 2, P 3, kteří mohou dodávat zboží T 1, T 2 , T 3 v těchto kombinacích: dodavatel P 1 - všechny tři druhy zboží, dodavatel P 2 - zboží T 1 a T 3, dodavatel P 3 - zboží T 2 a T 3.

Hierarchický model je prezentována ve formě stromového grafu, ve kterém jsou objekty rozlišeny úrovněmi podřízenosti (hierarchie) objektů (obr. 4.1.)

Rýže. 4.1. Hierarchický databázový model

Na horní, první úrovni jsou informace o objektu „dodavatelé“ (P), na druhé - o konkrétních dodavatelích P 1, P 2, P 3, na nižší, třetí úrovni - o zboží, které mohou dodávat konkrétní dodavatelů. V hierarchickém modelu je třeba dodržovat následující pravidlo: každý podřízený uzel nemůže mít více než jeden nadřazený uzel (pouze jedna příchozí šipka); ve struktuře může být pouze jeden nevygenerovaný uzel (bez příchozí šipky) - kořen. Uzly, které nemají vstupní šipky, se nazývají listy. Uzel je integrován jako záznam. Pro nalezení požadovaného záznamu je třeba přejít od kořene k listům, tzn. shora dolů, což značně zjednodušuje přístup.

Výhodou hierarchického datového modelu je, že umožňuje popsat jejich strukturu, a to jak na logické, tak na fyzické úrovni. Nevýhodou tohoto modelu jsou rigidně pevné vztahy mezi datovými prvky, v důsledku čehož jakékoli změny v propojení vyžadují změny ve struktuře a také striktní závislost fyzické a logické organizace dat. Rychlosti přístupu v hierarchickém modelu je dosaženo na úkor ztráty informační flexibility (při jednom průchodu stromem nelze získat informace o tom, kteří dodavatelé dodávají např. produkt Ti).

Hierarchický model používá mezi datovými prvky typ vztahu jedna k mnoha. Pokud se použije vztah mnoho k mnoha, pak se dospěje k síťovému datovému modelu.

Síťový model Databáze pro úlohu je prezentována ve formě schématu zapojení (obr. 5.2.). Diagram znázorňuje nezávislé (hlavní) datové typy P 1, P 2, P 3, tzn. informace o dodavatelích a závislých - informace o zboží T 1, T 2 a T 3. V síťovém modelu jsou povoleny jakékoli typy spojení mezi záznamy a počet zpětnovazebních spojení není nijak omezen. Je ale třeba dodržet jedno pravidlo: vztah zahrnuje hlavní a závislý záznam

Rýže. 4.2. Síťový databázový model

Výhodou síťového databázového modelu je větší informační flexibilita oproti hierarchickému modelu. Společný nedostatek pro oba modely však zůstává - poměrně rigidní struktura, která brání rozvoji informační základny systému řízení. Pokud je potřeba často reorganizovat informační základnu (např. při použití přizpůsobených základních informačních technologií), používá se nejpokročilejší databázový model - relační, ve kterém nejsou rozdíly mezi objekty a vztahy.

V relační model databází jsou vztahy mezi datovými prvky reprezentovány ve dvourozměrných tabulkách nazývaných vztahy. Vztahy mají následující vlastnosti: každý prvek tabulky představuje jeden datový prvek (neexistují žádné opakující se skupiny); prvky sloupce jsou stejné povahy a sloupce jsou jednoznačně pojmenovány; v tabulce nejsou dva stejné řádky; řádky a sloupce lze prohlížet v libovolném pořadí, bez ohledu na jejich informační obsah.

Výhodou relačního databázového modelu je jednoduchost logického modelu (tabulky jsou společné pro prezentaci informací); flexibilita bezpečnostního systému (pro každý vztah lze specifikovat legálnost přístupu); nezávislost na datech; schopnost vybudovat jednoduchý jazyk pro manipulaci s daty pomocí matematicky přesné teorie relační algebry (algebry vztahů).

Pro výše uvedený problém o dodavatelích a zboží bude logická struktura relační databáze obsahovat tři tabulky (relace): R 1, R 2, R 3, sestávající postupně ze záznamů o dodávkách, o zboží a o dodávkách zboží dodavateli. (Obr. 4.3.)



Rýže. 4.3. Relační databázový model

DBMS a jeho funkce

Systém správy databází (DBMS) je softwarový systém určený k vytvoření obecné databáze na počítači, která se používá k řešení mnoha problémů. Tyto systémy slouží k udržování databáze v aktuálním stavu a poskytují efektivní uživatelský přístup k údajům v ní obsaženým v mezích práv udělených uživatelům.

DBMS je navržen pro centralizovanou správu databází ve prospěch každého, kdo v tomto systému pracuje.

Podle stupně univerzálnosti se rozlišují dvě třídy DBMS:

– systémy pro všeobecné použití;

– specializované systémy.

Univerzální DBMS nejsou zaměřeny na žádnou tematickou oblast nebo informační potřeby žádné skupiny uživatelů. Každý systém tohoto druhu je implementován jako softwarový produkt schopný fungovat na určitém modelu počítače ve specifickém operačním systému a je dodáván mnoha uživatelům jako komerční produkt. Takové DBMS mají prostředky pro jejich konfiguraci pro práci s konkrétní databází. Použití univerzálního DBMS jako nástroje pro vytváření automatizovaných informačních systémů založených na databázové technologii může výrazně zkrátit dobu vývoje a ušetřit pracovní síly. Tyto DBMS mají vyvinutou funkcionalitu.

Specializované DBMS se vytvářejí ve vzácných případech, kdy je nemožné nebo nevhodné použít univerzální DBMS.

General-purpose DBMS jsou komplexní softwarové systémy určené k provádění celého souboru funkcí spojených s tvorbou a provozem databáze informačního systému.

V současnosti používané DBMS mají funkce zajišťující integritu dat a robustní zabezpečení, což vývojářům umožňuje zajistit větší zabezpečení dat s menším úsilím při programování na nízké úrovni. Produkty pracující v prostředí WINDOWS se vyznačují uživatelskou přívětivostí a vestavěnými nástroji pro produktivitu.

Výkon DBMS je hodnocen:

– doba realizace požadavku;

– rychlost vyhledávání informací v neindexovaných polích;

– doba provádění operací importu databáze z jiných formátů;

– rychlost vytváření indexů a provádění hromadných operací, jako je aktualizace, vkládání, mazání dat;

– maximální počet paralelních přístupů k datům ve víceuživatelském režimu;

– čas generování zprávy.

Výkon DBMS je ovlivněn dvěma faktory:

– DBMS, které monitorují integritu dat, nesou dodatečnou zátěž, kterou jiné programy nezaznamenají;

– Výkon proprietárních aplikačních programů velmi závisí na správném návrhu a konstrukci databáze.


Související informace.


Jsou tři hlavní modely databází- jedná se o hierarchické, síťové a relační. Tyto modely se liší ve způsobu, jakým vytvářejí vztahy mezi daty.

8.1. Hierarchický databázový model

Hierarchické modely databáze byly historicky jedny z prvních, které se objevily. Informace v hierarchické základně je organizován podle principu stromové struktury ve formě „předků“. potomek". Každý." záznam může mít maximálně jeden rodičovský záznam a několik dětí. Vztahy mezi záznamy jsou implementovány jako fyzické ukazatele z jednoho záznamu na druhý. Hlavní nevýhoda hierarchická struktura databáze- neschopnost realizovat vztahy" mnoho-k-mnoho“, stejně jako situace, kdy záznam má několik předků.

Hierarchické databáze. Hierarchické databáze lze graficky znázornit jako převrácené strom, skládající se z objektů různých úrovní. Vyšší úroveň ( kořen stromu) bere jeden objekt, druhý - objekty druhé úrovně a tak dále.

Mezi objekty existují spojení, každý z nich objekt může zahrnovat několik objektů nižší úrovně. Takové objekty jsou ve vztahu k předkovi ( objekt, blíže ke kořenu) k dítěti ( objekt nižší úroveň), zatímco objekt-předek nemusí mít žádné potomky nebo jich mít několik, zatímco objekt-potomek má nutně jen jednoho předka. Předměty, které mají společného předka, se nazývají dvojčata.

Rýže. 6. Hierarchická databáze

Uspořádání dat v DBMS hierarchický typ je definován jako: prvek, agregát, záznam (skupina), skupina postoj, databáze.

Atribut(datová položka)

Nejmenší jednotka datové struktury.

Obvykle je každému prvku v popisu databáze přiřazen jedinečný název. Při zpracování se na něj odkazuje tímto názvem. Datový prvek se také často nazývá pole.

Záznam Pojmenovaná kolekce atributů. Použití záznamů umožňuje získat nějakou logicky propojenou sadu dat jedním přístupem do databáze. Jsou to záznamy, které se mění, přidávají a mažou. Typ záznamu je určen složením jeho atributů.

Záznam instance

- - konkrétní záznam s konkrétním významem prvků. Skupinový postoj

hierarchický vztah mezi záznamy dvou typů. Nadřazený záznam (vlastník skupinového vztahu) se nazývá zdrojový záznam a podřízené záznamy (členové skupinového vztahu) se nazývají podřízené záznamy. Hierarchická databáze může ukládat pouze takové stromové struktury.

Příklad. Zvažte následující model podnikových dat (viz obrázek 7): podnik se skládá z oddělení, ve kterých pracují zaměstnanci. Každé oddělení může mít více zaměstnanců, ale zaměstnanec nemůže pracovat ve více než jednom oddělení. Proto pro

manažerský informační systém

zaměstnanců, je třeba vytvořit skupinový vztah skládající se z rodičovského záznamu ODDĚLENÍ (NÁZEV_ODDĚLENÍ, POČET ZAMĚSTNANCŮ) a podřízeného záznamu ZAMĚSTNANEC (PŘÍJMENÍ, POZICE, PLAT). Tento vztah je znázorněn na Obr.

7(a) (Pro zjednodušení předpokládáme, že existují pouze dva podřízené záznamy). Pro automatizaci účtování smluv se zákazníky je nutné vytvořit další hierarchickou strukturu: zákazník - smlouvy s ním - zaměstnanci podílející se na práci na zakázce.:

Tento strom bude obsahovat záznamy ZÁKAZNÍK (JMÉNO ZÁKAZNÍKA, ADRESA), SMLOUVA (ČÍSLO, DATUM, ČÁSTKA), DODAVATEL (PŘÍJMENÍ, POZICE, NÁZEV_ODDĚLENÍ) (obr. 7b). Rýže. 7. Příklad hierarchické databáze Tento příklad ukazuje nevýhody hierarchického uspořádání DB Částečně duplikované informace mezi ZAMĚSTNANCEM a VYKONAVATEL

(takové záznamy se nazývají párové) a in hierarchický datový model postoj není poskytnuto

podpora zápasy mezi párovými záznamy. může se účastnit více než jedné smlouvy (tj spojení typ M:N). V tomto případě musíte do databáze zadat další skupinu postoj, ve kterém Tento příklad ukazuje nevýhody hierarchického uspořádání bude zdrojovým záznamem a CONTRACT bude podřízeným záznamem (obr. 7 c). Jsme tedy opět nuceni informace duplikovat.

Hierarchická struktura předpokládá nerovnost mezi daty – některá jsou přísně podřízena jiným. Takové struktury samozřejmě jasně splňují požadavky mnoha, ale ne všech skutečných problémů.

Typy databázových modelů

DBMS používají různé datové modely. Nejstarší systémy lze rozdělit na hierarchické a síťové databáze – jedná se o předrelační modely.

Hierarchický model

V hierarchický model prvky jsou organizovány do struktur vzájemně propojených hierarchickými nebo stromovými vztahy. Nadřazený prvek může mít více podřízených prvků. Ale podřízený prvek může mít pouze jednoho předka.

« Systém správy informací» ( Systém správy informací) z IMB je příkladem hierarchického DBMS.

Hierarchický model organizuje data ve formě stromu s hierarchií nadřazených a podřízených segmentů. Tento model implikuje možnost existence identických ( převážně dceřiné společnosti) prvky. Zde jsou data uložena v řadě záznamů s připojenými poli hodnot. Model shromažďuje všechny instance konkrétního záznamu jako „typy záznamů“ – ty jsou ekvivalentní tabulkám v relačním modelu a jednotlivé záznamy jsou sloupce tabulky. K vytvoření vztahů mezi typy záznamů používá hierarchický model vztahy jako " rodič-dítě» typ 1:N. Toho je dosaženo použitím stromové struktury – ta je „vypůjčena“ z matematiky, podobně jako teorie množin používaná v relačním modelu.

Hierarchické databázové systémy

Vezměme si to jako příklad hierarchický datový model organizace, která uchovává informace o svém zaměstnanci: jméno, číslo zaměstnance, oddělení a plat. Organizace může také uchovávat informace o jeho dětech, jejich jménech a datech narození.

Data o zaměstnanci a jeho dětech tvoří hierarchickou strukturu, kde informace o zaměstnanci jsou nadřazeným prvkem a informace o dětech jsou podřízeným prvkem. Pokud má zaměstnanec tři děti, pak budou tři děti přidruženy k rodičovskému prvku. V hierarchické databázi je vztah " rodič-dítě“ je vztah jeden k mnoha. To znamená, že podřízený prvek nemůže mít více než jednoho předka.

Hierarchické databáze jsou populární od konce 60. let, kdy IBM představila svůj Information Management System DBMS. Hierarchický diagram se skládá z typů záznamů a " rodič-dítě»:

  • Záznam je sbírka hodnot polí.
  • Záznamy stejného typu jsou seskupeny do typů záznamů.
  • Vztah rodič-dítě je vztah 1:N mezi dvěma typy záznamů.
  • Hierarchické databázové schéma se skládá z několika hierarchických schémat.

Síťový model

V datovém modelu sítě nadřazený prvek může mít více potomků a podřízený prvek může mít více předků. Záznamy v tomto modelu jsou propojeny seznamy s ukazateli. IDMS(" Integrovaný systém správy dat") od společnosti Computer Associates International Inc.- příklad síťového DBMS.

Hierarchický model strukturuje data ve formě stromu záznamů, kde je jeden nadřazený prvek a několik potomků. Síťový model umožňuje, aby více předků a potomků vytvořilo mřížkovou strukturu.

Síťový model umožňuje přirozeněji modelovat vztahy mezi prvky. Přestože byl tento model široce používán v praxi, nikdy se nestal dominantním ze dvou hlavních důvodů. Za prvé, IBM se rozhodla neopustit hierarchický model v rozšířeních svých produktů, jako jsou IMS a DL/I. Za druhé, po nějaké době byl nahrazen relačním modelem, který nabízel deklarativní rozhraní vyšší úrovně.

Popularita síťového modelu se shodovala s popularitou hierarchického modelu. Některá data je mnohem přirozenější modelovat s více předky pro jedno dítě. Síťový model umožnil modelovat vztahy many-to-many. Jeho standardy byly formálně definovány v roce 1971 na konferenci o jazycích systémů zpracování dat ( CODASYL).

Hlavní prvek datový model sítě- sada, která se skládá z typu záznamu vlastníka, názvu sady a typu záznamu člena. Podřízený záznam („záznam člena“) může plnit svou roli ve více než jedné sadě. V souladu s tím je podporován koncept více rodičů.

Záznam vyšší úrovně ("záznam vlastníka") může být také "členem" nebo "vlastníkem" v jiných sadách. Datový model je jednoduchá síť, propojení, typy průniku záznamů ( v IDMS se nazývají junction records, tedy „křížové záznamy). A také sety, které je umí kombinovat. Kompletní síť je tedy reprezentována několika párovými množinami.

V každém z nich je jeden typ záznamu "vlastník" ( spojení „šipka“ se od něj odchyluje) a jeden nebo více typů záznamů jsou „členové“ ( ukazuje na ně šipka). Obvykle je v sadě poměr 1:M, ale je povolen i poměr 1:1. Datový model sítě CODASYL je založen na matematické teorii množin.

Známé síťové databáze:

  • TurboIMAGE;
  • IDMS;
  • vestavěný RDM;
  • Server RDM.

Relační model

V relačním modelu, na rozdíl od hierarchického nebo síťového modelu, neexistují žádné fyzické vztahy. Všechny informace jsou uloženy ve formuláři tabulky (vztahy) skládající se z řádků a sloupců. A data dvou tabulek jsou propojena společnými sloupci, nikoli fyzickými odkazy nebo ukazateli. Pro manipulaci s datovými řadami existují speciální operátory.

Na rozdíl od ostatních dvou typů DBMS, v relačních datových modelech není potřeba prohlížet všechny ukazatele, což usnadňuje provádění dotazů pro získávání informací ve srovnání se síťovými a hierarchickými DBMS. To je jeden z hlavních důvodů, proč se relační model ukázal jako pohodlnější. Běžné relační DBMS: Oracle, Sybase, DB2, Ingres, Informix a MS-SQL Server.

« V relačním modelu jsou oba objekty a jejich vztahy reprezentovány pouze tabulkami a ničím jiným.».

RDBMS je systém pro správu relačních databází založený na relačním modelu E. F. Codda. Umožňuje definovat strukturální aspekty dat, zpracování vztahů a integritu. V takové databázi je informační obsah a vztahy v něm prezentovány ve formě tabulek - souborů záznamů se společnými poli.

Relační tabulky mají následující vlastnosti:

  • Všechny hodnoty jsou atomické.
  • Každý řádek je jedinečný.
  • Pořadí sloupců není důležité.
  • Pořadí řádků není důležité.
  • Každý sloupec má svůj jedinečný název.

Některá pole lze definovat jako klíčová pole. To znamená, že pro urychlení hledání konkrétních hodnot bude použito indexování. Když pole ve dvou různých tabulkách přijímají data ze stejné sady, můžete použít operátor JOIN k výběru souvisejících záznamů ze dvou tabulek porovnáním hodnot polí.

Pole budou mít často stejný název v obou tabulkách. Například tabulka „Objednávky“ může obsahovat dvojice „ID zákazníka“ a „kód produktu“. A v tabulce „Produkt“ mohou být dvojice „kód produktu“ a „cena“. Pro výpočet účtenky pro konkrétního kupujícího je tedy nutné sečíst cenu veškerého jím zakoupeného zboží pomocí JOIN v polích „kód produktu“ těchto dvou tabulek. Tyto akce lze rozšířit na kombinování více polí ve více tabulkách.

Vzhledem k tomu, že vztahy jsou zde určeny pouze dobou vyhledávání, jsou relační databáze klasifikovány jako dynamické systémy.

Porovnání tří modelů

První datový model, hierarchický, má stromovou strukturu („ rodič-dítě"), a podporuje pouze vztahy jeden k jednomu nebo jeden k mnoha. Tento model umožňuje rychlý sběr dat, ale postrádá flexibilitu. Někdy role prvku ( rodič nebo dítě) je nejasný a nezapadá do hierarchického modelu.

Druhý, datový model sítě, má flexibilnější strukturu než hierarchickou a podporuje vztahy “ mnoho pro mnoho" Ale rychle se to stane příliš složité a nepohodlné na správu.

Třetí model – relační – je flexibilnější než hierarchický a snáze se řídí než síťový. Relační model je dnes nejpoužívanějším modelem.

Objekt v relačním modelu je definován jako pozice informace uložené v databázi. Objekt může být hmotný nebo nehmotný. Příkladem hmotné entity může být zaměstnanec organizace a příkladem nehmotné entity zákaznický účet. Objekty jsou definovány atributy - informační zobrazení vlastností objektu. Tyto atributy jsou také známé jako sloupce a skupina sloupců je také známá jako řádek. Sérii lze také definovat jako instanci objektu.

Objekty jsou spojeny vztahy, jejichž hlavní typy lze definovat takto:

"jeden k jednomu"

V tomto typu vztahu je jeden objekt spojen s druhým. Například, Manažer -> Oddělení.

Každý manažer může mít pouze jedno oddělení a naopak.

"Jeden k mnoha"

V datových modelech vztah jednoho objektu k několika. Například, Zaměstnanec -> Oddělení.

Každý zaměstnanec může být pouze v jednom oddělení, ale oddělení může mít více zaměstnanců.

"Mnoho k mnoha"

V daném okamžiku může být objekt spojen s jakýmkoli jiným. Například, Zaměstnanec -> Projekt.

Zaměstnanec se může účastnit několika projektů a každý projekt může zahrnovat několik zaměstnanců.

V relačním modelu jsou objekty a jejich vztahy reprezentovány dvourozměrným polem nebo tabulkou.

Každá tabulka představuje objekt.

Každá tabulka se skládá z řádků a sloupců.

Vztahy mezi objekty jsou reprezentovány sloupci.

Každý sloupec představuje atribut objektu.

Hodnoty sloupců se vybírají z oblasti nebo sady všech možných hodnot.

Sloupce, které se používají k propojení objektů, se nazývají klíčové sloupce. Existují dva typy klíčů – primární a cizí.

Primární se používají k jednoznačné definici objektu. Cizí klíč je primární klíč jednoho objektu, který existuje jako atribut v jiné tabulce.

Výhody relačního datového modelu:

  1. Snadné použití.
  2. Flexibilita.
  3. Datová nezávislost.
  4. Bezpečnost.
  5. Snadné praktické použití.
  6. Slučování dat.
  7. Integrita dat.

nedostatky:

  1. Redundance dat.
  2. Špatný výkon.

Jiné databázové modely (OODBMS)

V poslední době se na trhu DBMS objevují produkty s objektově a objektově orientovanými datovými modely, jako je Gem Stone a Versant DBMS. Výzkum probíhá také v oblasti vícerozměrných a logických datových modelů.

Vlastnosti objektově orientovaných systémů pro správu databází (OODBMS):

  • Díky integraci funkcí databáze s objektově orientovaným programovacím jazykem je výsledkem objektově orientovaný DBMS.
  • OODBMS představuje data jako objekty v jednom nebo více programovacích jazycích.
  • Takový systém musí splňovat dvě kritéria: musí to být DBMS a musí být objektově orientovaný. To znamená, že by měl co nejvíce odpovídat moderním objektově orientovaným programovacím jazykům. První kritérium zahrnuje: dlouhodobé ukládání dat, správa sekundárního úložiště, paralelní přístup k datům, schopnost obnovy a podpora ad hoc dotazů. Druhé kritérium zahrnuje: komplexní objekty, identitu objektu, zapouzdření, typy nebo třídy, mechanismus dědičnosti, přepisování v kombinaci s dynamickou vazbou, rozšiřitelnost a výpočetní úplnost.
  • OODBMS poskytují možnost modelovat data jako objekty.

Stejně jako podpora tříd objektů a dědění vlastností a metod tříd podtřídami a jejich objekty.




Nahoru