Na prenos sa používa Xml. Súbor XML: Čo je to a ako ho otvoriť? Čo je to formát XML, na čo slúži a kde sa používa

Na operačnej sále systém Windows Väčšina programov ukladá svoje nastavenia do registra. Na ukladanie parametrov aplikácie sa však často používajú aj špeciálne súbory, ktoré sa zvyčajne nachádzajú priamo v adresároch s spustiteľné súbory alebo v podpriečinkoch. Konfiguračné súbory môžu mať rôzne formáty, vrátane formátu XML, ktorý je predmetom tohto krátkeho článku.

Čo je to formát XML, na čo slúži a kde sa používa

Po pravde, ciele, pre ktoré bol formát XML vytvorený (objavil sa v roku 1996), boli takpovediac globálne. XML alebo eXtensible Markup Language, ktorý sa prekladá ako „rozšíriteľný značkovací jazyk“, bol vyvinutý ako prostriedok na poskytovanie interoperability na prenos štruktúrovaných údajov medzi rôznymi softvérové ​​systémy, najmä tie, ktoré sa používajú na internete. Tento jazyk je natoľko univerzálny, že XML súborom rozumejú aj nekompatibilné aplikácie rôznych operačných systémov, čo samozrejme značne zjednodušuje úlohu programátorov pri výmene informácií medzi softvérovými platformami.

Okrem toho sa XML aktívne používa v dizajne webových stránok. Niekedy sa propaguje ako pokročilejší a všestrannejší analóg hypertextového značkovacieho jazyka HTML, ale tieto jazyky v skutočnosti slúžia na iné účely. HTML je primárne zodpovedné za zobrazovanie údajov, zatiaľ čo XML bol navrhnutý na prenos a ukladanie týchto údajov. XML sa používa aj na vytváranie nových internetových jazykov. Mimochodom, mnohým známy RSS, ktorý sa používa pri distribúcii prostredníctvom spravodajských kanálov, je založený práve na XML.

Programy na otváranie a prezeranie súborov vo formáte XML

Zistili sme, o aký formát XML ide, teraz sa pozrime, ako s ním pracovať. Po pravde, potrebe upravovať súbory XML zvyčajne čelia vývojári a správcov systému, ale stále predpokladajme, že rovnaká potreba vznikla aj pre vás. Ako otvoriť súbor XML? Vo všeobecnosti ho môžete zobraziť pomocou ľubovoľného textového editora, dokonca aj programu Poznámkový blok, ale na tieto účely je oveľa pohodlnejšie použiť špeciálne programy.

Poznámkový blok++

Ak hľadáte niečo na otváranie XML, skúste Poznámkový blok++– univerzálny textový editor určený na vytváranie a úpravu kódu. Ľahký, rýchly a jednoduchý, je ideálny pre prácu so všetkými typmi konfiguračné súbory. Editor podporuje zvýrazňovanie syntaxe, zmenu kódovania, je tu zabudované výkonné vyhľadávanie rôznych parametrov, jedným slovom všetkého, čo programátor a nielen on potrebuje.

XMLPad

Na rozdiel od programu Notepad++ XMLPad je vysoko špecializovaný editor. To je presne to, čo môžete a mali by ste použiť na otvorenie formátu XML, pretože bol vytvorený špeciálne pre prácu so súbormi tohto typu. Okrem prezerania a úpravy dokumentov XML podporuje editor XMLPad validáciu a kontrolu dokumentov, konverziu na DTD, import údajov z HTML a mnoho ďalších. Ako sa očakávalo, aplikácia má podporu syntaxe a nástroj na vyhľadávanie a nahradzovanie. Jednou z funkcií programu je prítomnosť vstavaného mini-prehliadača na otváranie odkazov na URL.

Pre tých, ktorí to s učením webových jazykov myslia vážnejšie, vieme ponúknuť pokročilý a zároveň jednoduchý a pohodlný XML editor na platforme Java. Program podporuje tvorbu a úpravu súborov XML, XSL, XSD a DTD, má tiež zabudovaný prevodník na skripty, debugger XSLT a XQuery, nástroje na prácu s vizuálnymi diagramami XML a mnoho ďalších komponentov. Nevýhody - program je platený a nepodporuje ruský jazyk.

XML Marker

Dobrým spôsobom, ako otvoriť súbor XML, je použiť jednoduchý editor XML Marker. Nie je taký sofistikovaný ako Oxygen XML Editor, ale dobre si poradí s väčšinou úloh, ktorým používateľ čelí pri práci so súbormi XML. Nechýba znázornenie stromovej štruktúry dokumentu s možnosťou rýchlej navigácie na vybrané riadky podľa značiek, pohodlná navigácia a kompletná sada nástrojov na prácu s textovými údajmi. Nevýhodou programu je, že neexistuje ruský jazyk.

Prehliadače

Je tu ešte jeden najjednoduchším spôsobom, ako čítať XML súbor, tu však hovoríme len o čítaní. Otvoriť v Google Chrome alebo akýkoľvek iný prehliadač Nová karta a pretiahnite súbor XML do okna prehliadača. Dokument bude prezentovaný v štruktúrovanej forme, so zvýraznením syntaxe, všetko tak, ako má byť.

Prezerajte si súbory XML online

S dokumentmi XML môžete pracovať nielen pomocou desktopových programov, ale je tiež jednoduché otvoriť XML online. Tu sú dva jednoduché online editory, ktoré by ste mali zvážiť.

XmlGrid

Jednoducho vyzerajúci, ale celkom funkčný online editor súborov XML, dostupný na xmlgrid.net. Služba podporuje vytváranie, úpravu, overovanie a konverziu dokumentov XML a navyše má funkciu navrhovania máp stránok. Kód upraveného súboru je možné vložiť do webového formulára zo schránky, prostredníctvom adresy URL alebo nahraním samotného dokumentu na server. Obsah súboru sa zobrazí ako dátová tabuľka, v ktorej je každé pole samostatnou bunkou.

XML EDITOR

Súbor XML môžete otvoriť aj online pomocou online editora XML, ktorý je súčasťou balíka aplikácií TutorialsPoint, jedného z najväčších vzdelávacích zdrojov. Ak chcete službu používať, prejdite na stránku www.tutorialspoint.com, kliknite na odkaz „Nástroje“ v hornej časti stránky, v zozname webových aplikácií nájdite XML EDITOR a otvorte ho. Uvidíte jednoduché okno textový editor s dvoma stĺpcami. Ľavá je miesto, kde sa píše a upravuje kód, pravá zobrazuje stromovú štruktúru dokumentu. Súbor môžete do editora nahrať buď zo svojho počítača, alebo z ľubovoľnej webovej stránky zadaním adresy URL.

Jazyk XML už pritiahol pomerne veľkú pozornosť vývojárov a používateľov internetu. Počet prívržencov tejto novej technológie dnes rastie rovnako rýchlo ako počet správ o ďalších prekážkach, ktoré prekonala na ceste k všeobecnému uznaniu. Napriek tomu, že XML je veľmi mladé (medzinárodná organizácia W3C schválila špecifikáciu „Extensible Markup Language (XML) 1.0“ o niečo menej ako pred rokom – začiatkom februára 1998) a jednotlivé komponenty tohto jazyka sa stále finalizujú, nová Jazyky sa už dnes objavujú, vytvorené na základe XML, vznikajú početné webové servery, ktoré využívajú túto technológiu na organizáciu informácií, ktoré sú na nich uložené. Internetový svet okolo nás sa opäť mení a my sa dnes môžeme stať účastníkmi tohto procesu

Účelom tohto článku je pokúsiť sa na konkrétnych príkladoch ukázať niektoré možnosti XML a zodpovedať množstvo otázok, ktoré sa často vynárajú pri spoznávaní nového jazyka. Čo je to XML? Aké sú jeho výhody oproti jazyku HTML, ktorý už poznáme? Môžete dnes používať XML na svojich webových stránkach? A ak je to možné, tak ako?

Na konci článku sú odkazy na ďalšie internetové zdroje, pomocou ktorých môžete tiež získať kompletnejšie informácie o konkrétnych otázkach, ktoré vás zaujímajú, ktoré súvisia s používaním XML a ktoré nie sú nami zahrnuté v tomto článku. Kompletné špecifikácie pre XML a súvisiace jazyky sú dostupné na oficiálnej stránke W3C -

Na čo je to potrebné nový jazyk značenie?

Oveľa jednoduchšie a pohodlnejšie ako SGML vám jazyk HTML umožňuje určiť dizajn prvkov dokumentu a má určitú obmedzenú sadu pokynov - značiek, pomocou ktorých sa vykonáva proces označovania. Inštrukcie HTML sú primárne určené na riadenie procesu zobrazovania obsahu dokumentu na obrazovke klientskeho programu a tým určujú spôsob prezentácie dokumentu, nie však jeho štruktúru. Prvok hypertextovej databázy, popísaný pomocou HTML, je textový súbor, ktorý možno jednoducho prenášať po sieti pomocou protokolu HTTP. Táto funkcia, ako aj skutočnosť, že HTML je otvorený štandard a veľké množstvo používateľov má možnosť využiť možnosti tohto jazyka na navrhovanie svojich dokumentov, určite ovplyvnili rast popularity HTML a urobili z neho dnes hlavný mechanizmus prezentácie informácií na webe

Moderné aplikácie však vyžadujú nielen jazyk na prezentáciu údajov na obrazovke klienta, ale aj mechanizmus, ktorý umožňuje určiť štruktúru dokumentu a popísať prvky, ktoré obsahuje. HTML má jednoduchú sadu príkazov a celkom úspešne sa vyrovná s úlohou opísať textové informácie a zobraziť ich na obrazovke prehliadača. Samotné zobrazené údaje však nijako nesúvisia so značkami, ktoré sa používajú na formátovanie, takže programy na analýzu nemajú možnosť použiť značky HTML na nájdenie fragmentov dokumentu, ktoré potrebujeme. Tie. keď ste sa stretli napríklad s takýmto popisom

ruža,

divák bude vedieť, akú farbu má zobraziť text obsiahnutý v značkách a pravdepodobne ho zobrazí správne, ale je úplne ľahostajné, kde v dokumente sa tento tag nachádza, v akých ďalších tagoch ​​je aktuálny fragment uzavretý, či fragmenty v ňom vnorené existujú alebo či sú vzťahy medzi objektmi vytvorené správne. Táto „ľahostajnosť“ k štruktúre dokumentu vedie k tomu, že vyhľadávanie alebo analyzovanie informácií v ňom sa nebude líšiť od práce so súvislým dokumentom, ktorý nie je rozdelený na prvky. textový súbor. A to, ako viete, nie je najefektívnejší spôsob práce s informáciami.

Ďalšou významnou nevýhodou HTML je obmedzená sada jeho značiek. Pravidlá DTD pre HTML definujú pevnú množinu deskriptorov a preto vývojár nemá možnosť zadávať svoje vlastné, špeciálne značky. Aj keď sa z času na čas objavia nové jazykové rozšírenia (dodnes, najnovšie HTML verzia je HTML 4.0), no dlhá cesta ich štandardizácie sprevádzaná neustálymi nezhodami medzi hlavnými výrobcami prehliadačov takmer znemožňuje rýchle prispôsobenie jazyka a jeho použitie na zobrazovanie špecializovaných informácií (napríklad multimediálne, matematické, chemické vzorce, atď.).

Aby sme zhrnuli všetko, čo bolo povedané, možno tvrdiť, že HTML dnes úplne nespĺňa požiadavky kladené modernými vývojármi na jazyky tohto druhu. A nahradil ho nový hypertextový značkovací jazyk, výkonný, flexibilný a zároveň pohodlný jazyk XML. Aké sú jeho výhody?

XML ( Rozšíriteľný značkovací jazyk) je značkovací jazyk, ktorý popisuje celú triedu dátových objektov nazývaných dokumenty XML. Tento jazyk sa používa ako prostriedok na popis gramatiky iných jazykov a na kontrolu správnosti dokumentov. Tie. Samotný XML neobsahuje žiadne značkovacie značky, jednoducho definuje poradie, v ktorom sú vytvorené. Ak teda napríklad uvažujeme, že ide o označenie prvku ruža dokument musí používať značku ;, potom nám XML umožňuje voľne používať značku, ktorú definujeme, a do dokumentu môžeme zahrnúť fragmenty, ako sú tieto:

ruža

Sada štítkov sa dá ľahko rozšíriť. Ak, predpokladajme, chceme tiež naznačiť, že popis kvetu by mal zmysluplne ísť do popisu skleníka, v ktorom kvitne, potom jednoducho nastavíme nové značky a zvolíme poradie, v akom sa objavia:

ruža

Ak tam chceme zasadiť niekoľko ďalších kvetov, musíme urobiť nasledujúce zmeny:

ruža tulipán kaktus

Ako môžete vidieť, proces vytvárania dokumentu XML je veľmi jednoduchý a vyžaduje od nás iba základné znalosti HTML a pochopenie úloh, ktoré chceme vykonávať pomocou XML ako značkovacieho jazyka. To dáva vývojárom jedinečnú schopnosť definovať vlastné príkazy, ktoré im umožňujú najefektívnejšie definovať údaje obsiahnuté v dokumente. Autor dokumentu vytvára jeho štruktúru, vytvára potrebné spojenia medzi prvkami pomocou tých príkazov, ktoré spĺňajú jeho požiadavky, a dosahuje typ označenia, ktorý potrebuje na vykonávanie operácií prezerania, vyhľadávania a analýzy dokumentu.

Ďalšou zjavnou výhodou XML je možnosť použiť ho ako univerzálny dopytovací jazyk pre informačné úložiská. Dnes sa v hlbinách W3C uvažuje o pracovnej verzii štandardu XML-QL (alebo XQL), ktorý sa môže v budúcnosti stať vážnou konkurenciou SQL. Okrem toho môžu dokumenty XML fungovať ako jedinečný spôsob ukladania údajov, ktorý zahŕňa prostriedky na analýzu informácií a ich prezentáciu na strane klienta. V tejto oblasti je jednou z perspektívnych oblastí integrácia technológií Java a XML, čo umožňuje využiť silu oboch technológií pri budovaní strojovo nezávislých aplikácií, ktoré využívajú aj univerzálny formátúdajov pri výmene informácií.

XML tiež umožňuje kontrolovať správnosť údajov uložených v dokumentoch, kontrolovať hierarchické vzťahy v rámci dokumentu a stanoviť jednotný štandard pre štruktúru dokumentov, ktorých obsahom môžu byť rôzne údaje. To znamená, že sa dá použiť na stavbu komplexu informačné systémy, v ktorej je veľmi dôležitá otázka výmeny informácií medzi rôznymi aplikáciami bežiacimi na rovnakom systéme. Vytvorením štruktúry mechanizmu výmeny informácií na samom začiatku práce na projekte sa manažér môže v budúcnosti ušetriť od mnohých problémov spojených s nekompatibilitou dátových formátov používaných rôznymi komponentmi systému.

Jednou z výhod XML je aj to, že programy na spracovanie dokumentov XML nie sú zložité a všetky druhy softvérových produktov určených na prácu s dokumentmi XML sa už objavili a sú voľne šírené. XML je dnes podporované v Internet spoločnosti Microsoft Explorer 4/0 a v beta verziách IE5. Bolo oznámené, že bude podporovaný v nasledujúcich verziách aplikácií Netscape Communicator, Oracle DBMS, DB-2 a MS-Office. To všetko dáva dôvod predpokladať, že s najväčšou pravdepodobnosťou sa v blízkej budúcnosti XML stane hlavným jazykom výmeny informácií pre informačné systémy, čím nahradí HTML. Známe špecializované značkovacie jazyky ako SMIL, CDF, MathML, XSL už boli vytvorené na báze XML a zoznam pracovných návrhov nových jazykov, ktoré W3C zvažuje, neustále rastie.

Ako vyzerá XML dokument?

najprv Po druhé pododsek 1 Po tretie Posledný

Pravidlá pre vytváranie XML dokumentu

RuskoNovosibirsk</country>

Jazykové konštrukcie

Dátové prvky

ruža Novosibirsk ruža Novosibirsk Sibír Štátna technická univerzita v Novosibirsku
veľmi dobrý inštitút Štátna univerzita v Novosibirsku
tiež nie zlé

Zoberme si technológiu používania XML na prenos údajov na server.

Už sme sa pozreli na 2 spôsoby prenosu údajov na server: obyčajný text s oddeľovačom a JSON. Ale majú nevýhody:

  • Nedostatok dátových typov. JSON má iba reťazec, číslo, null, boolean. Tie. obmedzený súbor údajov.
  • Je ťažké kontrolovať integritu prenášaných údajov.
  • Náročné na vizualizáciu údajov, napr. zložité objekty je ťažké zobraziť, napr html formulár kód.
  • Ťažko transformovateľné dáta, t.j. Je ťažké transformovať vlastnosti jedného objektu na vlastnosti iného objektu.

Teraz sa obráťme na XML ako metódu prenosu údajov. XML(eXtensible Markup Language) je značkovací jazyk určený na popis, ukladanie a prenos štruktúrovaných údajov. Dnes sa XML používa všade.

Existuje mnoho technológií založených na XML: DOM (programová interakcia s dátami), XLink (ukazovatele a odkazy), XPath (popis a výber prvkov), XSL, XSLT (transformácia XML dokumentov).

Analýza balíka XML vyzerá takto:

//XMLHttpRequest objekt var req= getXmlHttpRequest (); //Inštalácia obslužného programu req. onreadystatechange= funkcia () ( if (req. readyState== 4 ) ( //stav "4 - dokončené" var xml= req. responseXML; ))

Tu dokonca nemusíte robiť serializáciu a deserializáciu. Robí to samotný objekt. Akonáhle server odošle XML dáta, sú už v parsovanej forme (responseXML - model dokumentu DOM). Prečítajte si viac o technológii DOM v predchádzajúcich článkoch na stránke.

Niekedy kvôli ladeniu potrebujete serializovať a deserializovať údaje XML (pre prenos údajov na server sa to robí automaticky, nemusíte to robiť manuálne). Poďme serializovať do reťazca:

//pre IE var str = dom. xml //pre Firefox var serializer = new XMLSerializer (); var str = serializátor. serializeToString(dom);

Pre IE je pracovný kód kratší, pretože má už zabudovaný objekt na serializáciu, zatiaľ čo v iných prehliadačoch sa objekt XMLSerializer na serializáciu iba zobrazuje.

Pri práci s XML dátami sa väčšinou zaoberáme DOM modelom dokumentu. Preto stojí za to pripomenúť si niektoré aspekty DOM (prečítajte si o tom v predchádzajúcich článkoch). Dovoľte mi pripomenúť vám spôsoby prístupu k prvku DOM modelu:

//koreňový prvok var root = xmlDOM. documentElement; //prvý prvok v kolekcii var kniha = koreň. childNodes[ 0 ]; //podradený prvok var titul = kniha. childNodes[ 0 ]; //prvkový textový uzol alert(title. firstChild. nodeValue);

Môžete tiež vybrať prvky rovnakého typu z modelu DOM modelu dokumentu. Pozor! Neexistujú žiadne funkcie getElemensById, pretože v XML môže id znamenať čokoľvek, nielen identifikátor, preto sa nepoužíva.

//výber všetkých prvkov jednou značkou var books = xmlDOM. getElementsByTagName("kniha");

XML sa tiež aktívne využíva nielen na reprezentáciu dát, ale aj na výmenu dát v serverovo orientovanej architektúre. Ide o prístup, v ktorom predstavujeme komplexnú aplikáciu nie ako klasickú klient-server aplikáciu, ale ako súbor služieb, z ktorých každá je zodpovedná za svoje úlohy. A každá služba má vstupné body (interakčné body). Nie je tu jasný klient, pretože... jedna služba môže byť klientom inej služby. Ukazuje sa, že ide o distribuovanú technológiu. Existuje niekoľko prístupov k budovaniu takýchto technológií – vzdialené volanie procedúr, SOAP.

Aby mohli služby rôznych klientov komunikovať, musia hovoriť rovnakým jazykom (nezáleží na tom, ktorým operačný systém v servise). A takýto jazyk bol vyvinutý a nazývaný RPC.

XML-RPC protokol

RPC(Remote Procedure Call) - vzdialené volanie procedúry. Toto je protokol pre interakciu medzi dvoma vzdialenými bodmi. Umožňuje bodu „a“ volať funkciu na vzdialenom bode „b“.

Existuje niekoľko implementácií protokolu RPC. Pozrime sa na implementáciu založenú na XML.

Klient a server si v podstate jednoducho vymieňajú nejaké fragmenty XML.

XML-RPC poskytuje nasledujúce typyúdaje:

  • boolovská hodnota.
  • celé číslo.
  • dvojitý.
  • reťazec.
  • Dátum Čas.
  • základ 64.
  • pole.
  • štrukturovať.
  • nulový.

Tie. Pri odovzdávaní určitého typu údajov musíte deklarovať, o aký typ údajov ide. Štruktúra je podobná objektu JSON.

Konverzia údajov XML

Na transformáciu údajov prijatých zo servera vo forme XML sa používa XSLT.

XSLT(eXtendable Stylesheet Language Transformation) je technológia, ktorá vám pomáha prijímať XML ako vstup a vytvárať čokoľvek chcete ako výstup.

Konverzia XSLT na javaScript - IE

var dom = new ActiveXObject("MSXML2.DOMDocument"); dom. async = nepravda; dom var xsl = new ActiveXObject(" [chránený e-mailom]" ); xsl. async = false; xsl. load ("my.xsl" ); //samotná transformácia var vysledok = dom. transformNode(xsl);

Previesť XSLT na JavaScript pre Firefox. Ghrome, Opera

var xslStylesheet; var xsltProcessor var myXMLHTTPRequest = mew XMLHttpRequest(); myXMLHTTPRequest. open("GET" , "example.xsl" , false); myXMLHTTPRequest. send(null); //získať xml xslStileshett = myXMLHTTPRequest. responseXML; xsltProcessor myXMLHTTPRequest = new XMLHttpRequest(); myXMLHTTPRequest. open("GET" , "example.xml" , false); myXMLHTTPRequest. send(null); //samotná transformácia var xmlSource = myXMLHTTPRequest. responseXML; var resultDocument = xsltProcessor. transformToDocument(xmlSource); Prečo je tento XML potrebný?

[V poslednej dobe v súvislosti s výskytom týchto stránok najčastejšie
Otázka pre mňa znela: „Povedz mi, prečo je to vôbec potrebné, XML?
Nestačí nám HTML? „Keďže nemám veľa času (alebo inteligencie;) na prípravu vlastných publikácií, a tiež hlboko rešpektujúc klasiku, radšej som rýchlo preložil vynikajúci článok o titule subj
- možno toto je prvá epizóda seriálu "na pomoc"]

Jon Bosak, Tim Bray
XML a web druhej generácie
z Scientific American, máj 1999

Dajte ľuďom pár tipov a na zvyšok prídu sami. Pri pohľade na stránku, kde sú väčšie bloky textu rozdelené na menšie, každému rýchlo dôjde, že toto je začiatok článku. Pri pohľade na zoznam potravín rýchlo uhádnete, že ide o „pokyny“ na návštevu obchodu. Keď vidíte stĺpce s číslami, chápete, že ide o bankový účet. Počítače ešte nie sú také chytré – toto všetko im treba presne sprostredkovať – s čím presne sa musia vysporiadať a čo sa od nich na to vyžaduje.

Na tento účel – aby sa informácie mohli popísať samy – bol vynájdený nový značkovací jazyk dokumentov – Extensible Markup Language (XML). Tieto ľahko vysloviteľné zmeny („samopopísaný“ dokument, zmena pravidiel komunikácie s počítačmi) majú obrovský potenciál – úloha internetu z média na poskytovanie informácií sa začína rozširovať aj na iné typy ľudskej činnosti. Od schválenia W3C v roku 1998 totiž špecifikácia XML začala prenikať všade ako blesk – do priemyslu a vedy, do výroby tovaru a medicíny.

Nadšenci dúfali, že XML poskytne príležitosť vyriešiť množstvo globálnych problémov webu. Tieto problémy sú známe: po prvé, internet, super rýchla sieť, sa často správa horšie ako korytnačka; a po druhé, hoci sú takmer všetky informácie dostupné na internete, je často až šialene ťažké nájsť tam niečo potrebné.

Oba tieto problémy sú spôsobené najmä povahou hlavného jazyka webu – HTML. A hoci je úspech HTML v porovnaní s inými jazykmi elektronického publikovania, ktoré boli kedy navrhnuté, zrejmý, HTML je príliš riedke: v podstate iba hovorí prehliadaču, ako umiestniť text, obrázky a tlačidlá na stránku. HTML sa zameriava na prezentáciu informácií, a preto sa dá pomerne ľahko naučiť, ale stojí to za to.

To sa odráža v zložitosti vývoja webových stránok, pokiaľ tieto stránky nemajú byť ako faxy, ktoré posielajú stránky každému, kto o to požiada. Viac ako polovica ľudí a spoločností na celom svete by uprednostnila webové stránky, ktoré môžu prijímať objednávky od používateľov, odosielať diagnózy chorôb a dokonca vykonávať jemné inštrumentálne operácie v továrňach a vedeckých laboratóriách. Takéto úlohy HTML _NIKDY_ nečelilo!.

Napríklad, aj keď váš lekár dokáže „extrahovať“ testy z vašej zdravotnej karty do svojho prehliadača, je nepravdepodobné, že ich bude môcť poslať cez sieť inému špecialistovi, aby vložil prijatú odpoveď späť do svojho prehliadača. databázy. Jeho počítač nevie, čo má robiť s informáciami, ktoré sú mu jasné

včela včela

alebo včela včela.
Legendárny Kernighan raz poznamenal, že celý trik princípu WYSIWYG (čo vidím, to dostanem) spočíva v tom, že keď nič nevidíte, zvyčajne sa vám podarí získať presne rovnakú sumu.

Slová uvedené vyššie, ktoré sú uzavreté v lomených zátvorkách, sa nazývajú značky. V HTML nie je žiadna značka na analýzu, a preto jeho ďalšia nevýhoda: nepružnosť. Pridanie novej značky do jazyka je taká byrokratická byrokratická záťaž, taká zdĺhavá, že sa s tým nikto nebude trápiť. Ale bolo by fajn, keby mal každý program svoje značky, nielen tú v príklade s lekárom.

To do značnej miery vysvetľuje súčasné pomalé tempo vytvárania internetových obchodov, zásielkových katalógov a iných interaktívnych stránok. Ak zmeníte počet jednotiek objednávky a spôsob dopravy a v poli „suma“ uvidíte niekoľko zmenených čísel, stále musíte požiadať vzdialený (už prepracovaný) server, aby vám poslal späť kompletnú novo vygenerovanú stránku s grafikou a všetko ostatné. Zatiaľ čo svoje vlastné výkonný počítač bude nečinne stáť, pretože sa práve naučil niečo ako

A , ale nie ceny s možnosťami doručenia.

Pridajte k tomu nízku kvalitu možností vyhľadávania na webe. Keďže neexistuje žiadny spôsob, ako konkrétne označiť informácie o cene, je to absolútne nemožné vyhľadávanie na webe stránky na základe "ceny".


Niečo staré, niečo nové

Riešenie je v princípe jednoduché: značky musia označovať, o aký druh informácie ide, a nie ako by mala vyzerať. Napríklad komponenty objednávky košele označte značkami „cena, veľkosť, množstvo, farba“ a nie „tučné, odsek, riadok, stĺpec“, ako to navrhuje HTML. Potom je pre program jednoduchšie identifikovať dokument ako objednávku a urobiť zvyšok práce: zobrazte túto objednávku v tej či onej forme, vložte ju do účtovného systému alebo sa uistite, že vám nová košeľa bude doručená až k dverám. ďalší deň.

my, pracovná skupina W3C už v roku 1996 začalo s vývojom takéhoto projektu. Nápad to bol silný, aj keď nie úplne originálny. Po celé generácie redaktori a tlačiari označovali ručne písané texty sadzačskými značkami. Tento „značkovací jazyk“ sa vyvíjal samostatne až do roku 1986, kedy ako výsledok desaťročnej práce Medzinárodná organizácia pre normalizáciu (ISO) zaviedla systém na vytváranie nových značkovacích jazykov.

Tento jazyk na popis jazyka – metajazyk – nazývaný SGML (Standard Generalized Markup Language), preukázal svoju užitočnosť v mnohých veľkých publikačných systémoch. A dokonca aj HTML dostalo svoju definíciu prostredníctvom SGML. Jediným problémom SGML bolo, že bol všežravý - bolo tam veľa šikovných vecí na minimalizáciu stlačenia klávesov, keďže v tom čase sa rátal každý bajt. Preto s ním dnes webové prehliadače nefungujú dobre.

Pri vytváraní XML naša pracovná skupina zbavila SGML šupiek a navrhla vysoko cielený a stráviteľný metajazyk. Základňa XML je súbor pravidiel, podľa ktorých si každý môže vytvoriť svoj vlastný značkovací jazyk. Tieto pravidlá sú zvolené tak, aby si jeden malý program (nazývaný aj syntaktický analyzátor alebo syntaktický analyzátor) dokázal poradiť s rozpoznaním akéhokoľvek nového jazyka. Pozrime sa ešte raz na príklad lekára, ktorý by chcel testy preniesť na špecialistu. Ak by si zdravotníci vytvorili svoj vlastný značkovací jazyk z XML na kódovanie lekárskych poznámok (niekoľko skupín na probléme pracovalo už dlho), potom by správa od lekára jeho kolegovi mohla obsahovať niečo ako


<имя пациента>bla bla
<аллергия на лекарство>bla bla bla

V tomto nastavení už nie je ťažké napísať program pre ľubovoľný počítač tak, aby rozpoznal tieto štandardizované lekárske záznamy a mohol vkladať do tohto doslova životne dôležitého dôležitá informácia do vašej databázy.

Tak ako HTML bolo navrhnuté tak, aby umožnilo komukoľvek čítať internetové dokumenty, XML nám dáva esperanto, ktoré môže čítať a písať ktokoľvek, napriek množstvu nekompatibilných platforiem. Áno, aj z pohľadu bežného človeka má XML väčšiu sémantickú záťaž (na rozdiel od iných dátových formátov), ​​pretože v ňom nie je nič, čo by vyzeralo ako nečitateľný text.

Sila všestrannosti XML pochádza z minimálneho súboru dobre zvolených pravidiel. Po prvé, značky vždy tvoria pár a obklopujú text, na ktorý sú aplikované, hranatými zátvorkami. Po druhé, párové značky môžu byť vnorené do seba ako úvodzovky, čo vám umožňuje vytvárať zložité viacúrovňové štruktúry.

Pravidlo vnorenia automaticky presadzuje jednoduchosť v akomkoľvek dokumente XML a vytvára štruktúru známu v informatike ako strom. Podobne ako v rodokmeni, každý grafický alebo textový prvok dokumentu je otec, syn alebo brat (rodič, dieťa, súrodenec) nejakého iného prvku a tento vzťah je vždy jedinečný. Stromy samozrejme nepopisujú celú škálu dátových štruktúr, ale pokrývajú väčšinu typických prípadov používania počítača. Okrem toho sú stromy mimoriadne výhodné pre programátorov. Nie je problém napísať malý kúsok kódu na preobjednanie transakcií alebo zobraziť úplne zrozumiteľnú účtenku, keď je účtenka znázornená ako strom.

Druhým zdrojom univerzálnej sily XML je jeho spoliehanie sa na nový štandard Unicode je kódovací systém, ktorý umožňuje mixovanie textu vo všetkých hlavných jazykoch sveta. Naopak, v HTML, ako vo väčšine textových procesorov, môže byť dokument spravidla iba v jednom konkrétnom jazyku, bez ohľadu na to, v ktorom z nich je angličtina, japončina alebo arabčina.
A ak program nepozná kódovanie určitého jazyka, môžete zabudnúť na dokument (v HTML). Môže to byť horšie: napríklad kvôli nejednotnosti kódovania programy napísané na Taiwane často nedokážu prečítať texty zamerané na pevninskú Čínu. V prípade XML, ak s ním program vie správne pracovať, zvládne akúkoľvek kombináciu kódovania. XML teda umožňuje nielen výmenu údajov medzi rôznymi počítačovými platformami, ale umožňuje aj prekonávanie národných a kultúrnych bariér.


Koniec celosvetového čakania

S nástupom XML by mal byť web oveľa citlivejší. Dnes všetko, čo dokážu počítačové zariadenia na internete nezáleží na tom, či ide o výkonné stolové počítače alebo vreckové organizéry, nie je to nič iné, ako dostať formulár cez „GET“, vyplniť ho a potom ho poslať tam a späť na webový server, kým sa nedokončí práca s formulárom . XML nám dáva možnosť preniesť štruktúru a sémantiku dát do formulára, a preto budú všetky tieto zariadenia schopné vykonávať základné spracovanie v na správnom mieste a okamžite. To nielen zníži zaťaženie serverov, ale malo by to viesť aj k výraznému zníženiu sieťovej prevádzky.

Pre ilustráciu si predstavte, že by ste 4. júla pomocou internetovej cestovnej kancelárie našli let z Londýna do New Yorku. S najväčšou pravdepodobnosťou uvidíte zoznam niekoľkonásobne dlhší, než sa zmestí na obrazovku. Tento zoznam je možné skrátiť nastavením presnejších parametrov ako je čas odletu, cena či letecká spoločnosť, no v tomto prípade jednoducho „nahráte“ server cestovnej kancelárie svojou požiadavkou a musíte čakať na odpoveď. Ak vám však bol tento dlhý zoznam letov poskytnutý vo formáte XML, kancelária by ho mohla doplniť malým Java appletom, pomocou ktorého môžete okamžite a jednoducho triediť a filtrovať nepotrebné lety bez toho, aby ste sa museli uchýliť k akejkoľvek interakcii. so serverom. Vynásobte to miliónmi používateľov webu a celkový efekt je pôsobivý.

Čím viac online informácií je označených značkami XML špecifickými pre dané odvetvie, tým ľahšie bude nájsť to, čo hľadáte. Internetové vyhľadávanie „práce pre obchodníka s cennými papiermi“ vás dnes zavalí lavínou inzerátov, no o práci ich bude asi len málo – väčšina práce je ukrytá na bezplatných nástenkách novinových stránok, ktoré vyhľadávajú roboty neradi pracujú s. A teraz Newspaper Association of America vytvára svoj vlastný reklamný značkovací jazyk v XML, ktorý sľubuje, že proces vyhľadávania bude oveľa efektívnejší.

Nevadí, ak je to len medzikrok. Knihovníci už dávno poznajú spôsoby, ako niečo rýchlo nájsť – nepozeraním sa do dokumentov, ale do ich kompaktných kľúčových popisov, ktoré poukazujú len na samotné zdroje. Ide totiž o katalógy so vzorom vo forme čitateľských preukazov. Takéto informácie o informáciách sa nazývajú „metaúdaje“.

Dôležitú úlohu preto v projekte XML od samého začiatku dostalo vytvorenie sprievodného metadátového štandardu. Februárový rámec popisu zdrojov (RDF) by mal hrať rovnakú úlohu ako indexové karty pre knihy z knižnice pre informácie na webe. Keďže sa metadáta RDF šíria po webe, vyhľadávanie bude oveľa rýchlejšie a relevantnejšie, ako je v súčasnosti. Na webe nie sú žiadni knihovníci, ale každý webmaster chce, aby sa jeho stránka dala ľahko nájsť, takže očakávame, že keď ľudia objavia jej silu, RDF bude mať obrovský vplyv na internet.

Samozrejme, informácie sa dajú získať aj bez hľadania. Koniec koncov, web je hypertext – miliardy stránok prešpikovaných hypertextovými odkazmi – tými podčiarknutými slovami, na ktoré stačí kliknúť, aby ste sa dostali na inú stránku. V XML je mechanizmus hypertextových odkazov tiež výrazne vylepšený. Špecifikácia prepojenia XML s názvom XLink, ktorú W3C pripravuje do konca roka, umožní používateľovi vybrať si z viacerých destinácií. Iný typ hypertextového odkazu vám umožní prijať text alebo obrázok priamo v mieste kliknutia, čo umožní návštevníkovi neopustiť stránku.

Snáď najužitočnejšou časťou XLink bude časť špecifikácie, ktorá umožňuje autorom uchýliť sa k nepriamym odkazom a namiesto samotných stránok posielať do akejsi súhrnnej databázy. Ak teda autor zmenil adresu stránky, jednoduchou úpravou jedného záznamu v takejto databáze je ľahké aktualizovať všetky odkazy vedúce na jeho stránku. To vám pomôže zbaviť sa čoraz bežnejších správ „Súbor 404“. Nenájdené“, čo znamená „prerušený“ odkaz.

Kombinácia efektívnejšieho spracovania, presnejšieho vyhľadávania a flexibilnejšieho prepojenia spôsobí revolúciu v štruktúre webu a otvorí úplne nové spôsoby prístupu k informáciám. Pre používateľov bude táto nová sieť výrazne rýchlejšia, výkonnejšia a užitočnejšia ako dnešná sieť.


Potrebná spolupráca

Samozrejme, nie všetko je také jednoduché. XML umožňuje komukoľvek vytvoriť nový jazyk vlastným spôsobom, ale vytvárať dobrý jazyk- úloha, ktorej náročnosť netreba podceňovať. Prísť s jazykom je len začiatok: je naivné očakávať, že význam vašich značiek bude pre ostatných zrejmý, kým neposkytnete príručku k jazyku, a že bude jasný pre počítače, kým nenapíšete programy, ktoré fungujú. so značkami jazyka.

Nie je ťažké vysvetliť, prečo je to tak. Ak by všetko, čo bolo potrebné na to, aby sa počítač naučil spracovávať objednávky, boli tagy, XML by nebolo potrebné. Nebola by núdza ani o programátorov, keďže počítače sú dosť inteligentné na to, aby si všetko robili sami.

Prečo potrebujeme XML nie je mágia, ale efektivita. XML stanovuje základné pravidlá, ktoré zjednodušujú detaily programovania v jednej vrstve – aby sa ľudia s podobnými záujmami mohli sústrediť na druhý tvrdý oriešok – dohody o tom, ako presne by chceli formátovať údaje, ktoré si chcú vymieňať. Ide o veľmi zložitý problém, aj keď nie nový.

A takéto dohody budú existovať, pretože rastúca nekompatibilita počítačových platforiem nám v dôsledku oneskorení termínov dáva, finančné straty a vedie k zmätku takmer vo všetkých oblastiach činnosti. Ľudia si chcú vymieňať nápady a robiť veci bez ohľadu na to, že každý má iné počítače – a aby sa to stalo realitou, vzájomný rozvoj súkromných (pre rôzne oblasti činnosti) jazykov má pred sebou ešte dlhú cestu . Záplava nových akronymov končiacich na „ML“ však demonštruje nepopierateľne inovatívneho ducha, ktorý XML priniesol do vedy, obchodu a vzdelávania.

Pri vytváraní nového značkovacieho jazyka XML sa jeho tvorcovia musia dohodnúť na troch veciach: aké značky tam budú, ako sa môžu vnoriť do seba a ako majú byť spracované. Prvé dva body – jazykový slovník a štruktúra – sú teraz zakódované pomocou DTD (Document Type Definition). Štandard XML nezaväzuje vývojárov jazykov uchýliť sa k DTD, ale väčšina nových jazykov bude mať zjavne popisy DTD - to uľahčuje programátorom písať programy, ktoré rozumejú tomuto značeniu a extrahujú z neho niečo zmysluplné. Budeme tiež potrebovať sady príručiek, ktoré popisujú významy všetkých značiek v ľudskom jazyku. Napríklad HTML má popis DTD, ale existujú aj stovky strán známych HTML manuálov, ktoré programátori konzultujú pri vývoji prehliadačov a iných programov pre web.


Esej o štýle

Pre používateľov je hlavnou vecou to, čo program dokáže, a nie to, čo je napísané v jeho popise. Vo všeobecnosti ľudia uprednostňujú, aby im programy umožňovali vidieť informácie zakódované v XML v čitateľnej forme. V samotných značkách XML však nie je uvedené žiadne špeciálne označenie. ako by mali byť údaje prezentované na obrazovke alebo tlačenom hárku.

Pre vydavateľov, ktorí chcú „napísať raz a publikovať všade“, je najdôležitejšou vecou „zrodiť“ publikáciu a potom ju „naliať“ do nespočetného množstva typov publikácií, tlačených aj elektronických. XML im takto pomáha: obsah je označený popisnými značkami, ktoré sú nezávislé od prostredia vykresľovania. Ďalej môže vydavateľ formalizovať pravidlá prezentácie formou tzv. štýly (štýlové predlohy), automaticky „štylizujúce“ svoju prácu ako rôzne zariadenia a životné prostredie. Štandard pre takýto jazyk XML, vyvinutý na tieto účely, sa nazýva Extensible Stylesheet Language (XSL).

Najnovšie verzie Prehliadače môžu čítať dokumenty XML, vyberať vhodné súbory štýlov a používať ich na triedenie a formátovanie informácií na obrazovke. Čitateľ si možno ani neuvedomuje, že sa zaoberá skôr XML ako HTML, pokiaľ si nevšimne, že stránky s XML sú rýchlejšie a ľahšie použiteľné.

Zrakovo postihnutí ľudia tiež bezplatne využívajú princípy publikovania dokumentov XSL, pretože XSL im dáva možnosť čítať XML v Braillovom písme alebo hlasom. Tieto výhody platia aj pre ostatných: napríklad obchodnému cestujúcemu, ktorý chce surfovať po internete z pohodlia svojho auta, by zrejme celkom vyhovovalo počúvanie stránok so zvukom.

Hoci jadro Siete spočiatku tvorili vedecké a vzdelávacie programy, dnešná sieť je už obchod (no, alebo by sa dalo povedať, komerčné očakávania), skladuje palivo pre rýchly štart. Každý si pamätá nedávnu rezonanciu spôsobenú prudkým nárastom online predaja, ale netreba hovoriť, ako rýchlo medzi sebou komunikujú podnikatelia online. Tok tovaru od veľkých výrobcov si koleduje o automatizáciu v sieti. Dnešné obchodné systémy sa však spoliehajú na komplexné interakcie medzi jednotlivými programami a v praxi to funguje veľmi zle, pretože úspech si vyžaduje jednotnosť procesov spracovania, ktorá ešte ani zďaleka nie je dosiahnutá.

Po stáročia ľudia úspešne podnikali tak, že si vymieňali štandardné dokumenty: objednávky, faktúry, priznania, potvrdenky atď. atď. Dokumenty fungovali pre podnik a nikto nevyžadoval, aby jedna zúčastnená strana poznala vnútorné fungovanie tej druhej. Akýkoľvek dokument bol zobrazený presne v takej miere, v akej sa mal ukázať príjemcovi informácie, a nič viac. Výmena dokumentov je zrejme aj tým najsprávnejším spôsobom podnikania na webe. Ale toto vôbec nebola úloha, pre ktorú bolo HTML vytvorené.

Naopak, XML je navrhnuté špeciálne na účely výmeny dokumentov a je jasné, že základ elektronického obchodu bude založený na dohodách vyjadrených miliónmi XML dokumentov plávajúcich na internete.

Web vylepšený XML by sa teda mal stať rýchlym, priateľským a lepším miestom pre podnikanie pre svojich používateľov. Webmasteri a webdizajnéri potrebujú ešte viac XML. Armády programátorov budú potrebovať znalosť nových jazykov XML „naplno“. A hoci časy samovzdelávaných hackerov [autori mali na mysli ten najlepší zmysel tohto slova] stále trvajú, ich populácia je už teraz ohrozená.

Webový dizajnér zajtrajška musí byť zručný nielen v produkcii textu a grafiky, ale aj v konštrukcii viacvrstvových, vzájomne závislých systémov založených na DTD, dátových stromoch, hypertextových štruktúrach, metadátach a komponentoch štýlu – silná a pokročilá infraštruktúra web druhej generácie.