Dokumendi märgistuskeelte üldteave. Vaadake, mis on "märgistuskeel" teistes sõnaraamatutes. HTML-i märgistuskeel ja põhisildid

Tere kallis lugeja. On aeg sellest rääkida HTML märgistuskeel, mille abil luuakse absoluutselt kõik Interneti-saidid - nii vene kui kodanlikud ja isegi hiinakeelsed. Kuid see pole programmeerimiskeel, nagu mõned arvavad, vaid hüperteksti märgistuskeel.

Tuletan meelde, et hüpertekst on tekst, mis sisaldab linke teistele lehtedele ja dokumentidele. Märgistuskeel näitab, kuhu ja kuidas mõni tekstielement paigutada, näiteks lõik, pealkiri, loend vms. Nende elementide kujunduse eest vastutab HTML-iga tihedalt seotud CSS, mis muudab kujunduse veebisaidi lehtedest ilusad, loetavad ja kerged tänu lehe koodi mahalaadimisele.

Lisaks CSS-ile saab html-i täiendada PHP ja JavaScripti programmeerimiskeelte funktsioonidega, mis muudavad lehed interaktiivseks, s.t. võime reageerida kasutaja toimingutele.
Kõigi nende tööriistade abil saate omada mis tahes keerukust ja mis tahes funktsioone. HTML-keel ise vastutab ainult märgistuse eest.

Veebileht seestpoolt



<br>See on minu veebisait <br>


See on minu tekst

Selles ülaltoodud koodis näete käske- sildid, mida mõnikord nimetatakse deskriptorid. Need on suletud nurksulgudesse. Sildid on enamasti paaris. Avamine<>ja suletav, kaldkriipsuga ees. Kogu html-märgistuskeele kood on üksteise sisse pesastatud ja sarnaneb justkui “matrjoškaga”, kus üks konteiner on pesastatud teise.

Allolev joonis näitab selle koodi dekodeerimist:

Ja nii näeb sama leht välja Mozilla Firefoxi brauseris. Näitasin, kus tekst kuvatakse päis Pealkiri ja tekst tag Keha

Kuidas luua html-lehte

Selguse huvides kopeerige ülaltoodud siltidega tekst mis tahes tekstiredaktorisse, näiteks märkmikusse, ja salvestage see oma töölauale. Vajutage parempoolset nuppu ja valige "nimeta ümber". .txt laiendi asemel, nagu tavalise tekstifaili puhul, määrake laiend html või htm. Märkmiku ikoon muutub brauseri ikooniks, millel klõpsates kuvatakse teie esimene veebileht.

Kui laiendit ei kuvata, peate tegema järgmist.

Otsige oma arvutist: Välimus ja isikupärastamine - Kausta valikud - Vaade.

Faililaiendi näitamine on alati kasulik, et ründajad ei saaks eeldada, et avate faili "gift.jpg" nakkusega, mis tegelikult on "gift.jpg.exe". Ilma laiendita, mida Windows vaikimisi peidab, on väga lihtne segi ajada "pahavara" käivitaja faili peidetud EXE-laiendiga tavalise pildiga.

Vaadake videot HTML-lehtede loomise kohta


Programmid HTML-lehtede loomiseks

Html-i hüperteksti märgistuskoodi käsitsi kirjutamine ilma kogemuseta võib tunduda tõsise tähelepanelikkuse ja vastupidavuse proovikivina. Kuid uskuge mind, et ainult sel viisil oma oskusi tugevdades saate end uhkusega veebimeistriks nimetada.

Html-koodi käsitsi kirjutamise intelligentseks juhtimiseks on palju koodi esiletõstmisega programme. Amatöör-arendajate seas on populaarseimad Notepad ++, PHP Disainer, Dreamweaver

Viimased kaks programmi on tasulised, kuid vanad versioonid, mis pole uutest halvemad, leiate netist tasuta ja teie vajaduste jaoks legaalselt kasutatavad. unenägude kuduja on visuaalne redaktor. See teisendab teie kujundusega teksti koodiks. Igal juhul ei kahetse te selle pilli tundmaõppimist.

Miks siis õppida koodi käsitsi kirjutama? Asi on selles, et kõik visuaalsed redaktorid, isegi WordPressi sisseehitatud redaktor, tekitavad mõnikord oma koodi nii palju prügi, et lehed kaaluvad kordades rohkem kui need, mis on kirjutatud pea ja käte abil. Jah, kui arvestada ka sellega, et otsingumootorid pööravad nüüd tähelepanu koodi puhtusele, siis paratamatult mõtled HTML-i õppimisele, et kogu protsessi juhtida.

Üldiselt asendab Dreamweaver alguses head õpetajat. Kasutage seda programmi ja vaadake, kuidas html-lehte kirjutatakse. Mis kõige tähtsam, ärge olge laisk, et vaadata programmi ülemist akent, kus kood genereeritakse. Pange tähele, kus programm midagi lisa teeb.

Mis on brauser tegelikult

Paljud inimesed usuvad, et brauser on loodud Internetist saitide otsimiseks, et see on selle eesmärk. Seega luuakse arvutikasutaja arusaamises ekslik arvamus brauseri eesmärgi kohta. Tegelikult on brauser programm html-koodi, CSS-koodi, JS-koodi jne tõlgendamiseks. Teisisõnu on see rakendustarkvara tööriist veebilehtede ja muude dokumentide kuvamiseks.

Kaasaegsete brauserite võimalused on tõeliselt suurepärased. Sisaldavad ju veebilehed erinevas vormingus graafikat, videoid ja tekste. Brauser loeb html-koodi, näeb sinna manustatud videomaterjali, graafilist ja tekstikoodi ning kuvab seda kõike õigesti seadme ekraanidel. Sildid aitavad teda selles, need tavalised ingliskeelsed sõnad nurksulgudes<>.

Brauser näeb siltide abil, millist osa tekstist ta tõlgendab on saidi nimi, mis on pealkiri, mida tuleks esitada lõiguna, kuhu pilt paigutada ja lahendab teel palju probleeme, mis on seotud erinevate probleemidega. lihtsasse HTML-i manustatud keeled.

HTML-i märgistuskeel ja põhisildid

ütleb brauserile, et see on HTML-dokument
siin on teave otsingumootoritele
sisu kuvatakse brauseriaknas
lehe pealkiri

Pealkirjad: suurimast väiksemani
Paks ja kaldkirjas tekstivalik
lingi tekst Teatab brauserile, et see on link tekstiga " lingi tekst«

Looge uus lõik

lõigu joondus ( vasakule, paremale, õigusta või keskele)
Annab brauserile käsu luua vorm

See tabel on ette nähtud ainult peamiste deskriptorite kuvamiseks.

HTML5 kaasaegses versioonis on koos uute siltidega ilmunud tohutul hulgal uusi funktsioone, millest veebisaitide arendajad 10 aastat tagasi unistadagi ei osanud.

Stiilid html-dokumendis

Kui brauser kuvab veebilehe sisu, kuvab ta pealkirjad ühes stiilis, lõiguteksti teises ning ka kirjasuurused on neil erinevad. Igas brauseris on see vaikimisi lubatud. Kuid me tahame näha individuaalseid veebilehtede kujundusi ja CSS tuleb appi, kaskaadlaadilehtede keel. CSS-i abil saate määrata mis tahes elemendi kujunduse, saate luua veebidokumendi mis tahes kujunduse.

CSS on stiililisand html-keelele ja seda ei eksisteeri ilma selleta.

Html-i stiilid on manustatud järgmiselt:

pea>

Kui kasutatakse välist laaditabelit stiilid.css siis ühendub see html-dokumendiga järgmiselt:

CSS-i reeglite kirjutamise näide:

p (värv: must; font: x-small).

Teatab brauserile, et lõigu värv

must- must ja fondi suurus on määratud x-väike(väike)

Siin on see, kuidas ma näiteks kujundan selle ajaveebi iga artikli alguses oleva sisu stiili.

anons
(ääris: 2px roheline;
äärise raadius: 10 pikslit
laius: 360
fondiperekond: "Yeseva+One";
fondi suurus: 16 pikslit;
rea kõrgus: 1,2 em; polsterdus: 10 pikslit 10 pikslit 10 pikslit 20 pikslit;
veeris: 10px auto 20px;
text-align:left;
taustavärv: #a7cece;
}

viimasel real on huvitav jupp: background-color: #a7cece;

#a7cece- see on html värv. Kasutades HEX märgikomplekti - kuueteistkümnendsüsteemi: numbrid 0 kuni 9 ja tähed A kuni F, saate määrata absoluutselt mis tahes värvi. Siin on sätitud ilus akvamariin.

CSS-i teema juurde pöördun tagasi eraldi väljaannetes.

Kuidas õppida HTML-i märgistuskeelt

  • Veeb on täis viiteid HTML-ile (html). Mulle meeldib sait http://htmlbook.ru. Käin siin sageli võrdlusmaterjali otsimas. Soovitatav aja säästmiseks.
  • Andrei Bernatski. Vaata seda kindlasti!
  • Mulle meeldib Ameerika autorite raamat. See on paeluv HTML/CSS-i õpetus nii laheda materjali esitlusega, et loete peatumata. Kõik on selgitatud lihtsalt ja selgelt. Selle saab võrgust tasuta alla laadida, kuid parem on osta ja töötada sellega nagu raamatuga.

Enamik Parim viis keelt valdama HTML märgistus(html) on Runeti kuulsaimate koolituste allalaadimine, lisaks on mõned neist täiesti tasuta. Külastage Jevgeni Popovi veebisaiti ja laadige alla palju kasulikku hariv teave. Professionaalseks koolituseks lugege teavet.

Märgistuskeeled

Märgistuskeel(tekst) arvutiterminoloogias märkide või jadade kogum, mis sisestatakse teksti, et edastada teavet selle väljundi või struktuuri kohta. See kuulub arvutikeelte klassi. Märgistuskeelt kasutades kirjutatud tekstidokument ei sisalda mitte ainult teksti ennast (sõnajada ja kirjavahemärkidena), vaid ka Lisainformatsioon selle erinevate jaotiste kohta – näiteks pealkirjade, esiletõstude, loendite jms märge rasked juhtumid Märgistuskeel võimaldab sisestada dokumenti interaktiivseid elemente ja sisu teistest dokumentidest.

Tuleb märkida, et märgistuskeel ei ole Turingi täielik ja seda ei peeta tavaliselt programmeerimiskeeleks, kuigi rangelt võttes see nii on.

HTML (inglise keelest. Hüperteksti märgistuskeel-- "Hypertext Markup Language") – on välja töötatud Briti teadlase Tim Berners-Lee poolt aastatel 1986–1991 Euroopa keskuse seintes. tuumauuringud Genfis (Šveits). HTML loodi teadusliku ja tehnilise dokumentatsiooni vahetamise keelena, mis sobib kasutamiseks inimestele, kes ei ole küljendamise alal spetsialistid. HTML lahendas edukalt SGML-i keerukuse, määratledes väikese hulga struktuurseid ja semantilisi elemente, mida nimetatakse deskriptoriteks. Deskriptoreid nimetatakse sageli ka "märgenditeks". HTML-i abil saate hõlpsasti luua suhteliselt lihtsa, kuid kauni kujundusega dokumendi. Lisaks dokumendi struktuuri lihtsustamisele on HTML-ile lisatud hüperteksti tugi. Multimeediumifunktsioonid lisati hiljem.

Algselt mõeldi ja loodi HTML-keel dokumentide struktureerimise ja vormindamise vahendina, ilma et see oleks seotud reprodutseerimisvahenditega (kuvamisega). Ideaalis tuleks HTML-märgistusega teksti reprodutseerida ilma stiililiste ja struktuuriliste moonutusteta mitmesuguste tehniliste seadmetega (kaasaegse arvuti värviline ekraan, korraldaja ühevärviline ekraan, mobiiltelefoni või seadme piiratud suurusega ekraan ja programmid kõne taasesitamiseks). tekstid). Kaasaegne HTML-i kasutamine on aga oma algsest eesmärgist väga kaugel. Näiteks silt

, mida kasutatakse mitu korda lehtede vormindamiseks, on mõeldud dokumentides kõige levinumate tabelite loomiseks. Aja jooksul on platvormi põhiidee HTML-i sõltumatusest ohverdatud tänapäevaste multimeedia ja graafilise disaini vajaduste kasuks.

XML(Inglise) eX pingelineM arkupL nurk-- laiendatav märgistuskeel; hääldatakse [ endine em-eml]) on märgistuskeel, mida soovitab World Wide Web Consortium (W3C). XML-spetsifikatsioon kirjeldab XML-dokumente ja kirjeldab osaliselt XML-protsessorite (programmid, mis loevad XML-dokumente ja võimaldavad juurdepääsu nende sisule) käitumist. XML loodi lihtsa, formaalse süntaksiga keeleks, mis võimaldaks programmidel hõlpsasti dokumente luua ja töödelda ning mida oleks ka inimestel lihtne lugeda ja luua, rõhuasetusega veebikasutusel. Keelt nimetatakse laiendatavaks, kuna see ei fikseeri dokumentides kasutatavat märgistust: arendajal on vabadus luua märgistus vastavalt konkreetse valdkonna vajadustele, olles piiratud ainult keele süntaksireeglitega. Lihtsa formaalse süntaksi, inimsõbralikkuse, laiendatavuse ja dokumentide sisu esitamisel Unicode'i kodeeringutele tuginemise kombinatsioon on viinud nii XML-i enda kui ka mitmesuguste XML-i tuletatud spetsialiseeritud keelte laialdasele kasutamisele paljudes erinevates keeltes. tarkvara tööriistad.

XHTML(Inglise) Ex pingelineH ypert extM arkupL nurk-- laiendatav hüperteksti märgistuskeel) – XML-põhiste veebilehtede märgistuskeelte perekond, mis kordab ja laiendab HTML 4 võimalusi. XHTML 1.0 ja XHTML 1.1 spetsifikatsioonid on World Wide Web Consortiumi soovitused, kuid hetkel on selle arendamine peatatud soovitusega kasutada HTML-i. XHTML-i uusi versioone ei avaldata.

Peamine erinevus XHTML-i ja HTML-i vahel on dokumendi töötlemine. XHTML-dokumente töötleb nende moodul (parser) samamoodi nagu XML-dokumente. Selle töötlemise käigus arendajate tehtud vigu ei parandata.

XHTML vastab SGML-i spetsifikatsioonile, kuna XML on selle alamhulk. HTML-il on töötlemisel palju funktsioone ja see on tegelikult lakanud kuulumast SGML-i perekonda, mis on kirjas HTML 5 spetsifikatsiooni mustandis.

Brauser valib dokumendi töötlemiseks parseri serverilt saadud sisutüübi päise alusel:

HTML – tekst/html

XHTML - rakendus/xhtml+xml

· Kliendis kohaliku vaatamise puhul põhineb valik faililaiendil.

· IN Internet Explorer kuni versioonini 8 XHTML-dokumentide töötlemiseks parser puudub.

WML(Inglise) Juhtmeta märgistuskeel-- "traadita märgistuskeel") - WAP-standardi kohaselt mobiiltelefonides ja muudes mobiilseadmetes kasutamiseks mõeldud dokumentide märgistuskeel.

Struktuur meenutab mõnevõrra lihtsustatud HTML-i, kuid on olulisi erinevusi, kuna WML on suunatud seadmetele, millel pole personaalarvutite võimalusi (väike ekraan, kõik seadmed ei suuda kuvada graafikat, väike mälumaht jne): kogu teave WML sisaldub niinimetatud "tekkides" (Eng. tekil). Dets on väikseim andmeühik, mida server saab edastada. Pakid sisaldavad "kaarte" ( kaardile) (iga kaart on piiratud siltidega Ja). Ühes pakis peaks alati olema vähemalt üks kaart, kuid neid võib olla ka mitu. Samal ajal kuvatakse seadme ekraanil korraga ainult üks kaart, mille vahel saab kasutaja linke klõpsates lülituda – seda tehakse selleks, et vähendada serverile suunatud infopäringute arvu; samal ajal ei tohiks WML-lehtede suurus ületada 1-4 kilobaiti.

VML(Inglise) Vektori märgistuskeel-- vektormärgistuskeel) töötas Microsoft välja vektorgraafika kirjeldamiseks. Microsoft, Macromedia jt esitasid VML-i W3C-le aastal 1998. Umbes samal ajal esitasid Adobe, Sun ja mitmed teised ettevõtted PGML-dokumendid kaalumiseks. Mõlemad keeled said hiljem SVG aluseks.

PGML (Täppisgraafika märgistuskeel, vabalt tõlgitud vene keelde - "täppisgraafika märgistuskeel") - XML-põhine märgistuskeel, mida kasutatakse vektorgraafika kirjeldamiseks veebilehel (skeemid, üksikud liidese elemendid) teksti kujul XML-vormingus, kasutab pildikonstruktsiooni mudelit , mis on sarnane PDF-ile ja PostScriptile. Adobe Systems, IBM, Netscape Communications ja Sun Microsystems esitasid selle 1998. aastal W3C konsortsiumile, kuid seda ei aktsepteeritud nii, nagu soovitati. Peaaegu samaaegselt esitas Microsoft oma VML-projekti kaalumiseks, aasta hiljem töötati kahe tehnoloogia idee põhjal välja arenenum SVG-keel. SVG on saanud W3C soovituse ja sellest on saanud peamine veebilehel vektorgraafika kirjeldamise vorming.

SVG(inglise keelest. S kalibreeritavV ektorG raafikad-- skaleeritav vektorgraafika) - skaleeritav vektorgraafika märgistuskeel, mille on loonud World Wide Web Consortium (W3C) ja mis sisaldub laiendatava märgistuskeele XML alamhulgas, on loodud kirjeldama kahemõõtmelist vektorgraafikat ja segatud vektor-/bittkaartgraafikat. XML-vormingus. Toetab nii liikumatut kui ka animeeritud interaktiivset graafikat – või teisisõnu deklaratiivset ja skriptitud graafikat. Ei toeta kolmemõõtmeliste objektide kirjeldamist. See on avatud standard, mis on W3C soovitus, selliste standardite nagu HTML ja XHTML taga asuv organisatsioon. SVG põhineb VML- ja PGML-märgistuskeeltel. Arendatakse alates 1999. aastast.

XBRL(Inglise) eX pingelineB äriR edastamineL nurk, valgustatud. Extensible Business Reporting Language on elektroonilise finantsaruandluse avatud standard. XBRL-vorming põhineb Extensible Markup Language XML-il. XBRL kasutab XML-i süntaksit ja ka XML-iga seotud tehnoloogiaid, nagu XML-nimeruum, XML-skeem, XLink ja XPath. Üks XBRL-i eesmärke on esindada ja vahetada finantsteavet, näiteks ettevõtete finantsaruandeid. XBRL keele spetsifikatsiooni on välja töötanud ja avaldanud sõltumatu rahvusvaheline organisatsioon XBRL International, Inc.

Veebi visuaalse taju parandamiseks on laialdaselt kasutusele võetud CSS-tehnoloogia, mis võimaldab määrata paljudele veebilehtedele ühtseid kujundusstiile. Veel üks tähelepanu vääriv uuendus on URN-i ressursside nimetamise süsteem. Ühtne ressursi nimi).

Populaarne kontseptsioon World Wide Webi arendamiseks on semantilise veebi loomine. Semantiline veeb on olemasoleva World Wide Webi lisand, mille eesmärk on muuta võrku postitatud teave arvutitele arusaadavamaks. Semantiline veeb on võrgu kontseptsioon, milles iga ressurss on sisse lülitatud inimkeel oleks varustatud arvutile arusaadava kirjeldusega. Semantiline veeb pakub juurdepääsu selgelt struktureeritud teabele mis tahes rakenduse jaoks, olenemata platvormist ja programmeerimiskeeltest. Programmid suudavad ise leida vajalikke ressursse, töödelda teavet, klassifitseerida andmeid, tuvastada loogilisi seoseid, teha järeldusi ja isegi teha nende põhjal otsuseid. Kui semantiline veeb on laialdaselt kasutusele võetud ja hästi rakendatud, võib see Internetis revolutsiooni teha. Ressursi arvutisõbraliku kirjelduse loomiseks kasutab semantiline veeb RDF-vormingut (Eng. Ressursi kirjelduse raamistik), mis põhineb XML-i süntaksil ja kasutab ressursside tuvastamiseks URI-sid. Uus selles valdkonnas on RDFS (ingl. RDF skeem) ja SPARQL (eng. Protokolli ja RDF-i päringukeel) uus keel päringud kiireks juurdepääsuks RDF-i andmetele.

(Standard Generalized Markup Language), mis on esitatud standardis ISO 8879. Seda keelt aktsepteeritakse tehnilise dokumentatsiooni, sealhulgas CALS-tehnoloogiates loodud toodete interaktiivsete elektrooniliste tehniliste juhendite kujundamisel peamise keelena.

SGML defineerib dokumentide struktuuri andmeobjektide jadana. Dokumendi osi esindavaid andmeobjekte saab salvestada erinevatesse failidesse. SGML-standard kehtestab teabe esitamiseks sellised sümbolite komplektid ja reeglid, mis võimaldavad erinevatel süsteemidel seda teavet õigesti ära tunda ja tuvastada. Neid komplekte kirjeldatakse dokumendi eraldi osas, mida nimetatakse DTD-ks (Document Type Definition), mis edastatakse koos peamise SGML-dokumendiga. DTD määrab märkide ja nende koodide vahelise vastavuse, kasutatavate identifikaatorite maksimaalse pikkuse, siltide eraldajate esitamise, muud võimalikud kokkulepped, DTD süntaksi ning dokumendi tüübi ja versiooni. Seetõttu võib SGML-i nimetada teatud märgistuskeelte perekonna metakeeleks. Eelkõige võib märgistuskeeli XML ja HTML pidada SGML-i alamhulkadeks.

SGML-dokumendi vormis tehniline kirjeldus sisaldab:

  • põhifail koos SGML-märgenditega märgistatud tehnilise juhendiga;
  • üksuste kirjeldus, kui dokument kuulub gruppi, milles kasutatakse samu üksusi ja eeldatakse nende tuntust;
  • sõnastik SGML-märgendite selgitamiseks;

SGML-i on aga raske õppida ja kasutada. Seetõttu töötati 1991. aastal WWW tehnoloogiates esitatud dokumentides märgistuse laialdaseks kasutamiseks välja SGML-il põhinev lihtsustatud HTML (HyperText Markup Language) ja 1996. aastal XML (eXtensible Markup Language), mis muutub koos HTML on peamine keel dokumentide esitamiseks erinevates rakendustes.

HTML-keel töötati välja eesmärgiga kasutada märgistust laialdaselt WWW-tehnoloogiates esitatud dokumentides.

HTML-i kirjeldus on ASCII-tekst ja selles sisalduv käskude (juhtkoodide) jada, mida nimetatakse ka deskriptoriteks või siltideks. Seda teksti nimetatakse HTML-dokumendiks või HTML-leheks või pärast veebiserverisse paigutamist veebileheks. Märgendid paigutatakse lähtetekstis õigetesse kohtadesse, need määravad fonte, sidekriipsu, graafiliste piltide välimust, linke jne. WWW-redaktorite kasutamisel toimub käskude sisestamine lihtsalt vastavatele klahvidele vajutades.

XML-i, nagu HTML-i, peetakse SGML-i alamhulgaks. Praegu on XML väidetavalt peamine dokumentide esitamise keel infotehnoloogia, võib seda pidada metakeeleks, mis on aluseks privaatsete märgistuskeelte loomisele erinevates rakendustes. Samal ajal on XML mugavam kui SGML, mille tagab mõnede SGML-i pisiomaduste kõrvaldamine XML-is. XML-i kirjeldused on lihtsamini mõistetavad, kohandatud kasutamiseks tänapäevastes brauserites, säilitades samal ajal SGML-i põhifunktsioonid.

Konkreetsete rakenduste jaoks luuakse oma XML-i variandid, mida nimetatakse XML-sõnastikuteks või XML-rakendusteks. Seega on konkreetsete matemaatiliste sümbolitega tekstide kirjeldamiseks välja töötatud XML-rakenduse OSD (Open Software Description). CALS-i puhul pakub huvi andmevahetuse PDX (Product Definition eXchange) variant. Tuntud keemia (CML – Chemical Markup Language), bioloogia (BSML – Bioinformatic Sequence Markup Language) jne sõnastikke.

Kerged märgistuskeeled

Nimetatakse keeli, mis on mõeldud teksti lihtsaks ja kiireks kirjutamiseks lihtsas tekstiredaktoris kergekaaluline(et: Kerge märgistuskeel). Selliste keelte omadused:

  • Minimaalsed omadused.
  • Väike toetatud siltide komplekt.
  • Lihtne õppida.
  • Sellises keeles lähteteksti loetakse sama hõlpsalt kui valmis dokumenti.

Neid kasutatakse seal, kus inimene peab teksti ette valmistama tavalises tekstiredaktoris (blogid, foorumid, vikid) või siis, kui on oluline, et teksti saaks lugeda ka tavalise tekstiredaktoriga kasutaja. Siin on mõned laialdaselt kasutatavad kerged märgistuskeeled:

  • Wiki märgistus (vt Wikipedia: kuidas muuta artikleid)
  • Erinevad automaatse dokumentatsiooni süsteemid (nt Javadoc).

Lugu

Mõiste "märgistus" (märgistus) pärineb fraasist "märgistamine" ( mark, märgistus- Ing.) traditsioonilisest kirjastamispraktikast panna käsikirja või korrektuuri teksti veeristele ja tekstile enne trükki saatmist eritingimusmärke. Seega näitasid "märgistusmehed" iga tekstiosa jaoks kirjatüüpi, stiili ja fondi suurust. Tänapäeval tegelevad teksti märgistamisega toimetajad, korrektorid, graafilised disainerid – ja loomulikult autorid ise.

GenCode

Märgistuskeelte kasutamise idee arvutitekstitöötluses tutvustas tõenäoliselt esmakordselt William Tunnicliffe. William W. Tunnicliffe ) konverentsil 1967. aastal. Ta ise nimetas oma ettepanekut "universaalseks kodeerimiseks" (ingl. üldine kodeerimine). 1970. aastatel juhtis Tunnicliffe kirjastustööstuse GenCode standardi väljatöötamist ja hiljem sai temast Rahvusvahelise Standardiorganisatsiooni (ISO) komitee esimees. Rahvusvaheline Standardiorganisatsioon ), kes lõi SGML-i, esimese kirjeldava märgistuskeele. Brian Reid (ur. Brian Reid ) oma väitekirjas, mille ta kaitses 1980. aastal Carnegie ülikoolis (ingl. Carnegie Melloni ülikool ), viis kavandatava kontseptsiooni väljatöötamisel läbi kirjeldava märgistuse praktilise rakendamise.

IBM-i teadlast Charles Goldfarbi nimetatakse nüüd aga tavaliselt märgistuskeelte "isaks". Charles Goldfarb ). Põhikontseptsioon jõudis temani 1969. aastal advokaadibüroodele mõeldud primitiivse dokumendihaldussüsteemi kallal töötades. Samal aastal osales ta IBM GML keele loomisel, mida esmakordselt tutvustati 1973. aastal.

Mõned arvutimärgistuskeelte varased rakendused on saadaval UNIX-i tüpograafiautiliitides, nagu troff ja nroff. Need võimaldavad sisestada dokumendi teksti vormingukäske, et vormindada see vastavalt redaktori nõuetele.

WYSIWYG-funktsiooniga kirjastamistarkvara olemasolu (ing. « mida sa vaata, mis sa saad" see, mida näete, on see, mida saate) on enamiku neist keeltest tavakasutajate hulgas välja tõrjunud, kuigi tõsine avaldamine kasutab endiselt konkreetsete mittevisuaalsete tekstistruktuuride jaoks märgistusi ja WYSIWYG-redaktorid salvestavad nüüd dokumente enamasti märgistuskeeltel põhinevas vormingus. .

TeX

Teine oluline kirjastamisstandard on TeX, mille lõi ja hiljem täiustas Donald Knuth 20. sajandi 70. ja 80. aastatel. TeX on koondanud võimsa tekstivormingu ja fontide kirjeldamise võimalused, eriti professionaalse kvaliteediga matemaatikaraamatute jaoks. See võttis Knuthil palju aega, et õppida ladumiskunsti. TeX on aga läinud allamäge, nii et seda kasutatakse nüüd peamiselt teadusmaailm, kus on paljude teadusharude de facto standard. Lisaks Texile on olemas LaTeX, mis on laialdaselt kasutatav TeX-põhine kirjeldav märgistussüsteem.

Scribe, GML ja SGML

Esimene keel, millel oli selge ja selge vahe dokumendi struktuuri ja liigi vahel, oli Scribe, mille lõi ja kirjeldas Brian Reidi doktoritöö 1980. aastal. Scribe oli revolutsiooniline selle töötlemise viisi poolest, mitte sisse viimane pööre sissetoodud stiiliidee tõttu, mis on eraldatud tegelikust tekstist ja grammatikast ning kontrollivad kirjeldavate elementide kasutamist. Scribe avaldas mõju GML-keele (hiljem SGML) arendamisel ning on ka HTML-i ja LaTeX-i keelte otsene esivanem.

80ndate alguses viis SGML-i loomiseni idee, et märgistus peaks keskenduma dokumendi struktuursetele aspektidele ja jätma dokumendi välise esituse tõlgendaja hooleks. Keele töötas välja Goldfarbi juhitud komitee. Ta ühendas ideid paljudest allikatest, sealhulgas Tunnikofflicki projektist GenCode. Sharon Adler, Anders Berglund ja James A. Marke olid ka SGML-i komitee võtmeliikmed.

SGML määratles täpselt süntaksi märgistuse lisamiseks teksti, samuti kirjeldas eraldi, millised sildid on lubatud ja kus (DTD – Document Type Definition). See võimaldas autoritel luua ja kasutada soovitud märgistusi, valida, milliseid silte kasutada ja anda neile tavalises keeles nimed. Seega tuleks SGML-i pidada metakeeleks; sellest on pärit mitu erilist märgistuskeelt. 80ndate lõpp oli kõige olulisem uute SGML-il põhinevate märgistuskeelte, nagu TEI ja DocBook, ilmumisel.

1986. aastal avaldati SGML rahvusvahelise standardina ISO 8879 järgi. SGML on leidnud laialdast heakskiitu ja seda on laialdaselt kasutatud väga suurtes projektides. Kuid üldiselt leiti, et see oli tülikas ja raskesti õpitav, keele kõrvalmõjuna oli see, et sellega üritati teha liiga ja olla liiga paindlik. Näiteks lõi SGML lõpumärgendid (või algussildid või isegi mõlemad), mida alati vaja ei läinud, kuna uskus, et selle märgistuse lisavad käsitsi projekti tugipersonal, kes hindaks klahvivajutuste kokkuhoidu.

HTML

1991. aastaks oli SGML-i kasutamine piiratud äriprogrammide ja andmebaasidega, samas kui WYSIWYG-i tööriistu (mis salvestasid dokumente patenteeritud kahendvormingus) kasutati muude dokumenditöötlusprogrammide jaoks. Olukord muutus, kui Sir Tim Berners-Lee sai SGML-i teada oma kolleegilt Anders Berglandilt. Anders Berglund ) ja teised CERN-is kasutasid HTML-i genereerimiseks SGML-i süntaksit. Keelel oli sarnasusi teiste SGML-i süntaksil põhinevate märgistuskeeltega, kuid seda oli palju lihtsam alustada isegi arendajatel, kes polnud seda kunagi teinud. Steven DeRose väitis, et kirjeldavat märgistust (ja eriti SGML-i) kasutav HTML oli veebi arendamisel peamine tegur, kuna see oli kavandatud olema paindlik ja laiendatav (nagu ka muud tegurid, sealhulgas URL-ide mõiste ja brauserite vaba kasutamine ). HTML on tänapäeval kõige atraktiivsem ja enimkasutatav märgistuskeel maailmas.

Mõned arvutiteadlased on aga vaidlustanud HTML-i staatuse märgistuskeelena. Nende peamine argument on see, et HTML piirab siltide paigutust, nõudes, et mõlemad sildid oleksid pesastatud teiste siltide või dokumendi põhimärgendite sisse. Seetõttu peavad need teadlased HTML-i hierarhilist mudelit järgivaks konteinerkeeleks.

XML

XML (Extensible Markup Language) on tänapäeval laialdaselt kasutatav metamärgistuskeel. XML-i töötab välja World Wibe Web Consortium komitees, mida juhib Jon Bosak. XML-i põhieesmärk on olla lihtsam kui SGML ja keskenduda konkreetsele probleemile – veebis olevatele dokumentidele. XML on metakeel nagu SGML, kasutajatel on lubatud luua mis tahes silte, mida nad soovivad (seega "laiendatavad"). XML-i tõusule aitas kaasa see, et iga XML-dokumenti sai kirjutada samamoodi nagu SGML-dokumente ning SGML-i kasutavad programmid ja kasutajad said üsna lihtsalt XML-ile migreeruda.

XML kaotas aga paljud SGML-i inimkesksed funktsioonid, mis muutsid selle kasutamise lihtsamaks (kuni märgistuse hulk suurenes ning loetavus ja redigeeritavus taastati samale tasemele). Muud täiustused lahendasid mõned rahvusvahelised SGML-probleemid ja võimaldasid dokumenti hierarhiliselt sõeluda isegi siis, kui DTD-d polnud saadaval.

XML oli mõeldud peamiselt poolstruktureeritud keskkondade jaoks, nagu dokumendid ja väljaanded. Selle tulemuseks oli aga magus koht paindlikkuse ja lihtsuse vahel ning paljud kasutajad võtsid selle kiiresti kasutusele. Tänapäeval kasutatakse programmide vahel andmete edastamiseks laialdaselt XML-i. Nagu HTML-i, võib seda kirjeldada kui "konteineri" keelt.

XHTML

Alates 2000. aasta jaanuarist on kõik W3C-le antud soovitused põhinenud pigem XML-il kui SGML-il, on pakutud välja akronüüm XHTML (Extensible HyperText Markup Language – Extensible HyperText Markup Language). Keele spetsifikatsioonid nõudsid, et XHTML-dokumendid tuleb vormindada XML-dokumentidena. See võimaldab XHTML-i kasutada selgemate ja täpsemate dokumentide jaoks, kasutades HTML-i silte.

Üks tähelepanuväärsemaid erinevusi HTML-i ja XHTML-i vahel on reegel, et kõik sildid peavad olema suletud: näiteks tühjad sildid<br/> peavad mõlemad olema suletud standardse lõpusildiga või spetsiaalse kirjega:<br/> (tühik "/" ees lõpusildis on valikuline, kuid seda kasutatakse sageli, kuna seda kasutavad mõned XML-i-eelsed brauserid, ka SGML-i parserid). Muud siltide atribuudid peavad olema jutumärkides. Lõpuks tuleb kõik sildid ja atribuutide nimed kirjutada väiketähtedega, et neid õigesti lugeda; HTML on tõstutundlik.

Muud XML-põhised arendused

Nüüd on kasutusel paljud XML-põhised arendused, nagu RDF (Resource Description Framework), XFORMS, DocBook, SOAP ja OWL (Ontology Web Language).

Iseärasused

Kõigi märgistuskeelte ühine omadus on see, et nad segavad dokumendi teksti andmevoos või failis oleva märgistusjuhistega. See ei ole vajalik, märgistust on võimalik tekstist eraldada osutite, siltide, identifikaatorite või muude koordineerimismeetodite abil. See "eraldatud märgistus" on tüüpiline märgistusdokumentidega töötavate programmide sisemise esituse jaoks. Kuid manustatud või "ridadevaheline" märgistus on mujal aktsepteeritud. Näiteks siin on väike tekstilõik, mis on tähistatud HTML-iga:

Anatidae

Perekond Anatidae hõlmab parte, hanesid ja luiki, kuid mitte lähedalt seotud karjujad.

Märgistusjuhiste kood (tuntud kui sildid), mis on ümbritsetud nurksulgudega<как здесь>. Nende juhiste vahele jääv tekst on dokumendi tekst. Koodid h1, lk Ja em- struktuurse märgistuse näited, need kirjeldavad neis sisalduva teksti asukohta, eesmärki või tähendust.

Täpsemalt, h1 tähendab "see on esimese taseme pealkiri", lk tähendab "see on lõik" ja em tähendab "see on allajoonitud sõna või fraas". Tõlk saab rakendada neid reegleid või stiile teksti erinevate osade kuvamiseks, kasutades vastavalt vajadusele erinevaid kirjatüüpe, fondi suurust, taanet, värvi või muid stiile. Silt, nagu h1, võib olla näiteks renderdatud suures paksus kirjatüübis või ühekohalise tekstiga dokumendis (nagu kirjutusmasinal) võib olla alla joonitud või välimus ei pruugi üldse muutuda.

Kontrastiks märgi i HTML-is visuaalse märgistuse näide; seda kasutatakse tavaliselt teksti spetsiifiliste tunnuste tuvastamiseks (kasuta selles plokis kaldkirja) ilma selgitusteta.

TEI (Tex Encoding Initiative) on avaldanud põhjalikud juhenddokumendid, mis täpsustavad, kuidas inimkonna ja teadusühiskondade hüvanguks teksti kodeerida. Neid juhendeid kasutati kodeerimiseks ajaloolised dokumendid, teadlaste konkreetsed teosed, perioodilised väljaanded ja nii edasi.

Alternatiivsed kasutusviisid

Samal ajal kui idee kasutada tekstidokumentidega märgistuskeeli arenes, suurendas see märgistuskeelte kasutamist muudes valdkondades, mis viitab sellele, et neid saab kasutada erinevat tüüpi teabe, sealhulgas esitusloendite, vektorgraafika ja veebiteenuste esitamiseks. , kasutajaliidesed. Enamik neist rakendustest põhinevad XML-il, kuna see on hästi struktureeritud ja laiendatav keel.

XHTML-keele kasutamine näitab ka, et seda saab kombineerida sama profiili erinevate märgistuskeeltega, näiteks XHTML+SMIL või XHTML+MathML+SVG.

Igal dokumendil on kolm komponenti:

struktuur;

Sisu on teave, mida dokumendis kuvatakse. Paberkandjal oleva dokumendi sisu võib olla puhtalt tekstiline ja sisaldada ka pilte. Kui dokument esitatakse elektroonilisel kujul, võib see sisaldada multimeediaandmeid, aga ka linke teistele dokumentidele. Kuigi erinevate dokumentide sisu on erinev, saab neid liigitada liigiti, näiteks raamat või rongipilet.

Dokumendi stiil määrab, millisel kujul selle sisu konkreetsel seadmel (näiteks printeril või kuvaril) kuvatakse. Stiili mõiste hõlmab kogu väljunddokumendi või selle üksikute plokkide fondi tunnuseid (nimi, suurus, värv), lehekülgede järjekorda, plokkide paigutust lehtedel ja muid parameetreid. Sama dokumenti saab kuvada erinevates stiilides nii erinevatel kandjatel kui ka samal kandjal.

Dokumendi märgistuskeeled on tehiskeeled, mis on loodud kirjeldama dokumendi struktuuri ja erinevate struktuuriobjektide vahelisi suhteid. Märgistusandmeid nimetatakse ka metaandmeteks.

Esimene märgistuskeel on GML (Generalized Markup Language), mille töötasid välja IBMi töötajad eelmise sajandi 60ndatel. Selle vahetuks järglaseks sai SGML-keel (Standard Generalized Markup Language – standardne üldistatud märgistuskeel), mis määratleb dokumendi märgistuselementide kirjutamise reeglid. Keelereegleid järgivat dokumenti nimetatakse SGML-dokumendiks.

SGML-keel on määratletud standardis ISO 8879, mis määrab dokumendi märgistuskeelele järgmised põhinõuded:

Keel peab olema inimesele loetav.

· Märgitud dokumendifailid peavad olema tekstilised ja kodeeritud ASCII (Ameerika standardkood teabevahetuseks) koodimärkidega. Dokumendi sisu ei pea aga olema ASCII-kodeeritud ega tekstiline.

SGML ja sarnased keeled kasutavad spetsiaalseid dokumentide märgistamise tööriistu:

Elemendid ja nendega seotud atribuudid;

· üksused (üksused);

kommentaarid.

SGML-dokumendi struktuuriüksus on element. Märgistustekstis tuleb iga element teatud viisil esile tõsta. Valik tehakse algussildi sisestamisega (alates Ingliskeelne sõna silt - silt) elemendi alguses (algussilt) ja lõpumärgend (lõppsilt) elemendi lõpus. Algus- ja lõpumärgenditel on sama nimi. Siltide eristamiseks lihttekstist peavad need algama sümboliga – sildi alguse märgiga ja lõppema märgiga – sildi lõpu märgiga. Lisaks on lõpusildis määratud sümbol - lõpusildi märk. SGML-is saab selliste märkidena määrata mis tahes märke, kuid sümbol "<" (левая угловая скобка), в качестве признака окончания тега используется символ ">" (vasak nurksulg) ja lõpumärgendiks märk "/" (kaldkriips). SGML-dokumendi elemendid võivad sisaldada muid elemente, mille tulemuseks on SGML-dokumendi graafiline esitus hierarhilise (puu)struktuurina.


Näide 4.3.1. SGML-dokumendi, mis määrab õpilaste nimekirja koos eksamisessiooni tulemustega, saab määrata järgmiselt:

Sessioonil olevate õpilaste hinnete nimekiri

Ivanov Ivan Ivanovitš

TS-61

A

B

B

B

Petrov Petr Petrovitš

TS-62

C

C

D

C

Selles dokumendis on esimene element õpilaste loendi element. See element sisaldab ühte pealkirja elementi (title) ja mitut õpilase elementi (õpilase andmed). Iga õpilase element sisaldab omakorda ühte täisnimeelementi (õpilase perekonnanimi, eesnimi ja isanimi), ühte rühmanumbri elementi (rühmanumber) ja ühte hindenimekirja elementi (õpilase sessiooni hinnete loend). Ja lõpuks sisaldab hindenimekirja element mitmeid hinde (hinnangu) elemente.

Selle loendi graafiline esitus joonisel fig. 4.3.1 on puustruktuur:

Riis. 4.3.1. SGML-dokumendi struktuur graafilises esituses

SGML-elementide täpsustamiseks saate kasutada atribuute. Atribuudid kirjutatakse elemendi algussildile järgmisel kujul:

atribuut-nimi="atribuudi-väärtus".

Ühel elemendil võib olla mitu atribuuti. Atribuudid eraldatakse üksteisest ja elemendi nimest vähemalt ühe tühikuga.

Näide 4.3.2. Näites 4.3.1 toodud hindeelementide jaoks saab määrata aineatribuudi, mille väärtus on distsipliini nimi, milles eksam sooritati. Seejärel on esimese õpilase elemendid järgmisel kujul:

A

B

B

B

Sellised keeled nagu SGML kasutavad andmerühmadega töötamiseks üksusi. Olem on mis tahes nimega andmed, nii tekstilised kui ka mittetekstilised. Dokumendi vaatamisel asendatakse olemi nimi selle väärtusega. Nii näiteks asendatakse tekstiolemi nimi kpi selle väärtusega: Kiievi Polütehniline Instituut ja mitteteksti olem pilt1 asendatakse kujutisega nimega image1.