A dokumentum jelölőnyelveinek általános információi. Nézze meg, mi a "jelölőnyelv" más szótárakban. HTML jelölőnyelv és alapvető címkék

Szia kedves olvasó. Ideje mesélni HTML jelölőnyelv, amelynek segítségével abszolút minden internetes oldal jön létre - mind orosz, mind polgári, sőt kínai. De ez nem egy programozási nyelv, ahogy egyesek gondolják, hanem egy hipertext jelölőnyelv.

Hadd emlékeztesselek arra, hogy a hipertext olyan szöveg, amely más oldalakra és dokumentumokra mutató hivatkozásokat tartalmaz. A jelölőnyelv megmutatja, hogy hol és hogyan kell elhelyezni valamilyen szövegelemet, például egy bekezdést, egy címsort, egy listát stb. A HTML-hez szorosan kapcsolódó CSS ​​felelős ezeknek az elemeknek a kialakításáért, ami a tervezést oldalak szépek, olvashatók és könnyűek az oldalkód kirakásának köszönhetően.

A CSS mellett a html kiegészíthető a PHP és JavaScript programozási nyelvek olyan funkcióival, amelyek interaktívvá teszik az oldalakat, pl. a felhasználói műveletekre való reagálás képessége.
Mindezen eszközök segítségével bármilyen összetettséget és bármilyen funkciót elérhet. Maga a HTML nyelv csak a jelölésért felelős.

Weboldal belülről



<br>Ez az én honlapom <br>


Ez az én szövegem

Ebben a fenti kódban a következő parancsokat látja: címkéket, amelyeket néha úgy hívnak leírók. Ezek szögletes zárójelekbe vannak zárva. A címkék többnyire párosítva vannak. Nyítás<>és zárás, elöl perjel. A html jelölőnyelv összes kódja egymásba van ágyazva, és mintegy „matryoshkához” hasonlít, ahol az egyik tároló egy másikba van beágyazva.

Az alábbi ábra ennek a kódnak a dekódolását mutatja:

És így néz ki ugyanaz az oldal a Mozilla Firefox böngészőben. Megmutattam, hol jelenik meg a szöveg fejléc Címés szöveg címke Test

Hogyan készítsünk html oldalt

Az egyértelműség kedvéért másolja át a fenti címkékkel ellátott szöveget bármely szövegszerkesztőbe, például a Jegyzettömbbe, és mentse el az asztalra. Nyomja meg a jobb gombot, és válassza az „átnevezés” lehetőséget. A .txt kiterjesztés helyett, mint egy normál szövegfájl esetében, adja meg a .html vagy .htm kiterjesztést. A jegyzettömb ikon böngésző ikonra változik, amelyre kattintva megjelenik az első weboldal.

Ha a kiterjesztés nem jelenik meg, akkor a következőket kell tennie.

Keresse meg számítógépén: Megjelenés és személyre szabás - Mappabeállítások - Nézet.

A fájl kiterjesztésének megjelenítése mindig hasznos, így a támadók nem várhatják el, hogy egy "gift.jpg" fertőzést tartalmazó fájlt nyisson meg, amely valójában "gift.jpg.exe" lesz. A Windows által alapértelmezés szerint elrejtett kiterjesztés nélkül nagyon könnyű összetéveszteni a "rosszindulatú programok" indítófájlját egy rejtett .EXE kiterjesztéssel egy normál képpel.

Nézzen meg egy videót a HTML-oldalak létrehozásáról


Programok HTML oldalak készítésére

A HTML hiperszöveg jelölőkód kézi írása tapasztalat nélkül a figyelmesség és a kitartás súlyos próbájának tűnhet. De hidd el, csak ha ily módon erősíted képességeidet, akkor büszkén mondhatod magad webmesternek.

A html kód kézi írásának intelligens vezérléséhez számos program létezik kódkiemeléssel. Az amatőr fejlesztők körében a legnépszerűbb a Notepad ++, PHP Tervező, Dreamweaver

Az utolsó két program fizetős, de a régi verziók, amik semmivel sem rosszabbak, mint az újak, ingyen megtalálhatóak a neten és legálisan felhasználhatók az Ön igényeinek megfelelően. álomszövő egy vizuális szerkesztő. A tervezéssel ellátott szöveget kóddá alakítja. Mindenesetre nem fogja megbánni, ha megismerte ezt a hangszert.

Miért tanuljunk meg kézzel kódot írni? Az a helyzet, hogy minden vizuális szerkesztő, még a WordPressbe épített szerkesztő is, olykor annyi szemetet generál a saját kódjából, hogy az oldalak sokszorosa súlyúak, mint a fej-kéz segítségével megírtak. Igen, ha azt is figyelembe vesszük, hogy a keresőmotorok mostanra odafigyelnek a kód tisztaságára, akkor óhatatlanul a Html megtanulásán fog gondolkodni, hogy ellenőrizni tudja a teljes folyamatot.

Általában a Dreamweaver eleinte egy jó tanárt helyettesít. Használja ezt a programot, és nézze meg, hogyan készül egy html oldal. A legfontosabb, hogy ne legyen lusta megnézni a program felső ablakát, ahol a kód generálódik. Jegyezd meg magadnak, hogy a program hol végez valami pluszt.

Mi is az a böngésző valójában

Sokan úgy gondolják, hogy a böngészőt úgy tervezték, hogy webhelyeket keressen az interneten, és ez a célja. Így a PC-felhasználó megértésében téves vélemény alakul ki a böngésző céljáról. Valójában a böngésző egy program html kód, CSS kód, JS kód stb. értelmezésére. Más szóval, egy alkalmazás szoftver eszköz weboldalak és egyéb dokumentumok megjelenítésére.

A modern böngészők képességei valóban nagyszerűek. Hiszen a weboldalak különféle formátumú grafikákat, videókat és szövegeket tartalmaznak. A böngésző beolvassa a html kódot, látja az ott beágyazott videóanyagot, grafikus és szöveges kódot, és mindezt helyesen megjeleníti a készülék képernyőjén. Ebben segítenek neki a címkék, ezek a hétköznapi angol szavak szögletes zárójelben<>.

A böngésző a címkék segítségével látja, hogy a szövegnek melyik részét értelmezi az oldal neve, melyik a címsor, mit kell bekezdésként bemutatni, hova kell elhelyezni a képet, és útközben számos problémát megoldani egyszerű HTML-be ágyazott nyelvek.

HTML jelölőnyelv és alapvető címkék

közli a böngészővel, hogy ez egy HTML dokumentum
itt van információ a keresőmotorok számára
tartalom jelenik meg a böngészőablakban
lap cím

Címsorok: a legnagyobbtól a legkisebbig
Félkövér és dőlt szöveg kiválasztása
link szövege Közli a böngészővel, hogy ez egy hivatkozás a következő szöveggel: " link szövege«

Hozzon létre egy új bekezdést

bekezdés igazítás ( balra, jobbra, sorkizárt vagy középre)
Megkéri a böngészőt, hogy hozzon létre egy űrlapot

Ez a táblázat csak a fő leírók megjelenítésére szolgál.

A HTML5 modern verziójában az új címkékkel együtt rengeteg olyan újdonság jelent meg, amelyekről 10 évvel ezelőtt még csak álmodni sem mertek a weboldal-fejlesztők.

Stílusok a html dokumentumban

Amikor a böngésző megjeleníti egy weboldal tartalmát, akkor a címsorokat az egyik stílusban, a bekezdésszöveget egy másik stílusban jeleníti meg, és a betűméret is eltérő náluk. Ez minden böngészőben alapértelmezés szerint engedélyezve van. De szeretnénk látni egyedi weboldalterveket, és a CSS segít, lépcsőzetes stíluslap nyelv. A CSS segítségével beállíthatja bármely elem dizájnját, elkészítheti egy webdokumentum tetszőleges dizájnját.

A CSS egy stíluskiegészítés a html nyelvhez, és nem létezik nélküle.

A stílusok a HTML-ben így vannak beágyazva:

fej>

Ha külső stíluslapot használunk stílusok.css majd csatlakozik a html dokumentumhoz, így:

Példa a CSS-szabályok írására:

p (szín: fekete; betűtípus: x-small).

Közli a böngészővel, hogy a bekezdés színe

fekete- fekete, és a betűtípusnak van mérete x-kicsi(kicsi)

Így alakítom például a tartalmat a blog minden cikkének elején.

anons
(szegély: 2px zöld;
szegélysugár: 10 képpont
szélesség: 360
font-family: "Yeseva+One";
betűméret: 16 képpont;
vonalmagasság: 1,2 em; kitöltés: 10 képpont 10 képpont 10 képpont 20 képpont;
margó:10px auto 20px;
text-align:left;
háttérszín: #a7cece;
}

az utolsó sorban van egy érdekes részlet: background-color: #a7cece;

#a7cece- ez a html szín. A HEX karakterkészlet használatával - hexadecimális rendszer: számok 0-tól 9-ig és betűk A-tól F-ig, bármilyen színt beállíthat. Szép akvamarin található itt.

A CSS témájára külön kiadványokban térek vissza.

Hogyan tanuljunk meg HTML jelölőnyelvet

  • A web tele van HTML-re (html) való hivatkozásokkal. Tetszik a http://htmlbook.ru oldal. Gyakran járok ide referenciaanyagért. Időmegtakarítás érdekében ajánlott.
  • Andrej Bernatsky. Mindenképpen nézd meg!
  • Tetszik az amerikai szerzők könyve. Ez lenyűgöző HTML/CSS oktatóanyag az anyag olyan hűvös bemutatásával, hogy megállás nélkül olvassa el. Mindent egyszerűen és érthetően elmagyaráznak. A neten ingyen letölthető, de érdemesebb megvenni és úgy dolgozni vele, mint egy könyvvel.

A legtöbb A legjobb mód elsajátítani a nyelvet HTML jelölés(html) letöltheti a Runet leghíresebb tanfolyamait, emellett néhány teljesen ingyenes. Látogassa meg Jevgenyij Popov webhelyét, és töltsön le rengeteg hasznos anyagot oktatási információk. Szakmai képzéshez olvassa el a tájékoztatót.

Jelölőnyelvek

Jelölőnyelv(szöveg) a számítógépes terminológiában a szövegbe beillesztett karakterek vagy szekvenciák halmaza, hogy információt közvetítsen annak kimenetéről vagy szerkezetéről. A számítógépes nyelvek osztályába tartozik. A jelölőnyelvvel írt szöveges dokumentum nemcsak magát a szöveget tartalmazza (szósorozatként és írásjelként), hanem További információ különböző szakaszairól – például címsorok, kiemelések, listák stb. jelzése. Bővebben nehéz esetek A jelölőnyelv lehetővé teszi interaktív elemek és tartalom beszúrását más dokumentumokból a dokumentumba.

Meg kell jegyezni, hogy a jelölőnyelv nem Turing-teljes, és általában nem tekinthető programozási nyelvnek, bár szigorúan véve az.

HTML (angol nyelvből. Hyper Text Markup Language-- "Hypertext Markup Language") – Tim Berners-Lee brit tudós fejlesztette ki 1986 és 1991 között az Európai Központ falai között. nukleáris kutatás Genfben (Svájc). A HTML-t a tudományos és műszaki dokumentáció cseréjére szolgáló nyelvként hozták létre, amely alkalmas olyan emberek számára, akik nem szakértők az elrendezés területén. A HTML sikeresen kezelte az SGML összetettségét azáltal, hogy strukturális és szemantikai elemeket, úgynevezett leírókat definiált. A leírókat gyakran "címkéknek" is nevezik. A HTML segítségével könnyedén készíthet viszonylag egyszerű, mégis gyönyörűen megtervezett dokumentumot. A dokumentum szerkezetének egyszerűsítésén túl a HTML-hez a hipertext támogatása is hozzáadásra került. A multimédiás funkciók később kerültek hozzáadásra.

Kezdetben a HTML nyelvet a dokumentumok strukturálásának és formázásának eszközeként képzelték el és hozták létre anélkül, hogy a reprodukálás (megjelenítés) eszközéhez kötötték volna. Ideális esetben a HTML-jelöléssel ellátott szöveget stilisztikai és szerkezeti torzulások nélkül kell reprodukálni különféle technikai berendezésekkel (modern számítógép színes képernyője, szervező monokróm képernyője, mobiltelefon vagy eszköz korlátozott méretű képernyője és hangvisszaadási programok) szövegek). A HTML modern használata azonban nagyon távol áll eredeti céljától. Például címke

, többször használt oldalformázásra, a dokumentumokban leggyakrabban előforduló táblázatok létrehozására szolgál. Idővel a platform HTML-függetlenségének alapgondolatát feláldozták a multimédiás és grafikai tervezés modern igényeinek javára.

XML(Angol) ex feszíthetőM arkupL szög-- bővíthető jelölőnyelv; kiejtett [ ex-em-eml]) a World Wide Web Consortium (W3C) által ajánlott jelölőnyelv. Az XML specifikáció leírja az XML dokumentumokat, és részben leírja az XML processzorok (az XML dokumentumokat beolvasó és azok tartalmához hozzáférést biztosító programok) viselkedését. Az XML-t olyan egyszerű, formális szintaxisú nyelvnek tervezték, amellyel a programok könnyen létrehozhatnak és feldolgozhatnak dokumentumokat, miközben az emberek számára is könnyen olvasható és létrehozható, a webhasználatra helyezve a hangsúlyt. A nyelvet bővíthetőnek nevezzük, mert nem rögzíti a dokumentumokban használt jelöléseket: a fejlesztő szabadon készíthet jelölést egy adott terület igényei szerint, csak a nyelv szintaktikai szabályai korlátozzák. Az egyszerű formális szintaxis, az emberbarát jelleg, a bővíthetőség és a dokumentumok tartalmának Unicode kódolásaira való támaszkodás kombinációja mind magának az XML-nek, mind az XML-eredetű speciális nyelveknek a széles körben való elterjedéséhez vezetett. szoftver eszközök.

XHTML(Angol) Ex feszíthetőH ypert extM arkupL szög-- bővíthető hipertext jelölőnyelv) -- XML-alapú weboldal-jelölőnyelvek családja, amelyek megismétlik és kiterjesztik a HTML 4 képességeit. Az XHTML 1.0 és XHTML 1.1 specifikációi a World Wide Web Consortium ajánlásai, de a pillanatban a fejlesztését leállították a HTML használatának ajánlásával. Az XHTML új verziói nem kerülnek kiadásra.

A fő különbség az XHTML és a HTML között a dokumentum feldolgozása. Az XHTML dokumentumokat a moduljuk (elemző) az XML dokumentumokhoz hasonlóan dolgozza fel. A feldolgozás során a fejlesztők által elkövetett hibákat nem javítjuk ki.

Az XHTML megfelel az SGML specifikációnak, mivel az XML annak egy részhalmaza. A HTML számos funkcióval rendelkezik a feldolgozás folyamatában, és valójában már nem tartozik az SGML családhoz, amelyet a HTML 5 specifikáció tervezete tartalmaz.

A böngésző a szervertől kapott tartalom típusú fejléc alapján választja ki az elemzőt a dokumentum feldolgozásához:

HTML - szöveg/html

XHTML - application/xhtml+xml

· Az ügyfélen való helyi megtekintéshez a kiválasztás a fájlkiterjesztés alapján történik.

· BAN BEN internet böngésző 8-as verzióig nincs értelmező az XHTML dokumentumok feldolgozására.

WML(Angol) Vezeték nélküli jelölőnyelv-- "vezeték nélküli jelölőnyelv") -- a WAP-szabványnak megfelelő mobiltelefonokban és más mobileszközökben használható dokumentum-jelölőnyelv.

Felépítése némileg az egyszerűsített HTML-re hasonlít, de vannak lényeges különbségek, mivel a WML olyan eszközöket céloz meg, amelyek nem rendelkeznek a személyi számítógépek képességeivel (kis képernyő, nem minden eszköz képes grafikát megjeleníteni, kis memóriaméret stb.): minden információ A WML-t az úgynevezett „deckek” (Eng. fedélzet). A Dec a szerver által továbbítható legkisebb adategység. A paklik "kártyákat" tartalmaznak ( kártya) (minden térképet címkék korlátoznak És). Egy pakliban mindig legyen legalább egy kártya, de lehet több is. Ugyanakkor egyszerre csak egy kártya jelenik meg a készülék képernyőjén, ezek között a linkekre kattintva válthat a felhasználó – ezzel csökkenthető a szerver felé irányuló információkérések száma; ugyanakkor a WML oldalak mérete nem haladhatja meg az 1-4 kilobájtot.

VML(Angol) Vektoros jelölőnyelv-- vektoros jelölőnyelv) a Microsoft fejlesztette ki a vektorgrafikák leírására. A VML-t 1998-ban nyújtották be a W3C-hez a Microsoft, a Macromedia és mások. Ugyanebben az időben az Adobe, a Sun és több más cég is benyújtott PGML dokumentumokat megfontolásra. Később mindkét nyelv az SVG alapja lett.

PGML (Precíziós grafikus jelölőnyelv, lazán lefordítva oroszra - "precíziós grafikus jelölőnyelv") - XML-alapú jelölőnyelv, amely weboldal vektorgrafikáinak (diagramok, egyedi felületelemek) XML formátumú szöveg formájában történő leírására szolgál, képalkotási modellt használ , hasonlóan a PDF-hez és a PostScript-hez. Az Adobe Systems, az IBM, a Netscape Communications és a Sun Microsystems 1998-ban nyújtotta be a W3C konzorciumnak, de nem fogadták el az ajánlásnak megfelelően. Szinte ezzel egy időben a Microsoft benyújtotta megfontolásra VML projektjét, majd egy évvel később egy fejlettebb SVG nyelvet fejlesztettek ki, két technológia ötlete alapján. Az SVG megkapta a W3C ajánlást, és a weblapokon a vektorgrafikák leírásának fő formátuma lett.

SVG(angolról. S kábelezhetőV ktorG raphics-- méretezhető vektorgrafika) -- a World Wide Web Consortium (W3C) által létrehozott és az XML bővíthető jelölőnyelv részhalmazába beépített méretezhető vektorgrafikus jelölőnyelv kétdimenziós vektoros és vegyes vektoros/bittérképes grafikák leírására szolgál. XML formátumban. Támogatja mind az álló, mind az animált interaktív grafikát – vagy más szóval, deklaratív és forgatókönyvezett grafikát. Nem támogatja a háromdimenziós objektumok leírását. Ez egy nyílt szabvány, amely a W3C, a HTML és az XHTML szabványok mögött álló szervezet ajánlása. Az SVG a VML és PGML jelölőnyelveken alapul. 1999 óta fejlesztik.

XBRL(Angol) ex feszíthetőB üzletiR eportálásL szög, lit. Az Extensible Business Reporting Language egy nyílt szabvány az elektronikus pénzügyi jelentésekhez. Az XBRL formátum az Extensible Markup Language XML-en alapul. Az XBRL az XML szintaxist, valamint az XML-hez kapcsolódó technológiákat használja, például az XML névteret, az XML sémát, az XLink-et és az XPath-ot. Az XBRL egyik célja a pénzügyi információk, például a vállalatok pénzügyi kimutatásainak képviselete és cseréje. Az XBRL nyelvi specifikációt az XBRL International, Inc., egy független nemzetközi szervezet fejlesztette ki és tette közzé.

A web vizuális érzékelésének javítása érdekében széles körben elterjedt a CSS technológia, amely lehetővé teszi számos weboldal egységes tervezési stílusának beállítását. Egy másik figyelemre méltó újítás az URN erőforrás-elnevezési rendszer. Egységes erőforrásnév).

A World Wide Web fejlesztésének népszerű koncepciója a szemantikus web létrehozása. A Szemantikus Web a meglévő világháló kiegészítője, amelynek célja, hogy a hálózaton közzétett információkat érthetőbbé tegye a számítógépek számára. A szemantikus web egy olyan hálózat fogalma, amelyben minden erőforrás be van kapcsolva emberi nyelv számítógép számára érthető leírással látnák el. A szemantikus web világosan strukturált információkhoz biztosít hozzáférést bármely alkalmazás számára, platformtól és programozási nyelvtől függetlenül. A programok képesek lesznek maguk megtalálni a szükséges forrásokat, feldolgozni az információkat, osztályozni az adatokat, azonosítani a logikai összefüggéseket, következtetéseket levonni, sőt ezek alapján döntéseket hozni. Ha széles körben alkalmazzák és jól alkalmazzák, a szemantikus web képes forradalmasítani az internetet. Egy erőforrás számítógépbarát leírásának létrehozásához a szemantikus web az RDF formátumot használja (Eng. Erőforrás leírási keretrendszer), amely XML szintaxison alapul, és URI-kat használ az erőforrások azonosítására. Ezen a területen újdonság az RDFS (eng. RDF séma) és SPARQL (eng. Protokoll és RDF lekérdezési nyelv) új nyelv lekérdezések az RDF adatok gyors eléréséhez.

(Standard Generalized Markup Language), amely az ISO 8879 szabványban szerepel.Ez a nyelv elfogadott a műszaki dokumentáció tervezésének fő nyelveként, beleértve a CALS technológiákban készült termékek interaktív elektronikus műszaki kézikönyveit is.

Az SGML a dokumentumok szerkezetét adatobjektumok sorozataként határozza meg. A dokumentum részeit reprezentáló adatobjektumok különböző fájlokban tárolhatók. Az SGML szabvány olyan szimbólumkészleteket és szabályokat hoz létre az információk megjelenítésére, amelyek lehetővé teszik a különböző rendszerek számára, hogy helyesen felismerjék és azonosítsák ezeket az információkat. Ezeket a készleteket a dokumentum különálló része írja le, az úgynevezett DTD (Document Type Definition), amelyet a fő SGML dokumentummal együtt továbbítanak. A DTD meghatározza a karakterek és kódjaik közötti megfelelést, a felhasznált azonosítók maximális hosszát, a címkék elválasztóinak megjelenítési módját, egyéb lehetséges konvenciókat, a DTD szintaxisát, valamint a dokumentum típusát és verzióját. Ezért az SGML metanyelvnek nevezhető bizonyos jelölőnyelvek családjához. Különösen az XML és HTML jelölőnyelvek tekinthetők az SGML részhalmazainak.

Az SGML dokumentum formájú műszaki leírás a következőket tartalmazza:

  • a fő fájl a műszaki kézikönyvvel, SGML címkékkel megjelölve;
  • az entitások leírása, ha a dokumentum olyan csoporthoz tartozik, amelyben ugyanazokat az entitásokat használják, és hírnévre utalnak;
  • szótár az SGML címkék magyarázatához;

Az SGML-t azonban nehéz megtanulni és használni. Ezért a WWW-technológiákban bemutatott dokumentumokban a jelölések széleskörű felhasználására 1991-ben SGML-en alapuló egyszerűsített HTML-t (HyperText Markup Language), 1996-ban pedig XML-t (eXtensible Markup Language) fejlesztettek ki, amely A HTML a fő nyelv a dokumentumok különböző alkalmazásokban történő megjelenítéséhez.

A HTML nyelvet azzal a céllal fejlesztették ki, hogy széles körben alkalmazzák a jelöléseket a WWW technológiákban bemutatott dokumentumokban.

A HTML-leírás ASCII-szöveg és a benne foglalt parancsok (vezérlőkódok) sorozata, amelyeket leíróknak vagy címkéknek is neveznek. Ezt a szöveget HTML-dokumentumnak vagy HTML-oldalnak, vagy a webszerveren való elhelyezés után weblapnak nevezzük. A címkék a megfelelő helyekre kerülnek a forrásszövegben, meghatározzák a betűtípusokat, az elválasztást, a grafikai képek megjelenését, linkeket stb. WWW szerkesztők használatakor a parancsok beszúrása a megfelelő billentyűk megnyomásával történik.

Az XML a HTML-hez hasonlóan az SGML részhalmazának tekinthető. Jelenleg az XML azt állítja, hogy ez a fő nyelv a dokumentumok megjelenítéséhez információs technológia, egy olyan metanyelvnek tekinthető, amely a privát jelölőnyelvek létrehozásának alapjául szolgál különféle alkalmazásokban. Ugyanakkor az XML kényelmesebb, mint az SGML, amit az SGML néhány kisebb funkciójának az XML-ben való kiiktatása biztosít. Az XML-ben található leírások könnyebben érthetők, a modern böngészőkben való használatra adaptálva az SGML alapvető funkcióinak megőrzése mellett.

Egyes alkalmazásokhoz saját XML-változatokat készítenek, amelyeket XML-szótárnak vagy XML-alkalmazásnak neveznek. Így a speciális matematikai szimbólumokat tartalmazó szövegek leírására egy XML-alkalmazás OSD-t (Open Software Description) fejlesztettek ki. A CALS esetében az adatcsere Product Definition eXchange (PDX) változata érdekes. Ismert szótárak a kémiához (CML – Chemical Markup Language), biológiához (BSML – Bioinformatic Sequence Markup Language) stb.

Könnyű jelölőnyelvek

Azokat a nyelveket, amelyeket egyszerű és gyors szövegírásra terveztek egy egyszerű szövegszerkesztőben, hívják könnyűsúlyú(en:Lightweight jelölőnyelv). Az ilyen nyelvek jellemzői:

  • Minimális jellemzők.
  • Támogatott címkék kis készlete.
  • Könnyű megtanulni.
  • Az ilyen nyelvű forrásszöveg ugyanolyan könnyen olvasható, mint a kész dokumentum.

Ott használatosak, ahol az embernek szöveget kell készítenie egy normál szövegszerkesztőben (blogok, fórumok, wikik), vagy ahol fontos, hogy egy normál szövegszerkesztővel rendelkező felhasználó is el tudja olvasni a szöveget. Íme néhány széles körben használt könnyű jelölőnyelv:

  • Wiki jelölés (lásd Wikipédia: Cikkek szerkesztése)
  • Különféle automatikus dokumentációs rendszerek (pl. Javadoc).

Sztori

A "markup" (markup) kifejezés a "jelölés" kifejezésből származik ( Mark, jelölés- Eng.) abból a hagyományos kiadói gyakorlatból, hogy a kézirat vagy a lektorálás margójára és szövegébe speciális feltételes jeleket tesznek a nyomtatásra küldés előtt. Így a „jelölőemberek” a szöveg egyes részeinek betűtípusát, stílusát és betűméretét jelezték. A szövegjelölést manapság szerkesztők, lektorok, grafikusok – és természetesen maguk a szerzők – végzik.

GenCode

A jelölőnyelvek számítógépes szövegszerkesztésben való használatának ötletét valószínűleg először William Tunnicliffe vezette be. William W. Tunnicliffe ) egy 1967-es konferencián. Javaslatát ő maga "univerzális kódolásnak" nevezte (Eng. általános kódolás). Az 1970-es években Tunnicliffe vezette a GenCode szabvány kiadói ipar számára történő kidolgozását, majd a Nemzetközi Szabványügyi Szervezet (ISO) bizottságának elnöke lett. Nemzetközi Szabványügyi Szervezet ), aki létrehozta az SGML-t, az első leíró jelölőnyelvet. Brian Reid (ur. Brian Reid ) disszertációjában, amelyet 1980-ban védett meg a Carnegie Egyetemen (Eng. Carnegie Mellon Egyetem ), a javasolt koncepció kidolgozása során a leíró jelölés gyakorlati megvalósítását végezte.

Charles Goldfarbot, az IBM kutatóját azonban ma már a jelölőnyelvek "atyjaként" emlegetik. Charles Goldfarb ). Az alapkoncepció 1969-ben fogalmazódott meg benne, miközben egy primitív, ügyvédi irodák számára készült dokumentumkezelő rendszeren dolgozott. Ugyanebben az évben részt vett az IBM GML nyelv megalkotásában, amelyet először 1973-ban vezettek be.

A számítógépes jelölőnyelvek néhány korai megvalósítása megtalálható a UNIX tipográfiai segédprogramokban, például a troff és az nroff. Lehetővé teszik formázási parancsok beszúrását a dokumentum szövegébe, hogy a szerkesztő követelményei szerint formázzák azt.

Kiadói szoftver elérhetősége WYSIWYG funkcióval (eng. « amit te lásd, mit kapsz" amit lát, azt kapja) kiszorította e nyelvek többségét az általános felhasználók körében, bár a komoly kiadói munkák továbbra is használnak jelöléseket bizonyos nem vizuális szövegstruktúrákhoz, és a WYSIWYG szerkesztők ma már leggyakrabban jelölőnyelven alapuló formátumban mentik el a dokumentumokat. .

TeX

Egy másik fontos kiadói szabvány a TeX, amelyet Donald Knuth hozott létre, majd fejlesztett tovább a huszadik század 70-es és 80-as éveiben. A TeX egyesítette a hatékony szövegformázási és betűtípusleírási lehetőségeket, különösen a professzionális minőségű matematikai könyvek esetében. Ez sok időt vett igénybe, amíg Knuth megtanulta a szedés művészetét. A TeX azonban lejtmenetbe került, így mostanra főként itt használják tudományos világ, hol van a de facto szabvány számos tudományágban. A Tex mellett létezik a LaTeX, amely egy széles körben használt TeX-alapú leíró jelölőrendszer.

Scribe, GML és SGML

Az első nyelv, amely világosan és határozottan megkülönbözteti a dokumentum szerkezetét és fajtáját, a Scribe volt, amelyet Brian Reid doktori disszertációja hozott létre és írt le 1980-ban. A Scribe a feldolgozás módjában volt forradalmi, nem pedig benne utolsó kanyar a bevezetett stílusgondolat miatt, elválasztva a tényleges szövegtől és a nyelvtantól, és szabályozza a leíró elemek használatát. Scribe befolyással volt a GML nyelv (később SGML) fejlesztésére, és a HTML és a LaTeX nyelvek közvetlen őse is.

A 80-as évek elején az a gondolat, hogy a jelölésnek a dokumentum strukturális aspektusaira kell összpontosítania, és a dokumentum külső megjelenítését az értelmezőre kell hagynia, az SGML létrehozásához vezetett. A nyelvet egy Goldfarb vezette bizottság fejlesztette ki. Számos forrásból, köztük a Tunnikofflick projektből, a GenCode-ból származó ötleteket egyesítette. Sharon Adler, Anders Berglund és James A. Marke is kulcsfontosságú tagjai voltak az SGML bizottságnak.

Az SGML pontosan meghatározta a szintaxist a jelölések szövegbe foglalásához, valamint külön leírja, hogy mely címkék engedélyezettek és hol (DTD - Document Type Definition). Ez lehetővé tette a szerzők számára, hogy tetszőleges jelölést hozzanak létre és használhassanak, kiválasztva a használni kívánt címkéket, és a normál nyelven nevezve őket. Így az SGML-t metanyelvnek kell tekinteni; több speciális jelölőnyelv is származott belőle. A 80-as évek vége volt a legjelentősebb az SGML-en alapuló új jelölőnyelvek, például a TEI és a DocBook megjelenésében.

1986-ban az SGML-t az ISO 8879 nemzetközi szabványként publikálták. Az SGML széles körben elfogadott és széles körben használatos nagyon nagy projektekben. Általában azonban nehézkesnek és nehezen megtanulhatónak találták, a nyelv mellékhatása volt, hogy túl sokat próbált tenni és túl rugalmas volt. Például az SGML olyan zárócímkéket (vagy kezdőcímkéket, vagy akár mindkettőt) hozott létre, amelyekre nem mindig volt szükség, mert úgy gondolta, hogy ezt a jelölést a projekt támogató személyzete manuálisan adja hozzá, és értékelné a billentyűleütések megtakarítását.

HTML

1991-re az SGML használata az üzleti programokra és adatbázisokra korlátozódott, míg a WYSIWYG eszközöket (amelyek szabadalmaztatott bináris formátumban mentették a dokumentumokat) más dokumentumfeldolgozó programokhoz használták. A helyzet megváltozott, amikor Sir Tim Berners-Lee kollégájától, Anders Berglandtől értesült az SGML-ről. Anders Berglund ) és mások a CERN-nél az SGML szintaxist használták a HTML létrehozásához. A nyelv hasonlóságokat mutatott más, az SGML szintaxison alapuló jelölőnyelvekkel, de sokkal könnyebb volt elkezdeni, még azoknak a fejlesztőknek is, akik még soha nem tették. Steven DeRose azzal érvelt, hogy a leíró jelölést használó HTML (és különösen az SGML-ből) fontos tényező volt a web fejlődésében, mivel rugalmasnak és bővíthetőnek tervezték (valamint más tényezők is, mint például az URL-ek fogalma és a böngészők szabad használata ). A HTML ma a világ legvonzóbb és leggyakrabban használt jelölőnyelve.

A HTML jelölőnyelvként való státuszát azonban egyes informatikusok vitatták. Fő érvük az, hogy a HTML korlátozza a címkék elhelyezését azáltal, hogy mindkét címkét más címkékbe vagy a dokumentum fő címkéibe kell beágyazni. Ennek eredményeként ezek a tudósok a HTML-t egy hierarchikus modellt követő konténernyelvnek tekintik.

XML

Az XML (Extensible Markup Language) egy ma széles körben használt meta-jelölőnyelv. Az XML-t a World Wibe Web Consortium fejleszti a Jon Bosak elnökletével működő bizottságban. Az XML fő célja, hogy egyszerűbb legyen, mint az SGML, és egy konkrét problémára összpontosítson – a weben található dokumentumokra. Az XML egy metanyelv, mint az SGML, a felhasználók tetszőleges címkéket hozhatnak létre (ezért "bővíthető"). Az XML térnyerését segítette, mert minden XML dokumentumot ugyanúgy lehetett írni, mint egy SGML dokumentumot, és az SGML-t használó programok és felhasználók meglehetősen könnyen áttérhettek XML-re.

Az XML azonban elveszítette az SGML számos emberközpontú funkcióját, amelyek megkönnyítették a használatát (amíg a jelölések mennyisége meg nem nőtt, és az olvashatóság és a szerkeszthetőség vissza nem álltak ugyanarra a szintre). Más fejlesztések javítottak néhány SGML-problémát nemzetközi szinten, és lehetővé tették a dokumentumok hierarchikus elemzését még akkor is, ha nem volt elérhető DTD.

Az XML-t elsősorban félig strukturált környezetekhez, például dokumentumokhoz és kiadványokhoz tervezték. Ez azonban a rugalmasság és az egyszerűség közötti édes pontot eredményezte, és sok felhasználó gyorsan átvette. Manapság az XML-t széles körben használják a programok közötti adatátvitelre. A HTML-hez hasonlóan "tároló" nyelvként írható le.

XHTML

2000 januárja óta a W3C-hez intézett összes ajánlás XML-en, nem pedig SGML-en alapul, az XHTML (Extensible HyperText Markup Language – Extensible HyperText Markup Language) mozaikszót javasolták. A nyelvi specifikációk megkövetelték, hogy az XHTML-dokumentumokat XML-dokumentumként kell formázni, ez lehetővé teszi az XHTML használatát világosabb és pontosabb dokumentumokhoz HTML-címkék segítségével.

Az egyik legfigyelemreméltóbb különbség a HTML és az XHTML között az a szabály, hogy minden címkét le kell zárni: az üres címkéket pl.<br/> mindkettőt szabványos végcímkével vagy speciális bejegyzéssel kell zárni:<br/> (a záró címkében a "/" előtti szóköz nem kötelező, de gyakran használják, mivel egyes XML előtti böngészők, az SGML elemzők is használják). A címkékben szereplő többi attribútumnak idézőjelben kell lennie. Végül minden címkét és attribútumnevet kisbetűvel kell írni a helyes olvasáshoz; A HTML nem érzékeny a kis- és nagybetűkre.

Egyéb XML alapú fejlesztések

Számos XML-alapú fejlesztést használnak ma már, mint például az RDF (Resource Description Framework), az XFORMS, a DocBook, a SOAP és az OWL (Ontology Web Language).

Sajátosságok

Az összes jelölőnyelv közös jellemzője, hogy a dokumentum szövegét keverik a jelölési utasításokkal egy adatfolyamban vagy fájlban. Nem szükséges, a jelölések elkülönítése a szövegtől mutatókkal, címkékkel, azonosítókkal vagy egyéb koordinációs módszerekkel lehetséges. Ez az „elkülönített jelölés” a jelölődokumentumokkal dolgozó programok belső megjelenítésére jellemző. A beágyazott vagy "sorközi" jelölés azonban máshol elfogadottabb. Például itt van egy kis szövegrész HTML-lel megjelölve:

Anatidae

A család Anatidae magában foglalja a kacsákat, libákat és hattyúkat, de nem a közeli rokon sikoltozók.

Jelölési utasítás kódja (címkékként ismert), szögletes zárójelekkel körülvéve<как здесь>. Az utasítások közötti szöveg a dokumentum szövege. Kódok h1, pÉs em- példák a szerkezeti jelölésekre, leírják a bennük szereplő szöveg helyzetét, célját vagy jelentését.

Pontosabban, h1 azt jelenti, hogy "ez egy első szintű címsor", p azt jelenti, hogy "ez egy bekezdés", és em azt jelenti, hogy "ez az aláhúzott szó vagy kifejezés". Az értelmező ezeket a szabályokat vagy stílusokat alkalmazhatja a szöveg különböző részeinek megjelenítésére, szükség szerint különböző betűtípusok, betűméretek, behúzások, színek vagy más stílusok használatával. A h1-hez hasonló címkéket például nagy, félkövér betűtípussal lehet megjeleníteni, vagy az egyszóközű szöveget tartalmazó dokumentumban (például egy írógépen) aláhúzható, vagy egyáltalán nem változtathatja meg a megjelenést.

A kontraszt kedvéért jelölje be én HTML-ben egy példa a vizuális jelölésre; általában a szöveg meghatározott jellemzőinek azonosítására szolgál (ebben a blokkban használjon dőlt betűtípust) magyarázat nélkül.

A TEI (Tex Encoding Initiative) átfogó útmutató dokumentumokat tett közzé, amelyek meghatározzák, hogyan kell kódolni szöveget az emberiség és a tudományos társaságok javára. Ezeket az útmutatókat használták a kódoláshoz történelmi dokumentumok, tudósok konkrét munkái, folyóiratok és így tovább.

Alternatív felhasználások

Miközben kialakult a jelölőnyelvek szöveges dokumentumokkal való használatának ötlete, ez megnövelte a jelölőnyelvek használatát más területeken, ami arra utal, hogy különféle típusú információk megjelenítésére használják őket, beleértve a lejátszási listákat, vektorgrafikákat, webszolgáltatásokat. , felhasználói felületek. Ezeknek az alkalmazásoknak a többsége XML-alapú, mivel ez egy erősen strukturált és bővíthető nyelv.

Az XHTML nyelv használata azt is mutatja, hogy kombinálható ugyanazon profil különböző jelölőnyelveivel, mint például az XHTML+SMIL vagy az XHTML+MathML+SVG.

Minden dokumentum három összetevőből áll:

szerkezet;

A tartalom a dokumentumban megjelenő információ. A papíron lévő dokumentum tartalma lehet pusztán szöveges, és tartalmazhat képeket is. Ha a dokumentumot elektronikus formában mutatják be, az tartalmazhat multimédiás adatokat, valamint hivatkozásokat más dokumentumokra. Bár a különböző dokumentumok tartalma eltérő, típus szerint osztályozhatók, például könyv vagy vonatjegy.

A dokumentum stílusa határozza meg, hogy a tartalma milyen formában jelenik meg egy adott eszközön (például nyomtatón vagy kijelzőn). A stílus fogalma magában foglalja a teljes kimeneti dokumentum vagy egyes blokkjainak betűtípusának (név, méret, szín) jellemzőit, az oldalszámozás sorrendjét, a blokkok elrendezését az oldalakon és egyéb paramétereket. Ugyanaz a dokumentum különböző stílusokban jeleníthető meg különböző adathordozókon és ugyanazon az adathordozón.

A dokumentumjelölő nyelvek olyan mesterséges nyelvek, amelyek egy dokumentum szerkezetét és a különböző szerkezeti objektumok közötti kapcsolatokat írják le. A jelölési adatokat metaadatoknak is nevezik.

Az első jelölőnyelv a GML (Generalized Markup Language), amelyet az IBM alkalmazottai fejlesztettek ki még a múlt század 60-as éveiben. Közvetlen utódja az SGML nyelv (Standard Generalized Markup Language – a szabványos általánosított jelölőnyelv) volt, amely a dokumentumjelölő elemek írásának szabályait határozza meg. A nyelv szabályait követő dokumentumot SGML-dokumentumnak nevezzük.

Az SGML nyelvet az ISO 8879 szabvány határozza meg, amely a következő alapvető követelményeket határozza meg a dokumentum jelölőnyelvre vonatkozóan:

A nyelvnek ember által olvashatónak kell lennie.

· A megjelölt dokumentumfájloknak szövegesnek kell lenniük, és ASCII (amerikai szabványos információcsere kód) kódkarakterekkel kell kódolniuk. A dokumentum tartalmának azonban nem kell ASCII kódolásúnak vagy szövegesnek lennie.

Az SGML és a hasonló nyelvek speciális dokumentumjelölő eszközöket használnak:

Elemek és kapcsolódó attribútumok;

· entitások (entitások);

Hozzászólások.

Az SGML dokumentum szerkezeti egysége egy elem. A jelölőszövegben minden elemet meghatározott módon kell kiemelni. A kiválasztás egy kezdőcímke beszúrásával történik (tól angol szó tag - label) az elem elején (start tag) és a zárócímke (end tag) az elem végén. A kezdő és záró címke neve megegyezik. A címkéknek az egyszerű szövegtől való megkülönböztetéséhez egy karakterrel kell kezdődniük - a címke kezdetének jelével, és egy karakterrel kell végződniük - a címke végének jelével. Ezen túlmenően, egy szimbólum van megadva a végcímkében - a végcímke jele. Az SGML-ben bármilyen karakter megadható ilyen jelként, azonban a "<" (левая угловая скобка), в качестве признака окончания тега используется символ ">" (bal oldali szögletes zárójel), és a "/" (perjel) karakter a zárócímke. Az SGML-dokumentum elemei más elemeket is tartalmazhatnak, így az SGML-dokumentum hierarchikus (fa) struktúraként jelenik meg grafikusan.


4.3.1. példa. Egy SGML dokumentum, amely a hallgatók listáját tartalmazza a vizsgaidőszak eredményeivel, az alábbiak szerint adható meg:

A foglalkozáson tanuló osztályzatok listája

Ivanov Ivan Ivanovics

TS-61

A

B

B

B

Petrov Petr Petrovics

TS-62

C

C

D

C

Ebben a dokumentumban az első elem a tanulólista elem. Ez az elem egy címelemet (title) és több tanulói elemet (tanulói adatok) tartalmaz. Minden tanulói elem viszont tartalmaz egy teljes név elemet (a tanuló vezetékneve, keresztneve és apaneve), egy csoportszám elemet (csoportszám) és egy jegylista elemet (a foglalkozáson tanuló osztályzatok listája). És végül az érdemjegylista elem több jegy (értékelési) elemet tartalmaz.

Ennek a listának grafikus ábrázolása az ábrán. A 4.3.1 fa szerkezettel rendelkezik:

Rizs. 4.3.1. SGML dokumentum struktúra grafikus ábrázolásban

Az attribútumok segítségével finomíthatja az SGML elemeket. Az attribútumok egy elem kezdőcímkéjébe íródnak a következő formában:

attribútum-név="attribútum-érték".

Egy elemnek több attribútuma is lehet. Az attribútumokat legalább egy szóköz választja el egymástól és az elem nevétől.

4.3.2. példa. A 4.3.1. példa jegyelemeinél megadható a tárgyattribútum, melynek értéke annak a tudományágnak a neve, amelyben a vizsgát tettek. Ezután az első tanuló számára az elemek a következő formában lesznek:

A

B

B

B

Az olyan nyelvek, mint az SGML, entitásokat használnak az adatcsoportokkal való munkavégzéshez. Az entitás bármely megnevezett adat, szöveges és nem szöveges is. A dokumentum megtekintésekor az entitás neve helyére annak értéke kerül. Így például a kpi szövegentitás nevét felváltja az értéke: Kijevi Politechnikai Intézet, a kép1 nem szöveges entitást pedig egy kép1 nevű kép fogja lecserélni.