GREENPANDA GLOSSAR

0-9 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z

XML

XML (Extensible Markup Language, deutsch: Erweiterbare Auszeichnungssprache) ist ein vom W3C entwickeltes und 1998 veröffentlichtes Textformat zur Darstellung hierarchisch strukturierter Daten – lesbar für Menschen und maschinell verarbeitbar zugleich. XML ist keine Programmiersprache, sondern eine Auszeichnungssprache: Sie legt fest, wie Daten benannt und strukturiert werden, ohne zu bestimmen, was mit ihnen zu tun ist. Tags – die Namen in spitzen Klammern – können frei gewählt werden, weshalb XML „extensible“ (erweiterbar) heißt. XML bildet die technische Grundlage für viele alltägliche Standards: DOCX- und XLSX-Dokumente von Microsoft Office sind intern XML-Dateien, RSS-Feeds sind XML, SVG-Grafiken sind XML, SEPA-Zahlungsverkehr läuft über XML, und zahlreiche Unternehmens-APIs tauschen Daten als XML aus.

Grundstruktur: Tags, Attribute und Baumstruktur

Eine XML-Datei besteht aus verschachtelten Elementen, die eine Baumstruktur bilden. Das folgende Beispiel zeigt einen kleinen Produktkatalog:

<?xml version="1.0" encoding="UTF-8"?>
<katalog kategorie="Notebooks">
<produkt id="001">
<name>ThinkPad T14 refurbished</name>
<preis waehrung="EUR">449.00</preis>
<verfuegbar>true</verfuegbar>
<zustand>Grade A</zustand>
</produkt>
</katalog>

Die wesentlichen Bestandteile im Überblick:

  • XML-Deklaration: Die erste Zeile <?xml version="1.0" encoding="UTF-8"?> ist optional, gibt aber die verwendete XML-Version und die Zeichencodierung an. UTF-8 ermöglicht alle Unicode-Zeichen einschließlich Umlauten.
  • Root-Element: Das äußerste Element umschließt alle anderen; jede XML-Datei hat genau eines (hier: <katalog>).
  • Elemente (Tags): Ein öffnendes Tag <name> und ein schließendes Tag </name> umschließen den Inhalt. Leere Elemente können als <bild/> ohne Schlusstag geschrieben werden.
  • Attribute: Schlüssel-Wert-Paare im öffnenden Tag, immer in Anführungszeichen: id="001", waehrung="EUR".
  • Textinhalt: Der eigentliche Datenwert zwischen öffnendem und schließendem Tag.

Syntaxregeln: Was XML von anderen Formaten unterscheidet

XML ist strenger als HTML. Ein einziger Syntaxfehler macht das gesamte Dokument für Parser ungültig. Die wichtigsten Regeln:

  • Groß-/Kleinschreibung: XML unterscheidet strikt zwischen <Titel> und <titel> – das sind zwei verschiedene Elemente.
  • Alle Tags müssen geschlossen sein: In HTML ist <br> ohne Schlusstag üblich; in XML muss es <br/> heißen.
  • Korrekte Verschachtelung: <a><b></a></b> ist ungültig; Tags müssen in der richtigen Reihenfolge geschlossen werden: <a><b></b></a>.
  • Attribute in Anführungszeichen: id=001 ist ungültig; korrekt: id="001".
  • Sonderzeichen escapen: Die Zeichen < > & müssen als &lt; &gt; &amp; geschrieben werden.

Well-formed und Valid: Zwei Qualitätsstufen

XML-Dokumente können zwei Qualitätsstufen erfüllen, die in der Praxis klar unterschieden werden:

Well-formed (wohlgeformt) bedeutet: Das Dokument befolgt alle grundlegenden XML-Syntaxregeln. Es gibt genau ein Root-Element, alle Tags sind korrekt geschlossen, Attribute stehen in Anführungszeichen, und Groß-/Kleinschreibung ist konsistent. Ein nicht wohlgeformtes Dokument kann von keinem XML-Parser verarbeitet werden – es ist schlichtweg kaputt. Jeder XML-Parser verweigert die Verarbeitung und wirft einen Fehler.

Valid (gültig) bedeutet: Das Dokument ist wohlgeformt UND entspricht einem definierten Schema. Das Schema legt fest, welche Elemente in welcher Reihenfolge vorkommen dürfen, welche Attribute erlaubt sind und welche Datentypen zulässig sind. SEPA-Zahlungsdateien müssen beispielsweise exakt dem ISO-20022-XSD-Schema entsprechen; eine fehlende oder falsch formatierte Bankverbindung macht die Datei für die Bank ungültig. Schema-Validierung ist damit die Qualitätssicherung für den Datenaustausch zwischen Systemen.

DTD und XSD: Schemas für Validierung

Für die Validierung von XML gibt es zwei Standards, die unterschiedlich leistungsfähig sind:

  • DTD (Document Type Definition): Der ältere Standard in einer eigenen Syntax. Definiert erlaubte Elemente und Attribute. Einfach zu schreiben, aber eingeschränkt: keine Datentypen, keine Namespaces. In neuem Code kaum noch eingesetzt.
  • XSD (XML Schema Definition): Der moderne Standard, selbst in XML geschrieben. Unterstützt Datentypen (Datum, Dezimalzahl, E-Mail-Format), Vererbung, Restriktionen (z. B. „Zahl zwischen 0 und 100″) und Namespaces. Basis für alle modernen XML-Standards: ISO-20022-SEPA, HL7-Gesundheitsdaten, UBL-Rechnungsformate, OOXML (DOCX/XLSX).

XML vs. HTML: Verwandt und doch verschieden

MerkmalXMLHTML
ZweckDatenspeicherung und -austauschDarstellung im Browser
TagsFrei definierbarVordefinierter Satz (<div>, <p> etc.)
Groß-/KleinschreibungStrikt (unterschieden)Nicht strikt
Schließende TagsAlle Tags müssen geschlossen seinTeilweise optional
FehlertoleranzNull – ein Fehler = ungültigBrowser korrigiert viele Fehler
DarstellungKeine Eigen-DarstellungBrowser rendert visuell

XML vs. JSON: Modernes Vergleichsformat

MerkmalXMLJSON
SyntaxAusführlicher, mehr ZeichenKompakter
KommentareJaNein (per Standard)
Native DatentypenNein (alles Text, Typen per Schema)Ja (Zahl, Boolean, Array, Null)
NamespacesUmfangreich unterstütztNicht vorhanden
Schema-ValidierungDTD und XSD ausgereiftJSON Schema vorhanden, weniger verbreitet
Typischer EinsatzEnterprise-Systeme, Office, SEPA, SVGREST-APIs, Web, mobile Apps

Für neue Projekte: JSON wenn Web-APIs und JavaScript-Ökosystem im Mittelpunkt. XML wenn Schema-Validierung, Namespaces oder Legacy-Kompatibilität nötig. In der Praxis existieren beide oft nebeneinander – ein System mit REST-API (JSON) und SEPA-Schnittstelle (XML) ist völlig normal.

Wo XML im Alltag steckt

XML ist selten direkt sichtbar, aber als Grundlage wichtiger Technologien allgegenwärtig:

  • Microsoft Office (DOCX, XLSX, PPTX): Moderne Office-Dokumente sind ZIP-Archive mit XML-Dateien darin. Eine .docx-Datei lässt sich in .zip umbenennen und entpacken – im Ordner word/ liegt document.xml mit dem gesamten Textinhalt. Das ermöglicht auch die manuelle Reparatur beschädigter Dokumente.
  • RSS- und Atom-Feeds: Nachrichten-Feeds von Websites werden als XML übertragen. Feed-Reader (Outlook, Feedly, Thunderbird) abonnieren und parsen diese XML-Dateien.
  • SVG (Scalable Vector Graphics): Vektorgrafiken im Web sind XML-Textdateien, die Formen, Pfade und Farben mit Tags beschreiben. SVGs können im Texteditor bearbeitet werden.
  • SEPA-Zahlungsverkehr: Alle SEPA-Zahlungsnachrichten (Überweisungen, Lastschriften) laufen als XML-Dateien nach ISO 20022. Buchhaltungssoftware erzeugt .pain.001.xml für Sammelüberweisungen, die Banken direkt einlesen.
  • Android-App-Layouts: Benutzeroberflächen von Android-Apps werden in XML-Layout-Dateien (activity_main.xml etc.) definiert.

XML praktisch bearbeiten und öffnen

XML-Dateien sind reine Textdateien und lassen sich mit jedem Texteditor öffnen. Für komfortables Bearbeiten mit Syntax-Hervorhebung und Strukturanzeige:

  • Notepad++ (Windows, kostenlos): Syntax-Highlighting für XML, automatisches Einrücken (Strg+Alt+Shift+B), Plugin für Treeview-Darstellung.
  • Visual Studio Code (kostenlos, alle Plattformen): Ausgezeichnete XML-Unterstützung mit farbigem Syntax-Highlighting, Auto-Vervollständigung beim Tippen, Schema-Validierung über Extension.
  • Browser: XML-Datei per Drag & Drop in Chrome, Firefox oder Edge öffnen – zeigt die Baumstruktur farbig und navigierbar.
  • PowerShell (Windows): [xml]$doc = Get-Content datei.xml lädt XML als navigierbares Objekt; $doc.katalog.produkt.name greift direkt auf Inhalte zu.

XML-Namespaces: Konflikte zwischen Standards vermeiden

Wenn verschiedene Unternehmen oder Standards denselben Tag-Namen verwenden – etwa <title> sowohl in einem RSS-Feed als auch in einem Buchkatalog –, entstehen Namenskollisionen. XML-Namespaces lösen dieses Problem durch Präfixe und Namespace-URIs. Das Präfix zeigt an, aus welchem Namespace (und damit welchem Standard) ein Element stammt. Im SEPA-Zahlungsverkehr etwa sind alle Elemente einem ISO-20022-Namespace zugeordnet, damit die Bank-Software genau weiß, welchem Standard die Datei entspricht. Namespaces ermöglichen es, Dokumente aus verschiedenen XML-Standards zu kombinieren, ohne Konflikte zu riskieren. Die Namespace-URI muss dabei keine abrufbare Webadresse sein; sie dient als eindeutiger Bezeichner für den Namespace.

XSLT: XML in andere Formate umwandeln

XSLT (Extensible Stylesheet Language Transformations) ist eine XML-basierte Sprache, um XML-Dokumente in andere Formate zu transformieren. Die häufigsten Anwendungsfälle: XML in HTML für die Webanzeige, XML in ein anderes XML-Format für den Datenaustausch zwischen Systemen mit unterschiedlichen Schemata, oder XML in CSV für die Weiterverarbeitung in Tabellenkalkulationen. XSLT wird besonders in Enterprise-Umgebungen eingesetzt, wo Daten von einem XML-Schema in ein anderes konvertiert werden müssen – zum Beispiel wenn ein Lieferant Produktdaten in seinem eigenen XML-Format liefert, der Empfänger aber ein anderes Schema erwartet. XSLT-Stylesheets selbst sind XML-Dateien und werden von einem XSLT-Prozessor ausgeführt.

XML in der E-Rechnung: Praxisbeispiel

Ein konkretes Alltagsbeispiel, das ab 2025 in Deutschland viele Unternehmen direkt betrifft: die E-Rechnung. Ab 1. Januar 2025 sind Unternehmen im B2B-Bereich in Deutschland verpflichtet, E-Rechnungen in strukturierten Formaten zu akzeptieren; ab 2027 gilt die Ausstellungspflicht. Die wichtigsten deutschen E-Rechnungsformate basieren alle auf XML:

  • XRechnung: Rein XML-basiertes Format nach europäischem Standard EN 16931. Von Bundesbehörden und vielen öffentlichen Auftraggebern bereits seit 2020 gefordert.
  • ZUGFeRD (ab Version 2.0 = Factur-X): Hybrid-Format: Eine PDF-Datei mit eingebetteter XML-Datei. Menschen sehen das PDF; Buchhaltungssoftware liest die XML automatisch aus.

Buchhaltungssoftware wie DATEV, Lexware oder SAP erzeugt diese XML-Dateien automatisch. Das Wissen, dass es sich um XML handelt, ist relevant: Bei Problemen mit dem Import kann man die Datei im Editor öffnen und auf offensichtliche Fehler prüfen.

XML und Windows: Konfiguration und Systemdateien

Auch im Windows-Umfeld begegnet man XML regelmäßig, ohne es immer zu merken:

  • Gruppenrichtlinien-Templates (ADMX): Administrative Templates für Gruppenrichtlinien sind XML-Dateien. Wer Gruppenrichtlinien für ein Unternehmensnetzwerk definiert, arbeitet mit ADMX-Dateien im XML-Format.
  • Visual Studio und MSBuild: .csproj- und .vbproj-Projektdateien sind XML. Build-Konfigurationen in MSBuild basieren vollständig auf XML.
  • Windows Installer (WIXS): WiX Toolset, ein verbreitetes Tool zur Erstellung von MSI-Installationspaketen, nutzt XML-Quelldateien.
  • Event Viewer: Windows-Ereignisprotokolle lassen sich als XML exportieren; bei der Fehlersuche in Unternehmensumgebungen ist das XML-Export-Format nützlich für automatisierte Auswertungen.

Im Unternehmensalltag mit Windows-Netzwerken sind XML-Kenntnisse ein nützliches Werkzeug: Wer die Grundstruktur kennt und einen guten Texteditor nutzt, kann beschädigte Konfigurationsdateien reparieren, SEPA-Exportdateien auf Plausibilität prüfen oder ADMX-Templates für Gruppenrichtlinien anpassen. Der Einstieg in XML ist niedrigschwellig – es sind keine Programmierkenntnisse erforderlich, da XML-Dateien in jedem Texteditor lesbar sind. Das macht XML trotz seines Alters zu einem dauerhaft relevanten Format in der IT-Praxis.

FAQ zu XML

Was ist XML?

XML (Extensible Markup Language) ist ein textbasiertes Datenformat zur hierarchischen Strukturierung von Daten. Es ist für Menschen lesbar und für Maschinen verarbeitbar. XML ist plattformunabhängig und bildet die Grundlage für DOCX/XLSX-Office-Dokumente, RSS-Feeds, SVG-Grafiken, SEPA-Zahlungsformate und viele Enterprise-APIs.

Was ist der Unterschied zwischen XML und HTML?

HTML dient der visuellen Darstellung im Browser mit vordefinierten Tags. XML dient dem Datenaustausch mit frei definierbaren Tags. XML ist streng: Ein einziger Syntaxfehler macht das Dokument ungültig. HTML-Browser tolerieren viele Fehler und versuchen, sie zu korrigieren.

Wozu wird XML heute noch genutzt?

XML ist Grundlage von DOCX/XLSX-Dokumenten, RSS-Feeds, SVG-Grafiken, Android-Layouts, SEPA-Zahlungsformaten und vielen Konfigurationsdateien. In Web-REST-APIs hat JSON XML weitgehend abgelöst, aber in Enterprise-Systemen, Dokumentformaten und regulierten Datenaustauschformaten bleibt XML dominant.

Was ist der Unterschied zwischen XML und JSON?

JSON ist kompakter, hat native Datentypen und ist heute Standard für Web-APIs. XML ist ausführlicher, unterstützt Namespaces und Kommentare und hat ausgereifte Schema-Validierung (XSD). XML dominiert in Legacy-Systemen und Dokumentformaten; JSON dominiert bei REST-APIs und mobilen Apps.

Was bedeutet well-formed XML?

Ein well-formed XML-Dokument folgt den Syntaxregeln: ein Root-Element, alle Tags korrekt geschlossen, Attribute in Anführungszeichen, konsistente Groß-/Kleinschreibung. Nicht wohlgeformte Dokumente werden von Parsern abgelehnt und können nicht verarbeitet werden.

Kann ich XML mit einem normalen Texteditor öffnen?

Ja, XML-Dateien sind reine Textdateien. Notepad++ und Visual Studio Code bieten komfortables Syntax-Highlighting. Browser zeigen XML-Dateien direkt als farbig strukturierten Baum. PowerShell lädt XML nativ als navigierbares Objekt.

Ist DOCX wirklich XML?

Ja. Eine .docx-Datei ist ein ZIP-Archiv mit mehreren XML-Dateien. Die Datei in .zip umbenennen und entpacken: Im Ordner word/ liegt document.xml mit dem gesamten Textinhalt und weiteren XML-Dateien für Formatierung und Metadaten.

Was ist XSD?

XSD (XML Schema Definition) beschreibt die erlaubte Struktur einer XML-Datei: welche Elemente vorkommen dürfen, in welcher Reihenfolge und mit welchen Datentypen. XSD ist moderner als DTD und heute Standard für SEPA-Zahlungsformate (ISO 20022), HL7-Gesundheitsdaten und viele B2B-Austauschformate.

Greenpanda Magazin Sidebar

Über uns

Als Spezialisten für refurbished Business-Hardware geben wir bei Greenpanda hochwertigen Geräten eine zweite Chance. Mit geprüfter Qualität, Garantie und einem starken Fokus auf Nachhaltigkeit bieten wir eine smarte Alternative zum Neukauf. Gemeinsam reduzieren wir Elektroschrott und schonen wertvolle Ressourcen – ohne Kompromisse bei Leistung und Service.