XML в 10 тезисах

XML в 10 тезисах
  1. XML (eXtensible Markup Language) — расширяемый язык разметки, используемый для хранения и обмена данными.
  2. XML разметка состоит из тегов, которые определяют структуру и содержание документа.
  3. XML является самостоятельным языком, не зависящим от операционной системы или языка программирования.
  4. XML документы должны быть валидными, то есть соответствовать определенным правилам, заданным DTD (Document Type Definition) или XSD (XML Schema Definition).
  5. XML может использоваться для хранения и передачи различных типов данных — текстовых, числовых, дат и других.
  6. XML документы могут быть простыми или сложными, включать один или несколько уровней вложенности.
  7. XML обеспечивает возможность создания пользовательских тегов, что позволяет гибко описывать структуру данных.
  8. XML может использоваться для обмена данными между разными системами и приложениями.
  9. XML поддерживает различные методы обработки и преобразования данных, такие как XPath, XSLT и другие.
  10. XML является основой для множества других технологий и форматов, таких как RSS, SOAP, SVG и другие.

XML, Xlink, пространства имен, DTD, схемы, CSS, XHTML … Если вы только начинаете работать с XML, трудно понять, с чего начать. В этом кратком обзоре сделана попытка охватить основные идеи XML, что позволит новичкам увидеть смысл в целом, не увязая в деталях. Однако если вы представляете кому-то XML, почему бы не начать с этих десяти вкладов?

1. XML — это способ записи структурированных данных

Структурированные данные « обычно относятся к таким объектам, как бухгалтерские листы, адресные книги, настройки параметров, финансовые операции, технические планы и т.д. XML — это набор правил (их также можно рассматривать как инструкции или контракты) для разработки ячеек текстовой формы, которые могут структурировать данные. XML не является языком программирования, и вам не нужно быть программистом, чтобы использовать или извлекать его. XML упрощает для компьютеров создание и чтение данных и обеспечивает их четкую структурированность. XML позволяет избежать недостатков проектирования обычных языков. Это расширяемая, независимая платформа, включающая поддержку интернационализации и обнаружения. XML полностью совместим с Unicode.

ЧИТАТЬ ЕЩЁ:  Как пережить полный конец обеда или безопасность в PHP

(2) XML немного похож на HTML

Как и HTML, XML использует метки (слова, окруженные‘<‘ и &.#8216;>’) и функции (форма имени=»значение»). Однако если в HTML каждая метка и функция семантически определены, часто так, как текст отображается в браузере, то в XML метки используются только для логической маркировки данных, а их интерпретация остается на усмотрение программы обработки. Другими словами, если вы встретите одного#171;&#187- В XML-файле он не должен рассматриваться как абзац. В зависимости от контекста, это может быть цена, параметр, человек … (в любом случае, кто сказал, что это должно быть слово, начинающееся с ….#171;p»?)

3. хотя XML является текстом, он не предназначен для чтения.

Бухгалтерские ведомости, адресные книги или другие программы, работающие со структурированными данными, часто хранят эти данные на диске в двоичном или текстовом формате. Одним из преимуществ текстового формата является то, что данные можно просматривать по мере необходимости без использования программы, в которой они были созданы. По крайней мере, вы можете прочитать данные, записанные в текстовом виде, в своем любимом текстовом редакторе. Текстовая форма облегчает разработчикам удаление приложений. По этим причинам файлы XML, как и файлы HTML, являются текстовыми файлами. Они не предназначены для чтения человеком, но при необходимости могут быть прочитаны. Однако правила для XML-файлов намного строже, чем для HTML. Помарки или отсутствующие функции делают файл бесполезным, в то время как в HTML они явно разрешены или, по крайней мере, допускаются. Как указано в официальной спецификации XML, приложение не может предсказать автора недействительного XML-файла. Если файл недействителен, приложение должно немедленно остановиться и сообщить об ошибке.

4. XML намеренно моногамен

Поскольку XML является текстовым форматом и использует метки для маркировки данных, файлы XML почти всегда больше по размеру, чем соответствующие двоичные файлы. Это было преднамеренное решение разработчиков XML. Преимущества текста на основе текста очевидны (см. раздел 3), а недостатки обычно можно компенсировать на разных уровнях. Дисковое пространство не так дорого, поскольку такие программы, как ZIP или GZIP, могут очень быстро сжимать текстовые файлы. Кроме того, протоколы связи, такие как модемные протоколы и HTTP/1.1 (основной протокол Всемирной паутины), могут сжимать данные «

5. XML — это семейство технологий

Спецификация XML 1.0 определяет, что &.#171;тэги» и &.#171;атрибуты». Однако за XML 1.0 следует семейство XML — растущий набор модулей, предоставляющих полезные услуги для решения важных и часто встречающихся задач. Например, спецификация Xlink описывает стандартный способ добавления гиперссылок в XML-документ. XPointer — это аннуитет, который адресует части XML-документа. Xpointer немного похож на URL, но вместо того, чтобы появляться в документе в Интернете, он ссылается на часть данных в XML-файле. Каскадные таблицы стилей CSS можно применять к XML-документам так же, как и HTML. XSL — это более продвинутый язык листания стилей. Он основан на XSLT, языке преобразования, используемом для изменения, добавления и удаления меток и функций. DOM — это типичный интерфейс для обработки XML (и HTML) файлов в различных языках программирования. XML Schema 1 и 2 предназначены для того, чтобы разработчики могли четко определить свои собственные типы на основе XML. Другие модули и инструменты доступны или находятся в разработке. Обновления см. на странице технических отчетов W3C. 6.

ЧИТАТЬ ЕЩЁ:  Как создать сюрреалистический морской пейзаж

6. XML является новым, но не очень новым

Разработка XML началась в 1996 году, а с февраля 1998 года он является моделью W3C, что позволяет предположить, что он довольно незрелый. Но на самом деле это не так уж и ново. До XML существовал SGML, который был разработан в начале 1980-х годов и принят в качестве стандарта ISO в 1986 году. Он широко использовался в проектах с большим объемом документации. И, конечно, HTML, который начал развиваться в 1990 году, когда создатели XML взяли лучшие элементы SGML и, опираясь на опыт HTML, создали новые. Однако иногда трудно отделить эволюцию от революции … Следует также отметить, что SGML в основном используется для технических документов и гораздо меньше для других типов данных, в то время как для XML верно обратное.

7. XML преобразует HTML в XHTML

У документов XML есть важный формат: W3C XHTML, преемник HTML. Большинство элементов XHTML идентичны элементам HTML. Пенсии немного изменены для соответствия конвенциям XML. Документ, который является &.#171;XML-based&#187- Наследует аннуитеты XML и ограничивает их некоторым образом (например, XHTML позволяет& quot;< p&gt-, но & quot;< r&gt-, &quot-.), эта аннуитетность также приобретает семантическое значение (XHTML предусматривает ее#171;» семантический &.#171;параграф» (пункт) и не так#171;цена» (цена), &.#171;персона» (лицо) или что-то другое).

8. XML — Технология позвоночных

XML можно использовать для определения новых форм документации путем объединения и повторного использования уже созданных. Следует проявлять осторожность при объединении двух независимо разработанных форм, поскольку они могут иметь элементы или функции с одинаковым названием (которые следует различать &.#171;&#171- Предложения и.#171;paragraph» в одной из форм &.#171;person» к другому;). Для устранения возможной путаницы при одновременном использовании различных морфологий в XML предусмотрен механизм именования. XSL и RDF являются хорошими примерами морфологических типов на основе XML, использующих имена. XML Schema разработана для отражения этой поддержки соединений на уровне определения XML-документов, облегчая процесс создания новых форм с помощью существующих документов.

ЧИТАТЬ ЕЩЁ:  SQL - универсальный язык для работы с базами данных

9. XML -RDF и семантическая организационная база

Блок описания ресурсов W3C (RDF) — это форма текста на основе XML, которая поддерживает описание ресурсов и метаданных, таких как списки музыки, фотогалереи и библиографии. Например, RDF можно использовать для поиска людей в онлайн-фотоальбоме, используя информацию из личного списка контактов. Программы электронной почты могут автоматически инициировать отправку электронных сообщений людям, сообщающим о фотографиях в Интернете. Как HTML объединяет документы, меню и формы, так и RDF, который создает сегодняшнюю Всемирную паутину, объединяет приложения и агентов Семантической паутины. Точно так же, как людям нужны соглашения о концепции слов, которые они используют для общения друг с другом, компьютерам нужны механизмы для согласования концепции терминов, чтобы эффективно общаться. Формальное описание термина в одной области (например, рынок или строительство) называется онтологией и является важной частью семантической организации. RDF, онтологии и семантические представления позволяют компьютерам помогать людям в работе, все это относится к деятельности по организации семантики.

10. технология XML не требует лицензирования, не зависит от платформы и хорошо поддерживается.

Выбрав XML в качестве основы для своего проекта, вы получаете доступ к большому и растущему семейству инструментов (один из которых уже может делать то, что вам нужно!). и доступ к знаниям экспертов в области технологий. Выбор XML немного похож на выбор базы данных в SQL. Вы должны создать свою собственную базу данных и работать со своими собственными программами и процедурами, но есть много инструментов и людей, которые могут помочь вам. Кроме того, поскольку XML не имеет лицензии, вы можете создавать собственное программное обеспечение, не заплатив ни копейки. Большая и растущая база поддержки означает отсутствие привязанности к конкретному поставщику программного обеспечения. XML не всегда является лучшим решением, но его всегда стоит рассмотреть.

Оцените статью