La web semántica es una visión sobre una extensión de la World Wide Web existente, que proporciona a los programas de software metadatos interpretables por máquina de la información y los datos publicados. En otras palabras, añadimos descriptores de datos adicionales a contenido y datos existentes en la web. Como resultado, las computadoras pueden realizar interpretaciones significativas similares a la forma en que los humanos procesan la información para lograr sus objetivos.

La ambición última de la web semántica, según su fundador Tim Berners-Lee, es permitir que las computadoras manipulen mejor la información en nuestro nombre. Además, explica que, en el contexto de la web semántica, la palabra semántica indica procesable por máquina o lo que una máquina puede hacer con los datos. Mientras que web transmite la idea de un espacio navegable de objetos interconectados con mapeos de URIs a recursos.
La evolución de la visión de la web semántica
Lo que hay detrás de la visión original de la web semántica se engloba en tres cosas: automatización de la recuperación de información, Internet de las cosas y asistentes personales. Puedes leer más sobre los tres en el artículo seminal de Tim Berners-Lee, James Hendler y Ora Lassila, publicado en Scientific American: The Semantic Web.
Con el tiempo, sin embargo, el concepto evolucionó hacia dos tipos importantes de datos, que, juntos, implementan su visión actual. Estos son Linked Open Data y Metadata Semántico.
Linked Open Data: El camino a través del laberinto de los datos
Para que la web semántica funcione, las computadoras deben tener acceso a colecciones estructuradas de información y conjuntos de reglas de inferencia que puedan utilizar para realizar razonamiento automatizado.
Los Datos Abiertos Enlazados (LOD) son datos estructurados modelados como un grafo y publicados de manera que permiten la interconexión entre servidores. Esto fue formalizado por Tim Berners-Lee en 2006 como las cuatro reglas de los datos enlazados:
- Utilizar URIs como nombres para las cosas.
- Utilizar URIs HTTP para que las personas puedan buscar esos nombres.
- Cuando alguien busca una URI, proporcionar información útil utilizando los estándares (RDF*, SPARQL).
- Incluir enlaces a otras URIs para que puedan descubrir más cosas.
Los LOD permiten tanto a las personas como a las máquinas acceder a datos en diferentes servidores e interpretar su semántica con mayor facilidad. Como resultado, la web semántica trasciende de un espacio que comprende documentos enlazados a un espacio que comprende información enlazada. Lo cual, a su vez, potencia la creación de una red interconectada de significado procesable por máquina.
Los Datos Abiertos Enlazados incluyen:
- Datos factuales sobre entidades y conceptos específicos (por ejemplo, Varna, la Segunda Guerra Mundial o la teoría del calentamiento global).
- Ontologías: esquemas semánticos que definen clases de objetos (por ejemplo, Persona, Organización, Ubicación y Documento), tipos de relaciones (por ejemplo, padre de o fabricante de) y atributos (por ejemplo, fecha de nacimiento de una persona o población de una región geográfica).
Hoy en día, existen miles de conjuntos de datos publicados como LOD en diferentes sectores, como enciclopedias, datos geográficos, datos gubernamentales, bases de datos y artículos científicos, entretenimiento, viajes, etc. Solo en Ciencias de la Vida, existen más de 100 bases de datos científicas publicadas como LOD.
Debido a su enlace, estos conjuntos de datos forman una gran red de datos o un gráfico de conocimiento, que conecta una gran cantidad de descripciones de entidades y conceptos de importancia general. Por ejemplo, existen varias descripciones de la ciudad de Varna (por ejemplo, una derivada de Wikipedia, otra de GeoNames, etc.).
Metadata Semántico: Etiquetando la web existente
El metadata semántico consiste en etiquetas semánticas que se agregan a páginas web regulares para describir mejor su significado. Por ejemplo, la página de inicio del Instituto Búlgaro de Oceanografía se puede anotar semánticamente con referencias a varios conceptos y entidades apropiadas, como Varna, Institución Académica y Oceanografía.
Estos metadatos facilitan mucho la búsqueda de páginas web basadas en criterios semánticos. Resuelven cualquier ambigüedad potencial y aseguran que cuando buscamos París (la capital de Francia), no obtendremos páginas sobre Paris Hilton.
Si queremos tener una relación bien definida entre el tema de la página web y la página o documento correspondiente, es mejor utilizar uno de los esquemas de metadatos de datos estructurados. Actualmente, el esquema más popular es Schema.org, que fue establecido por Google, Yahoo, Microsoft y Yandex. Según un estudio reciente de la Universidad de Mannheim, en 2015, el 30% de las páginas web contenían Metadata Semántico.
Un vistazo bajo el capó
La web semántica proporciona un marco común que permite compartir y reutilizar datos en aplicaciones, empresas y comunidades. Es un esfuerzo colaborativo liderado por el W3C con la participación de numerosos investigadores y socios industriales.
Es fundamental para la adopción de la visión de la web semántica el desarrollo de un conjunto de estándares establecidos por el organismo internacional de estándares: el Consorcio World Wide Web (W3C):
- Resource Description Framework (RDF): un lenguaje simple para describir objetos y sus relaciones en un grafo.
- SPARQL Protocol and RDF Query Language (SPARQL): un protocolo y lenguaje de consulta para datos RDF.
- Uniform Resource Identifier (URI): una cadena de caracteres diseñada para la identificación inequívoca de recursos y la extensibilidad a través del esquema URI.
La disponibilidad de estos estándares fomentó el desarrollo de un ecosistema de diferentes herramientas de varios proveedores, como motores de bases de datos, como GraphDB, que manejan datos RDF (conocidos como triplestores), editores de ontologías, herramientas de etiquetado que utilizan análisis de texto para generar automáticamente metadatos semánticos, motores de búsqueda semántica y mucho más.
Grafos de conocimiento: la próxima reencarnación de la web semántica
Aunque los grafos de conocimiento surgieron más tarde, rápidamente se convirtieron en un impulsor poderoso para la adopción de los estándares de la web semántica y todas las tecnologías semánticas que los implementan. Los grafos de conocimiento llevan el paradigma de la web semántica a las empresas, al introducir metadatos semánticos para impulsar la gestión de datos y la gestión de contenido a nuevos niveles de eficiencia y romper los silos para permitirles sinergizar con diversas formas de gestión del conocimiento.
Los grafos de conocimiento empresarial utilizan ontologías para hacer explícitos varios modelos conceptuales (esquemas, taxonomías, vocabularios, etc.) utilizados en diferentes sistemas de la empresa. Utilizando el argot de gestión de datos empresariales, los grafos de conocimiento representan un tipo premium de datos de referencia semánticos: una colección de descripciones interconectadas de entidades, objetos, eventos o conceptos.
De esta manera, los grafos de conocimiento ayudan a las organizaciones a mejorar la información propietaria utilizando el conocimiento global como contexto para la interpretación y fuente de enriquecimiento.
La web semántica es la web de conexiones entre diferentes formas de datos que permiten que una máquina haga algo que no podía hacer directamente.
Gracias a su capacidad para impulsar la generación, integración y comprensión de datos, los conceptos de la web semántica fueron rápidamente adoptados en la gestión de datos e información. Hoy en día, múltiples organizaciones utilizan Datos Enlazados como mecanismo para publicar datos maestros internamente. Los estándares de la web semántica se utilizan ampliamente en el desarrollo de grafos de conocimiento en diferentes dominios: gobierno (por ejemplo, Legislation.gov.uk), medios de comunicación (BBC fue el pionero), ciencia (tanto Elsevier como Springer Nature utilizan GraphDB), servicios financieros, etc.
¡Más sobre la próxima reencarnación de la web semántica, los grafos de conocimiento, en nuestro webinar: Mapas de Grafos de Conocimiento: 20+ Aplicaciones y 30+ Capacidades!
Si quieres conocer otras notas parecidas a Web semántica: definición y evolución puedes visitar la categoría Inteligencia artificial.
