Ayuda:Web Semántica
NuestraCiudad no solamente utiliza funciones de un wiki semántico internamente, sino que también ofrece funciones para acceder directamente a su contenido a través de RDF, el lenguaje de la Web Semántica, también llamada Web 3.0.
¿Para qué sirve?
Estamos viviendo una pequeña revolución en la manera que se presentan los contenidos en la Web. Cada vez más información se presenta de manera estructurada y a su vez accesible a una nueva generación de buscadores, que permiten búsquedas mucho más inteligentes y precisas. También Google y Bing han adherido a este nuevo paradigma.
Las tecnologías de la Web Semántica permiten a los internautas que buscan informaciones:
- buscar de manera muy precisa los términos que uno busca
- buscar términos relacionados con los términos principales
- buscar sin tener que tener en cuenta las ambigüedades del lenguaje (por ejemplo: "Córdoba, Argentina" no será confundido con "Córdoba, España")
- Dado que las búsquedas son más precisas, se pueden automatizar las búsquedas. Hasta es posible realizar compras automáticas, basadas en estas búsquedas.
Y a los proveedores de contenidos y anunciantes, les permite:
- Presentar sus contenidos de manera estructurada y precisa, directamente orientado al público al quien se busca llegar.
- No tener que competir en el buscador con páginas orientados en una palabra clave similar (ejemplo: empresas de Córdoba, Argentina que tienen que competir con empresas de Córdoba, España por la primera posición en Google)
- No perder dinero por el público que se atrae solamente por las ambigüedades del lenguaje (por ejemplo: los que buscan "Córdoba, España" y generan tráfico innecesario en páginas sobre "Córdoba, Argentina")
- Presentar los contenidos de manera limpia y con elementos gráficos en el buscador. Por ejemplo, los votos que recibió un producto pueden ser presentados como "estrellas", como ya sucede en Google.
Una pequeña introducción
El wiki semántico
NuestraCiudad.info contiene informaciones estructuradas sobre diferentes entidades, llamadas cosas (del inglés: thing, término utilizado para todas las entidades posibles, por ejemplo personas, lugares, organizaciones etc.). Cada cosa que es presentada en NuestraCiudad, sea una persona, una localidad o un barrio, un río o una empresa, tiene su propia página en el sitio. NuestraCiudad.info funciona como un wiki, es decir una página que puede ser editada por sus usuarios, y por lo tanto los usuarios pueden agregar sus propias informaciones, por ejemplo, publicando una página sobre una empresa.
Hay dos maneras principales para estructurar los datos sobre las cosas:
- Podemos clasificar las cosas en un árbol de categorías (o clases). Por ejemplo, todos los barrios de Córdoba contienen un pequeño código que los inserta en la categoría "Barrio". De esta manera se crea una simple taxonomía de entidades que es la base de la estructura semántica del sitio.
- Cada cosa puede tener relaciones con otras cosas. Un ejemplo: Una empresa puede estar relacionada con una persona que es su presidente. En NuestraCiudad esto ocurre a través de la relación Tiene presidente, llamada atributo o propiedad.
Atributos y Categorías nos permiten realizar consultas respecto de las cosas. Así, a través de una simple consulta en la página interna Special:Ask podemos conocer todos los presidentes de las empresas de Córdoba. O de Villa Allende, si así lo deseamos.
La estructura formal compuesta por la taxonomía de categorías y los atributos se denomina Ontología. En NuestraCiudad es descrita en las páginas NuestraCiudad:Ontología y sus sub-páginas.
La Web Semántica
RDF (Resource Description Framework) es un lenguaje que facilita estandarizar este tipo de relaciones entre cosas. A través de RDF los atributos internos de los sitios web semánticos (como NuestraCiudad.info) se transforman en códigos universalmente "entendibles" en la Web Semántica.
La Web Semántica es conformada por todos los sitios web con información semántica. Todos estos sitios web contienen metadatos estructurados sobre las entidades que describen, igual que NuestraCiudad con sus categorías y atributos. Su potencial reside en la combinación de múltiples fuentes a través de un estándar abierto como RDF, que permite búsquedas inteligentes. Muchos programas informáticos pueden trabajar directamente con los datos en formato RDF y realizar consultas automáticamente sin tener que entrar en una página.
NuestraCiudad, a través de sus funciones RDF, se puede convertir así en una fuente de datos para programas de software y para otras páginas web. Esto ocurre a través de la función Exportar RDF. Además ofrecemos varios datos en formato rich snippet, en HTML Microdata, con el formato provisto por Schema.org.
Cómo exportar datos en RDF
La exportación de los datos a través de RDF ocurre simplemente a través de la página especial Special:ExportRDF. A esto se le añade el nombre de la página que describe a la cosa de la cual uno quiere exportar los datos.
Ejemplo:
- Special:ExportRDF/Córdoba extrae todos los datos semánticos de la página Córdoba.
El formato es RDF/XML y puede ser procesado por todos los procesadores de RDF/XML. Dado que NuestraCiudad usa un vocabulario propio[1] es necesario consultar la Ontología para conocer los detalles del vocabulario que usamos.
Cómo procesar datos en Microdata
HTML Microdata es un formato simple para anotar contenidos similares a RDF en el código fuente de las páginas web. Es parte del estándar HTML de la WHATWG y parte no oficial de HTML5. Se puede ver la especificación en el sitio web de la W3C.
NuestraCiudad.info ofrece los datos sobre una gran parte de los items en la wiki en Microdata. El vocabulario utilizado es Schema.org, procesado actualmente por Google, Bing, Yahoo y algunos otros servicios web.
Ask API
Hay una segunda posibilidad que aún se encuentra en estado alpha, que es consultar a NuestraCiudad a través del Ask API. Para más información dirigirse a esta página (inglés). La ventaja es que no solamente se puede utilizar RDF como formato, sino también JSON, CSV y otros formatos soportados.
Básicamente, se usa una consulta "común", la cual se codifica como URL y se añade al siguiente enlace:
http://cordoba.nuestraciudad.info/w/api.php?action=ask&query=
SPARQL
SPARQL es un lenguaje para consultas en archivos RDF, algo parecido al lenguaje que se usa internamente en NuestraCiudad para consultas.
Por el momento NuestraCiudad no está configurada como SPARQL endpoint y por lo tanto no es posible acceder directamente a través de SPARQL a sus contenidos, pero posiblemente lo será en el futuro.
Como alternativa, se puede usar Ask API o sino bajar todas las páginas en RDF y realizar una consulta SPARQL hacia esta base de datos.
Reglas
El acceso razonable, típico de una computadora personal a los datos, es gratuito.
Para más detalles ver las Reglas para usar los datos.
Notas
- ↑ Hasta la fecha no hemos encontrado un vocabulario estandarizado que abarque todas las entidades (cosas) que queremos describir en NuestraCiudad. Igual para muchos atributos hay mappings posibles en el vocabulario Schema.org. En el futuro, es posible que cambiemos al vocabulario de Wikidata (tecnología que se usará en Wikipedia a partir de 2013).