Ayuda:Wiki semántico

De NuestraCiudad
Saltar a: navegación, buscar

NuestraCiudad es un wiki semántico. A diferencia de los wikis comunes y de las páginas web estáticas, la mayoría de los contenidos presentes son datos estructurados de manera formal, que pueden ser procesados por programas informáticos. Por lo tanto un wiki semántico se asemeja más a una compleja base de datos colaborativa, que a una simple colección de textos. Los wikis semánticos brindan la posibilidad de estructurar los datos de manera lógica.

La principal ventaja es que con este sistema semántico son posibles consultas y búsquedas inteligentes que se basan en esta estructura lógica, y por lo tanto búsquedas muy precisas. Por ejemplo, la consulta ¿Cuales son las empresas de Córdoba que tienen presidentes femeninos? solamente se puede realizar de manera precisa con un sistema semántico. Además, los contenidos son disponibles a través del lenguaje estandarizados en la Web Semántica o Web 3.0 - ver la ayuda sobre como se relaciona NuestraCiudad con la Web Semántica para detalles.

A continuación explicaremos las funcionalidades semánticas básicas de NuestraCiudad.info. Un texto un poco más profundo sobre la Web Semántica es nuestra Introducción a la Web Semántica.

Categorías

La base de la estructura lógica de NuestraCiudad (y la mayoría de los otros wikis semánticos) es el árbol de categorías. Estas categorías agrupan a todas las páginas en la wiki según el tipo de cosa que esté descrita en ella. La categoría principal de este sistema es la categoría Cosa. Esto es un estándar internacional e incluye a "cosas" que en el mundo real no llamaríamos cosas (como las personas). En inglés el nombre de esta categoría principal es Thing.

Las categorías forman un árbol de sub-categorías ramificadas y se distinguen según criterios objetivos. Por ejemplo, en la categoría Organización se agrupan entidades cono Empresa privada o Partido político, según el tipo de personería jurídica que tenga la organización.

Las categorías tienen la particularidad que toda cosa que sea comprendida por una categoría, también sea comprendida por todas las categorías superiores. Por ejemplo, todos los partidos políticos son organizaciones, pero también entidades personales (que es la categoría superior de Organización) y, obviamente, son a su vez cosas, en el sentido de la categoría básica.

Atributos (propiedades)

Con el sistema de categorías ya podemos realizar consultas simples, como "¿Cuales son todas las organizaciones descritas en NuestraCiudad?". Para poder consultar más detalles sin embargo necesitamos un elemento más: los atributos o propiedades.

Supongamos que queremos consultar a todas las empresas que tengan un presidente femenino. Si bien existe la posibilidad de construir una categoría Empresa con presidente femenino, esto significaría que deberíamos armar un árbol de categorías extremamente complejo. Además deberíamos agregar esta categoría explícitamente en cada empresa que tenga un presidente femenino. Que esto no es lo óptimo, puede parecer bastante obvio.

Primero tenemos que considerar que informaciones necesitamos para poder realizar la consulta:

  • Necesitamos saber quienes son los presidentes de cada empresa.
  • Necesitamos saber el género de los presidentes.

Acceder a la primera información ya es muy complicada de realizar con categorías, ya que deberíamos tener una categoría para cada nombre de presidente. Esto es prácticamente imposible.

Mucho más conveniente es tener un elemento que funcione como el predicado de una oración. Veamos la frase siguiente:

La empresa TodoPorSuCasa S.A. tiene el presidente Juan Pérez.

El atributo que necesitamos en esta frase sería el elemento que equivale al grupo de palabras tiene el presidente, que relaciona a TodoPorSuCasa S.A. con el presidente Juan Pérez . En nuestro caso en NuestraCiudad el atributo que resuelve este problema es el atributo Tiene presidente.

Estos atributos tienen además una ventaja que es que se pueden usar en distintas categorías. Por ejemplo, los partidos políticos también tienen presidentes (además de los países, aunque estos no son parte de NuestraCiudad). Podemos perfectamente usar el mismo atributo tanto en el caso de los partidos políticos como con las empresas. (Ojo: ¡Solo se puede utilizar de esta manera si los significados del atributo en diferentes contextos son idénticos! En el caso de homónimos es necesario diferenciar entre los diferentes significados, usando atributos diferentes).

Bien, nos falta la parte del género del presidente. Para tal debemos armar primero páginas sobre los presidentes de las empresas. La anotación del género, al ser una relación más simple, se puede realizar tanto con categorías como con un atributo. En NuestraCiudad usamos el atributo Tiene género.

Con todos estos elementos podemos armar una consulta para saber cuales son las empresas que tienen presidentes femeninos. Esta, en el código de Semantic MediaWiki, sería así:

{{#ask: [[Categoría:Empresa privada]] [[Tiene presidente.Tiene género::Femenino]]}}

Este código no es tan difícil de entender que lo que parece. En realidad, cada parte de la consulta funciona como un filtro que excluye ciertas cosas.

Vamos por partes:

  • #ask es un código que significa que lo que sigue es una consulta a los datos del wiki.
  • La [[Categoría:Empresa privada]] es la categoría de cosas en las que buscamos. Como a nosotros solamente nos interesan (en este caso) empresas privadas (y no partidos políticos o asociaciones) buscamos en la categoría Empresa privada.
    Con esto, la consulta excluye a todas las cosas que no sean empresas privadas.
  • [[Tiene presidente.Tiene género::Femenino]] es una consulta que se compone de tres sub-consultas:
    • Tiene presidente busca a todas las cosas que tengan un atributo Tiene presidente con un valor.
      Con esto excluye a todas las páginas que no tengan este atributo o no tengan ningun valor para el atributo, por ejemplo, cuando el presidente aún no ha sido agregado o es desconocido.
    • Luego el punto significa que se pasa a una consulta en la página destino de la primera consulta. Es decir: se consulta si existe una página sobre el presidente.
      Con esto se excluyen a todas las páginas que tienen anotado el presidente, pero en las cuales el presidente aún no tiene página propia.
    • Como último, con Tiene género::Femenino se prueba si la persona que es presidente de la empresa es femenina.
      Con esto se excluyen a todas las cosas que tengan presidentes masculinos, pero también a las presidentes con género no definido.

Si esto ha sido muy complicado, no importa. Lo que es importante entender es que a través de las funciones semánticas se pueden realizar búsquedas muy complejas y sobre todo muy exactas. Y: cuanto más datos haya en el wiki, más utilidad tiene - porque las consultas obviamente solamente arrojan resultados cuando los datos buscados existen.

Inferencias - Búsquedas "inteligentes"

Los wikis semánticos pueden realizar también consultas más "inteligentes". Como ejemplo citaremos:

  • Pueden consultar páginas sobre cosas en categorías generales con todas sus sub-categorías incluidas.
    Ejemplo: Si el usuario lo desea, una consulta de la Categoría:Objeto geográfico también arrojará resultados sobre las categorías como la Categoría:Río.
  • Permite crear un árbol de atributos, similar al árbol de categorías, usando sub-atributos (subpropiedades) que apuntan a atributos más generales ("super-propiedades"). Estos sub-atributos automáticamente relacionan a todas las páginas que integran uno de estos subatributos con un atributo "superior".
    Ejemplo: Muchos atributos sobre personas y organizaciones son sub-atributos del atributo Tiene participación de, por ejemplo Atributo:Creado por y Atributo:Realizado por. La función de ser "creador" o "realizador" de una obra es una descripción más precisa del tipo de participación en la obra, y por lo tanto es útil apuntarla hacia una propiedad más general. Así rápidamente se pueden encontrar todas las personas y organizaciones que participaron en una obra en diferentes funciones.
  • Pueden tratar sinónimos como tales.
    Ejemplo: Algunos barrios se conocen por nombres diferentes, por ejemplo Barrio General Pueyrredón también es conocido simplemente como Barrio Pueyrredón. Para tal fin se realiza una redirección hacia el nombre más usado, y el sistema interpretará que son sinónimos.
  • Permite realizar consultas inversas. En general los atributos apuntan "de menor a mayor", es decir de la entidad menor hacia la entidad mayor. Con una consulta inversa se pueden realizar consultas "al revés".
    Ejemplo: Un ejemplo es Atributo:Ubicado en barrio, que apunta de entidades como por ejemplo edificios o locales hacia el barrio en el cual se encuentra. En una consulta estándar, se encontrarían las entidades que apuntan al barrio. Ahora, también puede ser posible que uno quiera conocer todas los barrios a las que apuntan las cosas de un mismo tipo, por ejemplo las sucursales de una misma cadena de supermercados. Para invertir se agrega un guión (-) delante de la propiedad invertida.
    En nuestro ejemplo, La consulta en lenguaje humano sería: ¿En que barrios se encuentran sucursales de la cadena CadenaSuperXXX? Mientras que en el lenguaje de Semantic MediaWiki se usaría la forma:
    [[Categoría:Barrio]] [[-Ubicado en barrio.Es miembro de::CadenaSuperXXX]]

Hay otras formas de búsquedas inteligentes que aún no están posibles en wikis semánticos (aunque la mayoría se pueden realizar con trucos). Sin embargo, los casos mencionados abarcan ya una gran variedad de consultas y por el momento alcanza con ellas para un wiki urbano como NuestraCiudad.

Para leer más

En [1] (inglés) se puede leer en detalle el sistema que usamos, Semantic MediaWiki.