Comunidad de diseño web y desarrollo en internet online

De la Web de documentos a Web de Datos. Un camino a seguir...

Citar            
MensajeEscrito el 09 Dic 2011 10:50 pm
Hoy por hoy la Internet está considera como uno de los almacenes más grandes de información que existe, en donde podemos encontrar información muy heterogénea, es decir, no hay un solo formato estándar, como video(mp4,mpeg, avi), audio(mp3, wma,vorbis), imagen(jpg, jpeg, png, bmp), documentos(doc, pdf, xml, html, rdf,turtle), etc.

El crecimiento exponencial que ha supuesto la Internet, se replantean las necesidades de información. Es decir, que la información no este aislada sino más bien que se vincule, interconecte e intercambie de alguna manera.

La Web Semántica, surge por la falta a la accesibilidad de contenidos y de como esta estructurada la Web. En la actualidad este término ha sido una de las motivaciones principales de investigadores, estudiantes, amantes de la tecnología. Debido al crecimiento exponencial que ha sufrido la WWW y la polución de información.

Desde la Web 2.0 el usuario se ha convertido, además de consumidor, en un proveedor de contenidos.

Con la Web Semántica , Web de datos o Web 3.0, los contenidos se transforman de sintácticos a semánticos con el objetivo de crear datos procesables y compresibles por máquinas que permitirían el razonamiento automático, la gestión de conocimiento, la mejora del e-commerce, búsqueda y distribución de información de manera eficiente y precisa. Ello incluye, la transformación de la red en una base de datos, una evolución hacia los contenidos accesibles.

Por qué es necesario cambiar de paradigma?

Un factor clave en la re-usabilidad de datos es el grado en que están conectados. Entre más conectados estén los datos tendrán mucho más valor para los usuarios. De ahí, el problema que tenemos que los datos no se pueden conectar, en la estructura de la Web actual, por eso el cambio de paradigma. Es decir, la principal idea de La Web de datos es poder realizar un SELECT *FROM a la Internet y que ella nos devuelva resultados.

Aunque la mayoría de los sitios web tienen algún grado de estructura, el lenguaje en el que se crean, HTML, está orientada hacia la estructuración de documentos de texto, en lugar de datos. Como los datos se entremezclan, es difícil para las aplicaciones de software extraer fragmentos de datos estructurados a partir de páginas HTML.

Para solucionar este problema, se han creado una gran variedad de microformatos. Como microformatos especifican la forma de integrar datos, aplicaciones de forma inequívoca se puede extraer los datos de las páginas. Los puntos débiles de los microformatos es que se limitan a la representación de datos sobre un pequeño conjunto de diferentes tipos de entidades, sino que sólo proporcionan un pequeño conjunto de atributos que se pueden utilizar para describir estas entidades, y que a menudo no es posible expresar relaciones entre las entidades , como, por ejemplo, una persona es un conferencista en un evento, un asistente o el organizador del evento. Por lo tanto, los microformatos no son adecuados para el intercambio de datos arbitrarios en la Web.

Un enfoque más general para que los datos estructurados en la Web son APIs Web ofrecen acceso simple para la consulta de datos estructurados a través del protocolo HTTP. Es común que las APIs Web proporcionan resultados en formatos de datos estructurados como XML y JSON, que tiene amplio apoyo de lenguajes de programación.

En consecuencia, los datos devueltos de la API Web por lo general nos devuelven como fragmentos aislados, que carecen de vínculos fiables.
Además, muchos de API Web se refieren a temas de interés con los identificadores que sólo tienen alcance local - por ejemplo, un id de producto 123456 que no tiene sentido cuando se toman fuera del contexto de esa API específica. En tales casos, no existe un mecanismo estándar para referirse a los elementos descritos por una API de datos devueltos por el otro.

La vinculación de datos distribuidos a través de la Web requiere de un mecanismo estándar para especificar la existencia y el significado de las conexiones entre los elementos descritos en esta información. Este mecanismo es proporcionada por el Resource Description Framework (RDF).

RDF que proporciona una manera flexible para describir las cosas en el mundo - tales como: personas, lugares o conceptos abstractos - y cómo se relacionan con otras cosas. Estas declaraciones de las relaciones entre las cosas son, en esencia, los enlaces de conexión cosas en el mundo.

En definitiva. Qué es la Web de Documentos? y Qué es la Web de Datos?

La Web de Documentos se basa en un conjunto de normas simples: los URIs como identificadores únicos de identificación de los recursos, HTTP como mecanismo de acceso universal y HTML como un formato de contenido ampliamente utilizado. Además, la Web se basa en la idea de establecer hipervínculos entre los documentos Web que pueden residir en los servidores Web diferentes.


La Web de datos Tim Berners-Lee definió cuatro principios que caracterizan los datos vinculados en su ponencia de presentación para el W3C.

Principios:

  1. Utilizar URIs para identificar los recursos publicados en la Web.
  2. Aprovechar el HTTP de la URI para que la gente pueda localizar y consultar (es decir, desreferenciar) estos recursos.
  3. Proporcionar información útil acerca del recurso cuando la URI haya sido desreferenciada.
  4. Incluir enlaces a otras URI relacionadas con los datos contenidos en el recurso, de forma que se potencie el descubrimiento de información en la Web.


Estado de la Nube. Actualización 09/19/2011

[img]http://richard.cyganiak.de/2007/10/lod/imagemap.html[/img]


Algunos Recursos Web.

http://www.w3.org/DesignIssues/LinkedData.html
http://www.w3.org/TR/webarch/
http://linkeddatabook.com/editions/1.0/
http://es.wikipedia.org/wiki/Datos_vinculados
http://linkeddata.org/

Por dpcal

1 de clabLevel



 

chrome
Citar            
MensajeEscrito el 16 Feb 2012 09:54 am
Lo muevo a aportes

Por Freddie

BOFH

53 tutoriales
597 articulos
43 ejemplos

Genero:Masculino   Admin

Conserje de Cristalab

chrome

 

Cristalab BabyBlue v4 + V4 © 2011 Cristalab
Powered by ClabEngines v4, HTML5, love and ponies.