Google lanza una aplicación que limpia los datos


Google ha actualizado y relanzado una aplicación de código abierto que permite limpiar, analizar y transformar los datos. Se llama Google Refine.





Esta aplicación se llamaba, originalmente, Freebase Gridworks y era propiedad de Metaweb, empresa que Google compró el pasado mes de julio.

Google Refine es una recopilación de herramientas que puede ser muy útil cuando se quiere eliminar información útil, especialmente cuando tiene contradicciones.

Se trata de una aplicación para un ordenador que puede, por ejemplo, localizar todas las diferentes formas en las que se ha escrito una palabra y reemplazarla por la versión correcta.

Además, este proceso es compatible con cualquier base de datos o recopilación que tenga el usuario, sin necesidad de re escribir el código para cada una de ellas.

Otras utilidades de este software incluyen una expresión de lenguaje que puede ser utilizada para analizar un conjunto de datos. Los filtros se pueden utilizar para aislar determinados datos, que posteriormente pueden ser analizados o cambiados a través de unos comandos.

La aplicación trabaja con archivos de textos, de manera que los datos puedan ser separados en columnas y por el uso de comas. Los resultados se pueden exportar al formato JSON (JavaScript Object Notation), que permite ser transformados fácilmente en tablas HTML y otros formatos.

En función de la memoria del ordenador del usuario, la aplicación puede trabajar con hasta cientos de miles de filas de datos.

Google Refine 2.0 también permite enlazar grabaciones a otras bases de datos, entre otras muchas funciones.

Fuente:
Por Arantxa Herranz
http://www.idg.es/



Otras noticias de interés:

GNU/Linux y un divorcio
Sí, definitivamente Linux ha roto la relación con mi querido ordenador, creo que debería mandar una carta a Linus y otra a Richard pidiéndoles daños y perjuicios....
Virus informáticos no suspenden su amenaza
Cada día aparece una nueva amenaza de virus informáticos, y cada día los virus se vuelven más inteligentes y más peligrosos. ...
Fallo en mod_proxy Apache 2.x
Se ha publicado un fallo en el módulo 'mod_proxy' de Apache 2.x que podría permitir a un atacante obtener información sobre la red interna detrás de un servidor vulnerable....
Cuidar el ADN de la empresa
El grueso de los activos de una empresa y lo que realmente le da valor son los elementos intangibles: contratos, carteras de clientes, patentes, marcas, fórmulas y un largo etcétera que se esconde tras los sistemas de gestión de las organizaciones...
Códigos QR y el malware
Los Quick Response (QR) son códigos de barra de dos dimensiones diseñados para ser leídos e interpretados rápidamente. Actualmente, y sumado a la gran proliferación de smartphones en el mercado, son muy utilizados para publicidades y campañas d...
Un software determina el estado de ánimo de las personas en tiempo real
Informáticos alemanes del Fraunhofer Institute for Integrated Circuits (IIS) han desarrollando un software que reconoce el estado de ánimo de las personas. Mediante una cámara de vídeo, el software se fija en los cambios producidos en ciertas par...
Adobe publica parche para Flash Player
Adobe ha publicado un parche que cubre para seis vulnerabilidades en Flash Player. Entre los fallos de seguridad se incluye uno que ya está siendo explotado por los atacantes. ...
Día de la Libertad del Documento 2009
Por segundo año consecutivo se celebra en el día de la fecha el Día de la Libertad del Documento....
Mozilla empieza a enviar Firefox 3.6 a los usuarios de su browser
Mozilla ha empezado a ofrecer Firefox 3.6 a los usuarios que corren versiones más antiguas de su navegador de código abierto....
"Frame Injection" en múltiples navegadores
La vulnerabilidad en el Microsoft Internet Explorer hecha pública el 30 de junio de 2004, y que permite que usuarios maliciosos puedan falsificar el contenido de un website, también se produce en otros navegadores....

Brindanos
un o una


Redes Sociales

Publicidad


Gana Bitcoins desde tu casa

Categorías


Planeta Vaslibre

Blog Roll




Nube de tags

  • anonimato
  • anonimo
  • antivirus
  • apache
  • aplicacion
  • blog
  • bsd
  • bug
  • centos
  • chrome
  • cifrado
  • computer
  • datos
  • debian
  • exploits
  • fedora
  • fice
  • firefox
  • forense
  • freebsd
  • gentoo
  • github
  • gnome
  • gnu
  • google
  • gpl
  • gtk
  • hack
  • hacking
  • hosting
  • informatica
  • internet
  • isos
  • libre
  • licencias
  • limpia
  • linux
  • linuxmint
  • lxde
  • micros
  • mint
  • mit
  • mozilla
  • mysql
  • noticia
  • opensource
  • pgp
  • php
  • sabayon
  • seguridad
  • system
  • tecnologia
  • thunar
  • thunderbird
  • tor
  • troyanos
  • tware
  • ubuntu
  • underground
  • vaslibre
  • virus
  • viserproject
  • vivaldi
  • vulnerabilidades
  • web
  • website
  • windows
  • xanadu
  • xfce
  • xombra