Uno de los principales desafíos en un trabajo de big data es combinar los datos de varias fuentes y convertirlos en algo útil. El sistema transaccional de su compañía podría mostrarle qué están comprando los clientes, por ejemplo, pero las claves para los otros aspectos de su comportamiento -sus patrones de navegación y su información sobre su lealtad, por ejemplo- podrían encontrarse en otros sistemas.
Solo cuando puede juntar todos los bits relevantes y descubrir algo nuevo es que puede cosechar la recompensa de todos estos vastos almacenes de datos.
Ese es el sweet spot al que Oracle apunta con cuatro nuevos productos. Los nuevos productos de Oracle -que se enfocan en la intersección entre las tecnologías de Hadoop, NoSQL y SQL- apuntan a que los insights sobre big data se encuentren más al alcance de un grupo más amplio de usuarios de negocio.
Oracle Big Data Discovery, por ejemplo, se encuentra diseñado para servir como “el rostro visual de Hadoop” para los usuarios de negocio. Con una interfaz que pretende ofrecer una experiencia tan familiar como una compra en línea, permite a los usuarios no solo encontrar y explorar los datos de varias fuentes, sino también prepararlas y analizarlas y compartir los resultados, todo desde una sola herramienta.
Entre los beneficios potenciales se encuentra lograr una mayor participación en los trabajos de big data de un conjunto más amplio de usuarios de negocio y conseguir también un camino más rápido para la entrega deinsights útiles, indicó Hari Sankar, vicepresidente de big data y analítica avanzada de Oracle.
“Debido a la actual complejidad de los datos y las herramientas, los proyectos de big data generalmente requieren de meses o años”, indicó el ejecutivo. “Queremos convertir esto en días o semanas”.
Otra de las nuevas cosas de Oracle es el GoldenGate for Big Data, una herramienta Hadoop que permite a los usuarios enviar datos no estructurados, en tiempo real, provenientes de varios sistemas transaccionales heterogéneos hacia los sistemas de big data como Apache Hadoop, Apache Hive, Apache HBase y Apache Flume.
En esencia, el producto “replica los datos en tiempo real del sistema A al sistema B”, haciendo que se encuentren disponibles “en cualquier forma que quiera entregarlo”, indicó Neil Mendelson, vicepresidente de big data y analítica avanzada de Oracle.
Para completar los anuncios de Oracle el jueves, también se presentaron Oracle Big Data SQL 1.1 -que ofrece una mejora en el desempeño de las consultas de hasta 40% con respecto a versiones anteriores- y Oracle NoSQL Database 3.2.5, que ha sido actualizada con varias nuevas API, entre otras características.
Ref CIO MX big data