Spark como padrão de processamento no Hadoop! Alternativa ao MapReduce

A Cloudera aposta que apache Spark se tornará o novo padrão de processamento de dados para Hadoop! Começando com Hive que sofreu diversas melhorias.

O Apache Hive é uma interface SQL popular para processamento em lote e ETL usando Apache Hadoop. Até recentemente, o MapReduce foi o único mecanismo de execução no ecossistema Hadoop e Hive consultas só poderia ser executado em MapReduce. Mas hoje, os motores de execução tem alternativas para MapReduce disponíveis – tais como Apache Spark e Apache Tez

Saiba mais no post publicado no Blog da Cloudera : http://blog.cloudera.com/blog/2014/07/apache-hive-on-apache-spark-motivations-and-design-principles/

Apache Spark: http://spark.apache.org/
Apache Tez: http://incubator.apache.org/projects/tez.html

Sobre Marcio Junior Vieira

Atualmente atua como Cientista de Dados da Ambiente Livre. Evangelista de tecnologias Open Source e Free Software desde 1999. Data Scientist, Data Engineer e Big Data Expert. Certified Pentaho Solutions Consultant. Alfresco ECM & Activiti BPM e Camunda BPM Expert. Scala, Java, PHP, Python and JavaScript Programmer.

Ver todos posts de Marcio Junior Vieira →

Esta entrada foi publicada em Big Data, Hadoop, hive. Adicione o link permanente aos seus favoritos.

Spark como padrão de processamento no Hadoop! Alternativa ao MapReduce

Sobre Marcio Junior Vieira

Deixe uma resposta Cancelar resposta

Posts recentes

Comentários

Categorias

Meta

Lista de Links

Spark como padrão de processamento no Hadoop! Alternativa ao MapReduce

Sobre Marcio Junior Vieira

Deixe uma resposta Cancelar resposta

Open Source Tags

Posts recentes

Comentários

Categorias

Meta

Lista de Links