Palestra sobre Apache Crunch

Uma boa Palestra intitulada “Big Data otimizado: Arquiteturas eficientes para construção de Pipelines MapReduce”

Resumo
Essa palestra irá mostrar como arquitetar Pipelines MapReduce eficientes usando o framework Apache Crunch; como integrar pipelines com fontes de dados externas como Redis, MongoDB, ou mesmo BDs relacionais, e a melhor granularidade para seus jobs; além de identificar quando investir em uma arquitetura de MapReduce realmente faz sentido.

Big Data otimizado: Arquiteturas eficientes para construção de Pipelines MapReduce

Sobre Marcio Junior Vieira

Atualmente atua como Cientista de Dados da Ambiente Livre. Evangelista de tecnologias Open Source e Free Software desde 1999. Data Scientist, Data Engineer e Big Data Expert. Certified Pentaho Solutions Consultant. Alfresco ECM & Activiti BPM e Camunda BPM Expert. Scala, Java, PHP, Python and JavaScript Programmer.

Ver todos posts de Marcio Junior Vieira →

Esta entrada foi publicada em Big Data, Hadoop, Open Source. Adicione o link permanente aos seus favoritos.

Palestra sobre Apache Crunch

Sobre Marcio Junior Vieira

Deixe uma resposta Cancelar resposta

Posts recentes

Comentários

Categorias

Meta

Lista de Links

Palestra sobre Apache Crunch

Sobre Marcio Junior Vieira

Deixe uma resposta Cancelar resposta

Open Source Tags

Posts recentes

Comentários

Categorias

Meta

Lista de Links