Arquivo da categoria: Hadoop

Hadoop é um framework open-source para processamento paralelo e distribuído, criado e mantido pela Apache Software Foundation, cross-plataform (construído em Java), que escala até milhares de nós. É utilizado para processar grandes quantidades de dados, geralmente em terabytes e petabytes, e tem como característica a alta disponibilidade, devido ao seu mecanismo de detecção de falhas. Implementa o MapReduce, um modelo de programação paralela de grandes volumes de dados, inicialmente proposto e desenvolvido pela Google.

Data Scientist – Consultor BI – SR

Começam a aparecer as vagas para o Cargo de Cientista de dados ( Data Scientist ) , coloquei aqui no blog está Vaga para que Alunos já formados em nossos treinamentos de BI com Pentaho e Big Data com Hadoop,  … Continue lendo

Publicado em Big Data, cientista de dados, Hadoop, Pentaho | 1 Comentário

Spark como padrão de processamento no Hadoop! Alternativa ao MapReduce

A Cloudera aposta que apache Spark se tornará o novo padrão de processamento de dados para Hadoop! Começando com Hive que sofreu diversas melhorias. O Apache Hive é uma interface SQL popular para processamento em lote e ETL usando Apache … Continue lendo

Publicado em Big Data, Hadoop, hive | Deixe um comentário

Hadoop – Hive 0.13 100X Mais Rápido – Benchmark

A Hortonworks publico em seu site uma notícia muito esperada , a melhoria na performance do Apache Hive na recém lançada versão 0.13 , em todos os teste do Benchmark o mesmo atingiu uma velocidade 100X maior que o Hive … Continue lendo

Publicado em Hadoop, hive | Com a tag | 1 Comentário

Comunidade Hadoop Brasil – Lista de Discussão

Prezados , Foi criado um Grupo da Comunidade Hadoop Brasil , o grupo tem objetivo de ser público e no mesmo poderão ser discutidos e divulgados assuntos sobre Hadoop em Português, gerar documentação e conhecimento sobre qualquer ferramenta do ecosistema … Continue lendo

Publicado em cientista de dados, Hadoop | 2 Comentários

III Fórum HBR Brasil Big Data & Analytics

Vai acontecer no dia 26 de Agosto de 2014 em São Paulo o III Fórum HBR Brasil Big Data & Analytics A Harvard Bussiness Review Brasil formatou um evento de Big Data que será voltado ás reais necessidades das empresas … Continue lendo

Publicado em Big Data, Hadoop, Pentaho | Deixe um comentário

Hadoop na nuvem

Excelente artigo que compara diversas opções de uso de Hadoop em nuvens, com descritivos de vantagens e desvantagens. Vale a pena conferir esta bem detalhado! http://www.infoq.com/br/articles/hadoop-na-nuvem

Publicado em Hadoop, Open Source | Deixe um comentário

Palestra: Big Data Open Source com Hadoop – FLISOL 2014 – Curitiba

Prezados compartilho aqui a palestra apresentada n FLISOL 2014 na PUCPR. Palestra: Big Data Open Source com Hadoop – FLISOL 2014 – Curitiba from Marcio Junior Vieira As imagens ISO ( Maquina Virtual ) para estudos pode ser baixada de … Continue lendo

Publicado em Big Data, Hadoop, Open Source | Deixe um comentário

Palestras de Colaboradores da Cloudera no SouJava

Palestra dos Committers da Apache Hadoop e Desenvolvedores da Cloudera ministrada em São Paulo organizado pelo Sou Java. Continue lendo

Publicado em Big Data, Hadoop, Open Source | Deixe um comentário

Palestra sobre Apache Crunch

Uma boa Palestra intitulada “Big Data otimizado: Arquiteturas eficientes para construção de Pipelines MapReduce” Resumo Essa palestra irá mostrar como arquitetar Pipelines MapReduce eficientes usando o framework Apache Crunch; como integrar pipelines com fontes de dados externas como Redis, MongoDB, … Continue lendo

Publicado em Big Data, Hadoop, Open Source | Deixe um comentário

Revistas Hadoop : Hadoop Magazine

Para os Amantes da Laitura e do Hadoop existe uma excelente publicação chamada Hadoop Magazine que pode ser encontrada em http://hadoopmag.com/ No momento deste post a única forma de aquisição era a assinatura anual.

Publicado em Hadoop | Deixe um comentário