Arquivo da categoria: Hadoop

Hadoop é um framework open-source para processamento paralelo e distribuído, criado e mantido pela Apache Software Foundation, cross-plataform (construído em Java), que escala até milhares de nós. É utilizado para processar grandes quantidades de dados, geralmente em terabytes e petabytes, e tem como característica a alta disponibilidade, devido ao seu mecanismo de detecção de falhas. Implementa o MapReduce, um modelo de programação paralela de grandes volumes de dados, inicialmente proposto e desenvolvido pela Google.

Data Scientist – Consultor BI – SR

Publicado em 14 de setembro de 2014 por Marcio Junior Vieira

Começam a aparecer as vagas para o Cargo de Cientista de dados ( Data Scientist ) , coloquei aqui no blog está Vaga para que Alunos já formados em nossos treinamentos de BI com Pentaho e Big Data com Hadoop, … Continue lendo →

Publicado em Big Data, cientista de dados, Hadoop, Pentaho | 1 Comentário

Spark como padrão de processamento no Hadoop! Alternativa ao MapReduce

Publicado em 9 de julho de 2014 por Marcio Junior Vieira

A Cloudera aposta que apache Spark se tornará o novo padrão de processamento de dados para Hadoop! Começando com Hive que sofreu diversas melhorias. O Apache Hive é uma interface SQL popular para processamento em lote e ETL usando Apache … Continue lendo →

Publicado em Big Data, Hadoop, hive | Deixe um comentário

Hadoop – Hive 0.13 100X Mais Rápido – Benchmark

Publicado em 4 de julho de 2014 por Marcio Junior Vieira

A Hortonworks publico em seu site uma notícia muito esperada , a melhoria na performance do Apache Hive na recém lançada versão 0.13 , em todos os teste do Benchmark o mesmo atingiu uma velocidade 100X maior que o Hive … Continue lendo →

Publicado em Hadoop, hive | Com a tag hive | 1 Comentário

Comunidade Hadoop Brasil – Lista de Discussão

Publicado em 2 de julho de 2014 por Marcio Junior Vieira

Prezados , Foi criado um Grupo da Comunidade Hadoop Brasil , o grupo tem objetivo de ser público e no mesmo poderão ser discutidos e divulgados assuntos sobre Hadoop em Português, gerar documentação e conhecimento sobre qualquer ferramenta do ecosistema … Continue lendo →

Publicado em cientista de dados, Hadoop | 2 Comentários

III Fórum HBR Brasil Big Data & Analytics

Publicado em 30 de maio de 2014 por Marcio Junior Vieira

Vai acontecer no dia 26 de Agosto de 2014 em São Paulo o III Fórum HBR Brasil Big Data & Analytics A Harvard Bussiness Review Brasil formatou um evento de Big Data que será voltado ás reais necessidades das empresas … Continue lendo →

Publicado em Big Data, Hadoop, Pentaho | Deixe um comentário

Hadoop na nuvem

Publicado em 27 de maio de 2014 por Marcio Junior Vieira

Excelente artigo que compara diversas opções de uso de Hadoop em nuvens, com descritivos de vantagens e desvantagens. Vale a pena conferir esta bem detalhado! http://www.infoq.com/br/articles/hadoop-na-nuvem

Publicado em Hadoop, Open Source | Deixe um comentário

Palestra: Big Data Open Source com Hadoop – FLISOL 2014 – Curitiba

Publicado em 4 de maio de 2014 por Marcio Junior Vieira

Prezados compartilho aqui a palestra apresentada n FLISOL 2014 na PUCPR. Palestra: Big Data Open Source com Hadoop – FLISOL 2014 – Curitiba from Marcio Junior Vieira As imagens ISO ( Maquina Virtual ) para estudos pode ser baixada de … Continue lendo →

Publicado em Big Data, Hadoop, Open Source | Deixe um comentário

Palestras de Colaboradores da Cloudera no SouJava

Publicado em 12 de abril de 2014 por Marcio Junior Vieira

Palestra dos Committers da Apache Hadoop e Desenvolvedores da Cloudera ministrada em São Paulo organizado pelo Sou Java. Continue lendo →

Publicado em Big Data, Hadoop, Open Source | Deixe um comentário

Palestra sobre Apache Crunch

Publicado em 9 de abril de 2014 por Marcio Junior Vieira

Uma boa Palestra intitulada “Big Data otimizado: Arquiteturas eficientes para construção de Pipelines MapReduce” Resumo Essa palestra irá mostrar como arquitetar Pipelines MapReduce eficientes usando o framework Apache Crunch; como integrar pipelines com fontes de dados externas como Redis, MongoDB, … Continue lendo →

Publicado em Big Data, Hadoop, Open Source | Deixe um comentário

Revistas Hadoop : Hadoop Magazine

Publicado em 16 de março de 2014 por Marcio Junior Vieira

Para os Amantes da Laitura e do Hadoop existe uma excelente publicação chamada Hadoop Magazine que pode ser encontrada em http://hadoopmag.com/ No momento deste post a única forma de aquisição era a assinatura anual.

Publicado em Hadoop | Deixe um comentário

Arquivo da categoria: Hadoop

Data Scientist – Consultor BI – SR

Spark como padrão de processamento no Hadoop! Alternativa ao MapReduce

Hadoop – Hive 0.13 100X Mais Rápido – Benchmark

Comunidade Hadoop Brasil – Lista de Discussão

III Fórum HBR Brasil Big Data & Analytics

Hadoop na nuvem

Palestra: Big Data Open Source com Hadoop – FLISOL 2014 – Curitiba

Palestras de Colaboradores da Cloudera no SouJava

Palestra sobre Apache Crunch

Revistas Hadoop : Hadoop Magazine

Posts recentes

Comentários

Categorias

Meta

Lista de Links

Arquivo da categoria: Hadoop

Open Source Tags

Posts recentes

Comentários

Categorias

Meta

Lista de Links