Grade do Pentaho Day 2017 para Data Scientists

data-scientist-web-imageFiz este ano, entre diversas tarefas da organização do Pentaho Day 2017,  a curadoria das palestras e minicursos do evento, e vou relacionar aqui as que recomendo fortemente para os profissionais que estão buscando se formar Data Scientists ( sejam meus ex-alunos e atuais alunos do MBA em Big Data, os alunos que já passaram pelas formações da Big Data da Ambiente Livre ou qualquer futuro Data Scientist de plantão)

O Pentaho é uma plataforma que recomendo a qualquer profissional que trabalha com Dados, é um canivete suiço para o Data Scientist. E digo com certeza que o evento e um atalho no longo caminho de estudo de um Data Scientist, não deixe de investir no seu profissional.

São 39 Palestrantes, 11 Mini Cursos, 35 Palestras sendo 2 Internacionais

Esta galerinha ai embaixo são as feras que vão estar no evento!
pentahoday2017-datascientists No Dia 11 (Quinta) de Maio recomendo aos Data Scientist a seguinte grade:

  • 9:00 – Pentaho 7, Visão e Roadmap com Pedro Alves Senior Vice President, Community da Pentaho, a palestra vai te mostrar que já faz tempo que o Pentaho não é apenas um software de Business Intelligence e sim uma Plataforma ampla com atendimento a diversos recursos de Big Data.

 

  • 9:45 – Pentaho Data Integration com Matt Casters, Desenvolvedor Líder do PDI na  Pentaho. Se já conheçe o PDI venha prestigiar a presença desta fera, se não conhece tem de conhecer, um Data Scientist que não conhece o PDI está 75% mais lento na integração de dados que os que conhecem ( Isso é fato testado ) !

 

  • 11:00 – Panorama Geral de Cases Pentaho – Este é para acompanhar o que esta acontecendo no mundo analytics e sua intersecção com Big Data!

 

 

  • 14:45 – O que fazer com dados e como extrair valor, venha conhecer o 5° V do Big Data.

 

  • 15:30 – Interest Graph: Produzindo conteúdo de forma inteligente, quanto mais você estuda mais conceitos aparecem meu caro jovem Data Scientist, este conceito começou a ser  disseminado entre 2011/2013, e quem vai estar palestrando e o CEO do Grupo NZN, te garanto vai valer a pena conhecer e saber o que eles estão fazendo com isso!

 

  • 17:30 Data Science com R, para quem nunca viu o potencial do R vale a pena estar nesta palestra!

 

No Dia 12 (Sexta) de Maio recomendo aos Data Scientist a seguinte grade:

  • 09:00 Modelagem Dimensional na Prática,  bom você pode dizer, Marcio isso e bem Business Intelligence!!!  Mas se por acaso você leu o que o “unicórnio” Data Scientist tem que ter , Modelagem Dimensional é um dos Skills, então se não conhece comece já com um aluno do próprio  papa do data Warehouse (Ralph Kimball) o meu colega e Leandro Guimarães, e se não conhece Ralph Kimball!!!… por favor não pense mais …venha, você precisa saber!!

 

  • 9:45 – Como acelerar o on-boarding de dados no Data Lake utilizando Pentaho Metadata Injection,  Se já conhece o PDI na palestra no Matt Casters no dia anterior venha agora descobrir como manipular seu Data Lake com um recursos avançado , Data Scientist não tem moleza meu caro , aprende o Básico na quinta, o avançado na sexta e na próxima semana implementa em produção!

 

  • 11:00 POC de Pentaho para tratamento de arquivos CDR para empresas de Telecom.  Telecom sempre é um problema de Big Data, se não sabe o que é um CDR , lembre-se Data Scientist tem que entender de negócio , saiba o que é, e como processar eles e extrair valor.

 

 

  • 14:00 Data warehouse com NoSQL – Migrando o modelo estrela e melhorando a performance do seu business intelligence, esqueça tudo que aprendeu na palestra sobre Modelagem Dimensional e venha quebrar paradigmas! ( sobre esquecer sobre modelagem dimensional é brincadeira! mas Ralph Kimball ficaria no minimo desconfiado de ver seu  filho, o modelo Star Schema,  nos conceitos de  NoSQL, sim também estarei lá aprendendo como :), se pensa que me adiantara o assunto por ser curador? … não! muito pouco! 🙂 a Palestrante e mestranda em Ciência da Computação com ênfase em Ciência de Dados e foi muito bem recomendada!

 

  • 14:45 – Data Lake na OLX – Esta tive o prazer de assistir já , quando conheci o Hudson no TDC. Hudson é Data Engineer da OLX, para quem já ouviu falar um pouco ou nada de Data Lake recomendo não perder por nada, no futuro saberão que talvez vocês não sejam Data Scientists e sim Data Engineer como Hudson. Há uma grande diferença, e seu perfil pode estar mais condicionado a ser um Data Engineer! Nesta palestra será apresentado como a OLX esta montando seu Data Lake, e claro, usam Pentaho também!

 

  • 15:30 – Open Source Data Science – Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho, bom este eu convido todos vocês! Pois eu estarei ministrando ela, se quer economizar alguns milhões e investir em pessoas venha conhecer o que existe de melhor no mundo open source e Free Software para Big Data! Cloudera, MapR, Amazon EMR  que me perdoem mas podemos viver sem vocês :). (não é critica! é uma opção!)

 

  • 16:45 – 4 Passos para Aprendizado de Máquina com Pentaho, venha saber como Minerar dados, mais um Skill do Data Scientist!

Infelizmente para você que lê o post os minicursos já estão fechados , tem um com Pentaho Apache Drill e MongoDB que achei fantástico para Data Scientists “Pentaho Community e NoSQL – MongosDB Lá Vamos “Nozes” , mas está lotado, pode procurar a lista de espera no dia do evento, mas não há como garantir que terá mais vagas.

Bom é só isso , se podemos chamar de só! 🙂

É uma chance de adiantar em dois dias diversos conhecimentos que um Data Scientist tem de ter!

Acesso o site do evento conheça um pouco sobre o Pentaho Day Brasil e garanta já sua vaga no evento organizado pela Comunidade Pentaho Brasileira. O  Evento é gratuito e terá 2 dias de atividades:  networking, palestras, cases e mini-cursos. Inscreva-se aqui

 

 

 

 

 

Sobre Marcio Junior Vieira

Atualmente atua como Cientista de Dados da Ambiente Livre. Evangelista de tecnologias Open Source e Free Software desde 1999. Data Scientist, Data Engineer e Big Data Expert. Certified Pentaho Solutions Consultant. Alfresco ECM & Activiti BPM e Camunda BPM Expert. Scala, Java, PHP, Python and JavaScript Programmer.
Esta entrada foi publicada em Big Data, cientista de dados, Data Science, Data Scientist, Pentaho, R. Adicione o link permanente aos seus favoritos.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *