A Hortonworks , uma das principais distribuições de Hadoop lançou um excelente Post de como usar Dados Abertos, Hadoop e Python para aprendizado supervisionado em Big Data.
Nós EUA, todos os anos, aproximadamente 20% dos vôos atrasam ou são cancelados, o que resulta em custos significativos para os viajantes e as companhias aéreas. Neste exemplo de caso de uso descrito bo Post, será construir um modelo de aprendizado supervisionado que prevê atraso companhia aérea a partir de dados de vôo histórico e informações meteorológicas.
http://br.hortonworks.com/blog/data-science-apacheh-hadoop-predicting-airline-delays/