shuttle - Galaxy上的Map Reduce计算框架

Copyright 2015, Baidu, Inc.

概述

shuttle是一个基于Galaxy分布式集群管理系统的Map Reduce计算框架。其底层采用分布式文件系统保存中间数据,具有较好的稳定性和速度。

shuttle提供类似Hadoop的用户界面,能够方便的递交不同种类的任务及监视其状态。

shuttle目前仍在不断完善和发展,致力于提供更好的用户体验、更丰富的配置与功能以及更快的运算速度。

系统架构

shuttle与经典的Map Reduce架构类似,其利用Galaxy进行资源管理及任务调度,并从HDFS上获取输入并将输出存储在HDFS上,中间数据保存于HDFS或NFS上。

shuttle由client/sdk、Master、Minion三者组成。Master将地址写入iNexus,方便client/sdk以及Minion进行寻址和通信。

架构图

系统依赖

系统构建

** 正在构建 **

目前shuttle暂无Makefile进行构建。我们会尽快完善。