Вышел дистрибутив для систем облачных вычислений на основе Open Source
Американская компания Cloudera выпустила третью версию коммерческого дистрибутива Cloudera Distribution for Hadoop (CDH), в который включены инструменты для развертывания систем распределенных вычислений на базе Hadoop, а также высокоуровневые языки, механизмы вызова удаленных процедур, сериализации, планирования и распределения работ. Для решения этих задач CDH соединяет в одном дистрибутиве различные компоненты с открытым кодом, такие как Flume, Hbase, Hive, Hadoop User Experience, Oozie, Pig, Sqoop и ZooKeeper.
“Если есть подходящее решение от сообщества, мы включаем его в состав дистрибутива, – говорит Джефф Хаммербахер (Jeff Hammerbacher), сооснователь Cloudera. – А где решения корпоративного уровня отсутствуют, мы разрабатываем собственные”.
По мнению Стивена О'Грейди, аналитика компании RedMonk, новое предложение Cloudera значительно упростит развертывание систем распределенного хранения и обработки данных на основе Hadoop и повысит доступность этой технологии.
Система распределенных вычислений Hadoop используется такими компаниями как Yahoo!, A9.com, Facebook, IBM и LinkedIn. Однако сама по себе система Hadoop еще не достаточна для развертывания полноценных систем распределенных вычислений. По словам Хаммербахера, дистрибутив CDH представляет собой в отношении Hadoop примерно то же, чем операционная система GNU является в отношении Linux: “Вы добавляете набор сервисов [к базовой инфраструктуре Hadoop">, и вдруг оказывается, что ваша система готова к реальной работе”, - говорит он.