Новости IT, хостинга
Новость от 11.11.2010

Адрес в интернете:
https://news.hostdb.ru/index/show/id/2055

Релиз системы для организации распределенных warehouse-хранилищ Apache Hive 0.6.0


Представлен релиз проекта Apache Hive 0.6.0, в рамках которого разработана система для создания хранилищ, оптимизированных для выполнения аналитических запросов над большими массивами данных (Data Warehouse). В качестве основы Apache Hive использует платформу Apache Hadoop, предназначенную для организации распределенной обработки больших объемов данных (петабайты) с использованием парадигмы map/reduce, при которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера.

Кроме традиционной схемы формирования запросов в стиле map/reduce, Apache Hive предоставляет упрощенный механизм обработки данных через SQL-подобный язык запросов HiveQL. Инструкцию по быстрому развертыванию хранилища на базе Apache Hive можно прочитать здесь http://wiki.apache.org/hadoop/Hive/GettingStarted


Распечатано с HostDB.ru.