Hive
Hive — система управления базами данных на основе платформы Hadoop с SQL-подобным языком запросов, позволяет выполнять запросы, агрегировать и анализировать данные; компонент экосистемы Hadoop.
Apache Hive | |
---|---|
Тип | Система управления базами данных |
Автор | |
Разработчик | Apache Software Foundation |
Написана на | Java |
Операционная система | Кроссплатформенное программное обеспечение |
Языки интерфейса | Английский |
Первый выпуск | 9 ноября 2011[1] |
Аппаратная платформа | Java Virtual Machine |
Последняя версия | |
Репозиторий |
git.apache.org/hive.git svn.apache.org/repos/asf… |
Состояние | Активный |
Лицензия | Apache License 2 |
Сайт | hive.apache.org |
Медиафайлы на Викискладе |
Создан корпорацией Facebook, в 2011 году передан под открытой лицензией в фонд Apache.
Работает напрямую с HDFS и Apache HBase, поддерживает основные форматы Hadoop. Запросы могут выполняться через Tez, Spark или Hadoop MapReduce[3].
Язык запросов — HiveQL — приближен к SQL, при этом не реализует все возможности стандарта SQL-92. В язык встроены функции для работы с форматами XML и JSON, поддержка нескалярных типов данных, таких как массивы, структуры, ассоциативные массивы[4], реализован достаточно широкий набор агрегатных функций, поддерживаются определяемые пользователем функции, блокировки.
Пример сеанса работы с Hive с применением HiveQL — удаление таблицы, создание таблицы, загрузка в неё данных из текстового файла и запрос для подсчёта, сколько раз каждое слово встречалось в файле:
DROP TABLE IF EXISTS docs;
CREATE TABLE docs (line STRING);
LOAD DATA INPATH 'input_file' OVERWRITE INTO TABLE docs;
CREATE TABLE word_counts AS
SELECT word, count(1) AS count FROM
(SELECT explode(split(line, '\s')) AS word FROM docs) temp
GROUP BY word
ORDER BY word;
Примечания
править- ↑ https://projects.apache.org/json/projects/hive.json
- ↑ Apache Hive 3.1.3 Released — 2022.
- ↑ About Apache Hive . Дата обращения: 11 августа 2016. Архивировано 30 августа 2016 года.
- ↑ SQL Differences Between Impala and Hive . Дата обращения: 11 августа 2016. Архивировано 9 августа 2016 года.
Ссылки
править- Официальный сайт
- The Free Hive Book Архивная копия от 1 февраля 2014 на Wayback Machine
- Apache Hive Wiki