Организация процесса распределенной обработки больших объёмов данных с использованием кластера Apache Hadoop

Слисенко, К. Ю.; Сиротко, С. И.; Кириченко, А. Н.

Организация процесса распределенной обработки больших объёмов данных с использованием кластера Apache Hadoop

Слисенко, К. Ю., Сиротко, С. И., Кириченко, А. Н.

Дата публикации: 2013

Дата публикации в реестре: 2021-08-05T17:32:10Z

Аннотация:

В статье рассматривается проблема организации процесса распределенной обработки, больших объёмов данных применительно к анализу логов серверов и приложений. Анализ логов позволяет выявить тенденции нагрузки и доступа к ресурсам системы и далее па основе этого определить факты, сетевых атак и несанкционированного доступа. В рамках решения поставленной задачи были проанализированы, средства обработки, больших объёмов данных и выбран фреймворк Apache Hatloop, позволяющий запускать вычисления в кластере. Описан процесс организации обработки, данных с применением данного фреймворка.

Ключевые слова:
вычисления в кластерах, обработка данных, материалы конференций, кластеры, фреймворки, фреймворк Apache Hatloop

Тип: Статья

Организация процесса распределенной обработки больших объёмов данных с использованием кластера Apache Hadoop

Связанные документы (рекомендация CORE)

Партнеры

Индексация