Материалов:
1 082 141

Репозиториев:
30

Авторов:
761 409

Организация процесса распределенной обработки больших объёмов данных с использованием кластера Apache Hadoop

Дата публикации: 2013

Дата публикации в реестре: 2021-08-05T17:32:10Z

Аннотация:

В статье рассматривается проблема организации процесса распределенной обработки, больших объёмов данных применительно к анализу логов серверов и приложений. Анализ логов позволяет выявить тенденции нагрузки и доступа к ресурсам системы и далее па основе этого определить факты, сетевых атак и несанкционированного доступа. В рамках решения поставленной задачи были проанализированы, средства обработки, больших объёмов данных и выбран фреймворк Apache Hatloop, позволяющий запускать вычисления в кластере. Описан процесс организации обработки, данных с применением данного фреймворка.

Тип: Статья


Связанные документы (рекомендация CORE)