MapReduce

MapReduce — модель программирования, ориентированная на обработку данных. Эта модель проста, но не настолько, чтобы в ее контексте нельзя было реализовать полезные программы. Hadoop позволяет запускать программы MapReduce, напи­санные на разных языках: Java, Ruby, Python и C++. Но самое важное заключается в том, что программы MapReduce параллельны по своей природе, а следовательно, крупномасштабный анализ данных становится доступным для всех, у кого в рас­поряжении имеется достаточно компьютеров. Достоинства MapReduce в полной мере проявляются в работе с большими наборами данных, так что начнем с рас­смотрения одного из таких наборов.


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


BigData - Hadoop - MapReduce


Пример запуска MapReduce (Java)


MapReduce v2