Skip to content

基本概念

Hadoop 是一个开源的分布式计算框架,用于处理和分析海量数据集。它最初由 Doug Cutting Mike Cafarella 开发,Hadoop 广泛应用于:大数据分析、日志处理、推荐系统、数据仓库、机器学习、金融分析和生物信息学等领域等

随着技术的发展,虽然Hadoop MapReduce的部分功能已被 Spark 等更快的引擎取代,但 HDFS YARN 仍然是许多大数据架构的基础组件

Released under the MIT License.