Hadoop共26篇 第2页
Hadoop‌是一个由Apache基金会所开发的分布式系统基础架构,主要用于解决海量数据的存储和大数据分析计算问题。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储‌。

学完SQL数据库,与之相关的高薪工作有哪些

学完SQL数据库,与之相关的高薪工作有哪些-华尔子博-奥夏网
SQL可以执行查询,检索数据,插入或删除记录,在数据库中创建表或存储过程,等等。SQL是市场上最适应的利基市场。进入IT行业后就换工作不是什么大问题。最困难的部分是在一开始。 根据各种求职...
南宫世家的头像-华尔子博-奥夏网南宫世家5年前
01820

程序员的薪水和发展方向大全 仅作参考

如果你是一名初学者,对编程非常感兴趣,想成为一名合格的程序员,那么这篇文章就是为你写的。 从初学者成长为一名合格的程序员需要一段时间的磨练,每个人付出的时间和做事的效率不同,我不好...
子博兄的头像-华尔子博-奥夏网5年前
01790

大数据处理技术有哪些?大数据处理系统核心技术

大数据技术的基本概念进行简单介绍,包括分布式计算、服务器集群和 Google 的 3 个大数据技术。 分布式计算 对于如何处理大数据,计算机科学界有两大方向。 第一个方向是集中式计算,就是通过不...
子博兄的头像-华尔子博-奥夏网5年前
01520

Hadoop MapReduce工作流程介绍

Hadoop MapReduce工作流程介绍-华尔子博-奥夏网
MapReduce 就是将输入进行分片,交给不同的 Map 任务进行处理,然后由 Reduce 任务合并成最终的解。 MapReduce 的实际处理过程可以分解为 Input、Map、Sort、Combine、Partition、Reduce、Outpu...
天山雪莲的头像-华尔子博-奥夏网天山雪莲3年前
010011

MapReduce执行流程和Shuffle过程

MapReduce执行流程和Shuffle过程-华尔子博-奥夏网
本节将对 Hadoop MapReduce 的工作机制进行介绍,主要从 MapReduce 的作业执行流程和 Shuffle 过程方面进行阐述。通过加深对 MapReduce 工作机制的了解,可以使程序开发者更合理地使用 MapReduc...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
0875

MapReduce编程实例:单词计数

本节介绍如何编写基本的 MapReduce 程序实现数据分析。本节代码是基于 Hadoop 2.7.3 开发的。 任务准备 单词计数(WordCount)的任务是对一组输入文档中的单词进行分别计数。假设文件的量比较大...
子博兄的头像-华尔子博-奥夏网子博兄2年前
08611

Hadoop HBase数据库的详解介绍及使用范例

这里我们继续深入详细了解HBase,并通过一个实例使用HBase进行数据操作。 1. HBase数据模型HBase的数据模型主要包含: - Table:对应关系数据库中的表,用于存储类似数据。 - Row:对应表中的行,根据...
子博兄的头像-华尔子博-奥夏网子博兄3年前
08111

HDFS两种操作方式:命令行和Java API

HDFS两种操作方式:命令行和Java API-华尔子博-奥夏网
HDFS 文件操作有两种方式:一种是命令行方式,Hadoop 提供了一套与 Linux 文件命令类似的命令行工具;另一种是 Java API,即利用 Hadoop 的 Java 库,采用编程的方式操作 HDFS 的文件。 本节将...
王麻子的头像-华尔子博-奥夏网王麻子3年前
07912

Hadoop MapReduce架构

Hadoop MapReduce架构-华尔子博-奥夏网
Hadoop MapReduce 是 Hadoop 平台根据 MapReduce 原理实现的计算框架,目前已经实现了两个版本,MapReduce 1.0 和基于 YARN 结构的 MapReduce 2.0。 尽管 MapReduce 1.0 中存在一些问题,但是整...
天山雪莲的头像-华尔子博-奥夏网天山雪莲2年前
07714

Spark总体架构和运行流程

Spark总体架构和运行流程-华尔子博-奥夏网
本节将首先介绍 Spark 的运行架构和基本术语,然后介绍 Spark 运行的基本流程,最后介绍 RDD 的核心理念和运行原理。 Spark 总体架构 Spark 运行架构如图 1 所示,包括集群资源管理器(Cluster ...
王麻子的头像-华尔子博-奥夏网王麻子2年前
07511