Hadoop共26篇 第2页
Hadoop‌是一个由Apache基金会所开发的分布式系统基础架构,主要用于解决海量数据的存储和大数据分析计算问题。用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储‌。

Hadoop HBase数据库的详解介绍及使用范例

这里我们继续深入详细了解HBase,并通过一个实例使用HBase进行数据操作。 1. HBase数据模型HBase的数据模型主要包含: - Table:对应关系数据库中的表,用于存储类似数据。 - Row:对应表中的行,根据...
子博兄的头像-华尔子博-奥夏网子博兄2年前
07511

Hadoop MapReduce工作流程介绍

Hadoop MapReduce工作流程介绍-华尔子博-奥夏网
MapReduce 就是将输入进行分片,交给不同的 Map 任务进行处理,然后由 Reduce 任务合并成最终的解。 MapReduce 的实际处理过程可以分解为 Input、Map、Sort、Combine、Partition、Reduce、Outpu...
天山雪莲的头像-华尔子博-奥夏网天山雪莲2年前
07111

HDFS两种操作方式:命令行和Java API

HDFS两种操作方式:命令行和Java API-华尔子博-奥夏网
HDFS 文件操作有两种方式:一种是命令行方式,Hadoop 提供了一套与 Linux 文件命令类似的命令行工具;另一种是 Java API,即利用 Hadoop 的 Java 库,采用编程的方式操作 HDFS 的文件。 本节将...
王麻子的头像-华尔子博-奥夏网王麻子2年前
06912

大数据处理技术有哪些?大数据处理系统核心技术

大数据技术的基本概念进行简单介绍,包括分布式计算、服务器集群和 Google 的 3 个大数据技术。 分布式计算 对于如何处理大数据,计算机科学界有两大方向。 第一个方向是集中式计算,就是通过不...
子博兄的头像-华尔子博-奥夏网4年前
01440

程序员的薪水和发展方向大全 仅作参考

如果你是一名初学者,对编程非常感兴趣,想成为一名合格的程序员,那么这篇文章就是为你写的。 从初学者成长为一名合格的程序员需要一段时间的磨练,每个人付出的时间和做事的效率不同,我不好...
子博兄的头像-华尔子博-奥夏网4年前
01690

开源协议是什么?有哪些?如何选择?

开源协议是什么?有哪些?如何选择?-华尔子博-奥夏网
开源软件在追求“自由”的同时,不能牺牲程序员的利益,否则将会影响程序员的创造激情,因此世界上现在有 60 多种被开源促进组织(Open Source Initiative)认可的开源许可协议来保证开源工作者...
王麻子的头像-华尔子博-奥夏网王麻子4年前
01700

Linux主要应用领域有哪些?这几个领域你应该知道

Linux主要应用领域有哪些?这几个领域你应该知道-华尔子博-奥夏网
Linux与Windows一样同样都属于操作系统,也是当下非常受欢迎的技术。不过Linux属于开放源代码的程序,随着信息技术的发展以及变化,Linux应用领域越来越广泛,受到更多人关注和重视,那么Linux...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02520

大数据预处理架构和方法简介

大数据预处理架构和方法简介-华尔子博-奥夏网
数据预处理主要包括数据清洗(Data Cleaning)、数据集成(Data Integration)、数据转换(Data Transformation)和数据消减(Data Reduction)。本节在介绍大数据预处理基本概念的基础上对数据...
子博网的头像-华尔子博-奥夏网子博网4年前
01850

通过系统日志采集大数据的实现方法

通过系统日志采集大数据的实现方法-华尔子博-奥夏网
许多公司的平台每天都会产生大量的日志,并且一般为流式数据,如搜索引擎的 pv 和查询等。处理这些日志需要特定的日志系统,这些系统需要具有以下特征。 构建应用系统和分析系统的桥梁,并将它...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
02220

什么是Go语言,Go语言的特性有哪些?

Go语言也称为 Golang,是由 Google 公司开发的一种静态强类型、编译型、并发型、并具有垃圾回收功能的编程语言。 接下来从几个方面来具体介绍一下Go语言的特性。 语法简单 抛开语法样式不谈,单...
子博网的头像-华尔子博-奥夏网子博网4年前
02070