数码家电 爆款热卖-华尔子博-奥夏网
华尔子博-记录IT人的美好生活-华尔子博-奥夏网
华尔子博-记录IT人的美好生活-华尔子博-奥夏网
华尔子博-记录IT人的美好生活-华尔子博-奥夏网
华尔子博-记录IT人的美好生活-华尔子博-奥夏网
华尔子博-记录IT人的美好生活-华尔子博-奥夏网
华尔子博-记录IT人的美好生活-华尔子博-奥夏网
最新发布第264页

NoSQL非关系型数据库简介及与关系数据库的区别

虽然关系型数据库系统很优秀,但是在大数据时代,面对快速增长的数据规模和日渐复杂的数据模型,关系型数据库系统已无法应对很多数据库处理任务。 NoSQL 凭借易扩展、大数据量和高性能及灵活的...
子博兄的头像-华尔子博-奥夏网子博兄2年前
03914

HDFS两种操作方式:命令行和Java API

HDFS两种操作方式:命令行和Java API-华尔子博-奥夏网
HDFS 文件操作有两种方式:一种是命令行方式,Hadoop 提供了一套与 Linux 文件命令类似的命令行工具;另一种是 Java API,即利用 Hadoop 的 Java 库,采用编程的方式操作 HDFS 的文件。 本节将...
王麻子的头像-华尔子博-奥夏网王麻子2年前
06912

HDFS读取和写入数据简介 HDFS的文件访问机制

HDFS读取和写入数据简介 HDFS的文件访问机制-华尔子博-奥夏网
HDFS的文件访问机制为流式访问机制,即通过 API 打开文件的某个数据块之后,可以顺序读取或者写入某个文件。由于 HDFS 中存在多个角色,且对应的应用场景主要为一次写入、多次读取的场景,因此...
子博兄的头像-华尔子博-奥夏网子博兄3年前
015311

HDFS架构和实现机制简介 HDFS 是什么?

HDFS架构和实现机制简介 HDFS 是什么?-华尔子博-奥夏网
HDFS 整体架构 HDFS 是一个主从 Master/Slave 架构。一个 HDFS 集群包含一个 NameNode,这是一个 Master Server,用来管理文件系统的命名空间,以及调节客户端对文件的访问。一个 HDFS 集群还包...
子博网的头像-华尔子博-奥夏网子博网3年前
05510

HDFS基本原理和设计理念,HDFS 的局限性有哪些

HDFS基本原理和设计理念,HDFS 的局限性有哪些-华尔子博-奥夏网
本节将对 HDFS 的基本原理进行讲解。 文件系统的问题 文件系统是操作系统提供的磁盘空间管理服务,该服务只需要用户指定文件的存储位置及文件读取路径,而不需要用户了解文件在磁盘上是如何存放...
王麻子的头像-华尔子博-奥夏网王麻子3年前
05170

Hadoop HDFS分布式文件系统简介及特性

Hadoop HDFS分布式文件系统简介及特性-华尔子博-奥夏网
在大数据时代,需要处理分析的数据集的大小已经远远超过了单台计算机的存储能力,因此需要将数据集进行分区并存储到若干台独立的计算机中。但是,分区存储的数据不方便管理和维护,迫切需要一种...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
02550

Hadoop大数据处理框架简介,什么是Hadoop 生态圈?

Hadoop大数据处理框架简介,什么是Hadoop 生态圈?-华尔子博-奥夏网
Hadoop 是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由 Yahoo 的工程师 Doug Cutting 和 Mike Cafarella 在 2005 年合作开发。后来,Hadoop 被贡献给了 Apache 基金会,...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
02050

大数据处理技术有哪些?大数据处理系统核心技术

大数据技术的基本概念进行简单介绍,包括分布式计算、服务器集群和 Google 的 3 个大数据技术。 分布式计算 对于如何处理大数据,计算机科学界有两大方向。 第一个方向是集中式计算,就是通过不...
子博兄的头像-华尔子博-奥夏网4年前
01440

离散化和数值概念层次树简介

离散化和数值概念层次树简介-华尔子博-奥夏网
离散化技术方法可以通过将属性(连续取值)域值范围分为若干区间,来帮助消减一个连续(取值)属性的取值个数。可以用一个标签来表示一个区间内的实际数据值。在基于决策树的分类挖掘中,消减属...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
01320

大数据预处理之数据消减

大数据预处理之数据消减-华尔子博-奥夏网
我们都知道对大规模数据进行复杂的数据分析通常需要耗费大量的时间,这时就需要我们的数据消减技术了。 数据消减技术的主要目的就是从原有巨大数据集中获得一个精简的数据集,并使这一精简数据...
南宫世家的头像-华尔子博-奥夏网南宫世家4年前
01550