磁盘共189篇 第16页
磁盘(disk)是指利用磁记录技术存储数据的存储器‌,是计算机主要的存储介质之一,可以存储大量的二进制数据,并且断电后也能保持数据不丢失‌。磁盘通过磁性材料记录数据,具有高容量、高持久性和可靠性的特点,被广泛应用于计算机系统中‌。

Spark MLlib简介

MLlib 是 Spark 的机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。 MLlib 由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优...
子博网的头像-华尔子博-奥夏网子博网7个月前
0496

Spark总体架构和运行流程

Spark总体架构和运行流程-华尔子博-奥夏网
本节将首先介绍 Spark 的运行架构和基本术语,然后介绍 Spark 运行的基本流程,最后介绍 RDD 的核心理念和运行原理。 Spark 总体架构 Spark 运行架构如图 1 所示,包括集群资源管理器(Cluster ...
王麻子的头像-华尔子博-奥夏网王麻子9个月前
04411

Spark RDD是什么?

Spark RDD是什么?-华尔子博-奥夏网
Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。本节...
子博兄的头像-华尔子博-奥夏网9个月前
02710

Spark是什么?Spark和Hadoop的区别

Spark是什么?Spark和Hadoop的区别-华尔子博-奥夏网
Spark 是加州大学伯克利分校 AMP(Algorithms,Machines,People)实验室开发的通用内存并行计算框架。 Spark 在 2013 年 6 月进入 Apache 成为孵化项目,8 个月后成为 Apache 顶级项目。 Spark...
子博兄的头像-华尔子博-奥夏网子博兄9个月前
02611

MapReduce执行流程和Shuffle过程

MapReduce执行流程和Shuffle过程-华尔子博-奥夏网
本节将对 Hadoop MapReduce 的工作机制进行介绍,主要从 MapReduce 的作业执行流程和 Shuffle 过程方面进行阐述。通过加深对 MapReduce 工作机制的了解,可以使程序开发者更合理地使用 MapReduc...
南宫世家的头像-华尔子博-奥夏网南宫世家9个月前
0395

Hadoop MapReduce简介

Hadoop MapReduce简介-华尔子博-奥夏网
本节首先简单介绍大数据批处理概念,然后介绍典型的批处理模式 MapReduce,最后对 Map 函数和 Reduce 函数进行描述。 批处理模式 批处理模式是一种最早进行大规模数据处理的模式。批处理主要操...
王麻子的头像-华尔子博-奥夏网王麻子9个月前
0415

NoSQL数据库类型简介

NoSQL数据库类型简介-华尔子博-奥夏网
近些年来,NoSQL 数据库的发展势头很快。据统计,目前已经产生了 50 到 150 个 NoSQL 数据库系统。但是,归结起来,可以将典型的 NoSQL 划分为 4 种类型,分别是键值数据库、列式数据库、文档数...
子博兄的头像-华尔子博-奥夏网子博兄2年前
0379

HDFS两种操作方式:命令行和Java API

HDFS两种操作方式:命令行和Java API-华尔子博-奥夏网
HDFS 文件操作有两种方式:一种是命令行方式,Hadoop 提供了一套与 Linux 文件命令类似的命令行工具;另一种是 Java API,即利用 Hadoop 的 Java 库,采用编程的方式操作 HDFS 的文件。 本节将...
王麻子的头像-华尔子博-奥夏网王麻子2年前
06712

HDFS基本原理和设计理念,HDFS 的局限性有哪些

HDFS基本原理和设计理念,HDFS 的局限性有哪些-华尔子博-奥夏网
HDFS基本原理和设计理念,HDFS 的局限性有哪些。为了解决存储结点负载不均衡的问题,HDFS 首先把一个文件分割成多个块,然后再把这些文件块存储在不同服务器上。这种方式的优势就是不怕文件太大...
王麻子的头像-华尔子博-奥夏网王麻子3年前
05150

使用Redis和Lua的原子性实现抢红包功能

使用Redis和Lua的原子性实现抢红包功能-华尔子博-奥夏网
数据库最终会将数据保存到磁盘中,而 Redis 使用的是内存,内存的速度比磁盘速度快得多,所以这里将讨论使用 Redis 实现抢红包。 对于使用 Redis 实现抢红包,首先需要知道的是 Redis 的功能不...
南宫世家的头像-华尔子博-奥夏网南宫世家9个月前
05713