大数据共81篇 第2页
大数据(Big Data)指的是无法通过传统数据处理工具在合理时间内进行捕捉、管理和处理的数据集合‌。这些数据集通常具有海量、高增长率和多样化的特点,包括结构化和非结构化数据‌。

Redis数据库的应用场景介绍

Redis数据库的应用场景介绍-华尔子博-奥夏网
一、MySql Memcached架构的问题 实际MySQL是适合进行海量数据存储的,通过Memcached将热点数据加载到cache,加速访问,很多公司都曾经使用过这样的架构,但随着业务数据量的不断增加,和访问量...
王麻子的头像-华尔子博-奥夏网王麻子2年前
07713

Spark Streaming的系统架构

Spark Streaming的系统架构-华尔子博-奥夏网
本节首先分析传统流处理系统架构存在的问题,然后介绍 Spark Streaming 的系统架构及其工作原理和优势。 传统流处理系统架构 流处理架构的分布式流处理管道执行方式是,首先用数据采集系统接收...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
05313

数据挖掘是什么?

数据挖掘是什么?-华尔子博-奥夏网
什么是数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取出蕴涵在其中的,人们事先不知道的,但是具有潜在有用性的信息和知识的过程。 用来进行数据挖掘的数据...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
04612

DEDECMS批量导入excel数据到后台文章系统的开发教程

DEDECMS批量导入excel数据到后台文章系统的开发教程-华尔子博-奥夏网
本教程就是以把excel数据导入到织梦系统(dedecms)为例子进行批量数据导入的开发,假设把excel数据导入到织梦主表dede_archives(还有微表和附加表,这里就用主表代表这三个表)里面。 批量导入...
天山雪莲的头像-华尔子博-奥夏网天山雪莲2年前
05512

云主机的发展前景怎样?会成为主流吗?

云主机的发展前景怎样?会成为主流吗?云计算技术的发展趋势,大幅度降低了公司的运维管理成本费,并日渐加快公司的更改。从数据信息上看,仅用短短的几年,企业上云已经是必然趋势。在网络服务器...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4个月前
02412

Spark是什么?Spark和Hadoop的区别

Spark是什么?Spark和Hadoop的区别-华尔子博-奥夏网
Spark 是加州大学伯克利分校 AMP(Algorithms,Machines,People)实验室开发的通用内存并行计算框架。 Spark 在 2013 年 6 月进入 Apache 成为孵化项目,8 个月后成为 Apache 顶级项目。 Spark...
子博兄的头像-华尔子博-奥夏网子博兄2年前
05011

大数据的其他应用领域

数据除了具有第一次被使用时提供的价值以外,还具有无穷无尽的“剩余价值”可以被利用,这一点通过一些具体的应用模式和场景就能得到集中体现。 1. 大数据帮助企业挖掘市场机会,探寻细分市场 ...
子博兄的头像-华尔子博-奥夏网子博兄3个月前
03011

分割超大Redis数据库的方法详解

Redis数据库过大会导致内存消耗过高和性能下降。这时需要对数据库进行切分或裁剪。主要有以下两种方法: 1. 切分数据库Redis支持切分数据库为多个子数据库,每个数据库有自己的键空间。可以将大数...
天山雪莲的头像-华尔子博-奥夏网天山雪莲3年前
04611

Spark RDD是什么?

Spark RDD是什么?-华尔子博-奥夏网
Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。本节...
子博兄的头像-华尔子博-奥夏网2年前
04310

Spark生态圈简介

Spark生态圈简介-华尔子博-奥夏网
Spark 生态圈是加州大学伯克利分校的 AMP 实验室打造的,是一个力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成来展现大数据应用的平台。 AMP 实验室运用大数据、...
王麻子的头像-华尔子博-奥夏网王麻子2年前
05910