Oracle数据库如何备份与恢复

Oracle数据库如何备份与恢复-华尔子博-奥夏网
当我们使用一个数据库时,总希望数据库的内容是可靠的、正确的,但由于计算机系统的故障(包括机器故障、介质故障、误操作等),数据库有时也可能遭到破坏,这时如何尽快恢复数据就成为当务之急。...
5年前
02200

大数据在物流行业的应用

大数据在物流行业的应用-华尔子博-奥夏网
物流大数据就是通过海量的物流数据,即运输、仓储、搬运装卸、包装及流通加工等物流环节中涉及的数据、信息等,挖掘出新的增值价值,通过大数据分析可以提高运输与配送效率,减少物流成本,更有...
7天前
0398

Apriori算法和FP-Tree算法简介

Apriori算法和FP-Tree算法简介-华尔子博-奥夏网
基于 Apriori 算法的关联分析方法。为了克服 Apriori 算法在复杂度和效率方面的缺陷,进一步的介绍了基于 FP-Tree 的频繁模式挖掘方法。 Apriori关联分析算法 Apriori 算法是挖掘产生关联规则所...
2个月前
05513

Spark MLlib简介

Spark MLlib简介-华尔子博-奥夏网
MLlib 是 Spark 的机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。 MLlib 由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优...
2年前
0606

HBase主要运行机制(物理存储和逻辑架构)

HBase主要运行机制(物理存储和逻辑架构)-华尔子博-奥夏网
本节将对 HBase 的主要运行机制进行简单介绍。 HBase 的物理存储 HBase 表中的所有行都是按照行键的字典序排列的。因为一张表中包含的行的数量非常多,有时候会高达几亿行,所以需要分布存储到...
2年前
0318

HDFS架构和实现机制简介 HDFS 是什么?

HDFS架构和实现机制简介 HDFS 是什么?-华尔子博-奥夏网
HDFS 整体架构 HDFS 是一个主从 Master/Slave 架构。一个 HDFS 集群包含一个 NameNode,这是一个 Master Server,用来管理文件系统的命名空间,以及调节客户端对文件的访问。一个 HDFS 集群还包...
4年前
05710

大数据预处理,大数据数据清洗

大数据预处理,大数据数据清洗-华尔子博-奥夏网
现实世界的数据常常是不完全的、有噪声的、不一致的。数据清洗过程包括遗漏数据处理,噪声数据处理,以及不一致数据处理。本节介绍数据清洗的主要处理方法。 遗漏数据处理 假设在分析一个商场销...
5年前
01930

大数据预处理架构和方法简介

大数据预处理架构和方法简介-华尔子博-奥夏网
数据预处理主要包括数据清洗(Data Cleaning)、数据集成(Data Integration)、数据转换(Data Transformation)和数据消减(Data Reduction)。本节在介绍大数据预处理基本概念的基础上对数据...
5年前
01850

通过网络爬虫采集大数据的方法

通过网络爬虫采集大数据的方法-华尔子博-奥夏网
网络数据采集是指通过网络爬虫或网站公开 API 等方式从网站上获取数据信息。该方法可以将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并以结构化的方式存储。它支持图片、音...
5年前
01790

Redis悲观锁、乐观锁和调用Lua脚本三种方式的优缺点

Redis悲观锁、乐观锁和调用Lua脚本三种方式的优缺点-华尔子博-奥夏网
教程前面主要讨论了 Java 互联网的高并发应用,先谈及了一些常用的系统设计理念,用以搭建高可用的互联网应用系统,着重介绍了抢红包的高并发应用,还讨论了数据不一致的超发问题。 并且还论述...
2年前
05112