子博兄的头像-华尔子博-奥夏网
管理员
个人博客分享,技术资料分享!

大数据的其他应用领域

大数据的其他应用领域-华尔子博-奥夏网
数据除了具有第一次被使用时提供的价值以外,还具有无穷无尽的“剩余价值”可以被利用,这一点通过一些具体的应用模式和场景就能得到集中体现。 1. 大数据帮助企业挖掘市场机会,探寻细分市场 ...
4个月前
03411

DBSCAN聚类算法简介

DBSCAN聚类算法简介-华尔子博-奥夏网
DBSCAN(Density—Based Spatial Clustering of Application with Noise)算法是一种典型的基于密度的聚类方法。它将簇定义为密度相连的点的最大集合,能够把具有足够密度的区域划分为簇,并可...
5个月前
05012

什么是聚类分析?聚类分析方法的类别

什么是聚类分析?聚类分析方法的类别-华尔子博-奥夏网
聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。 基本概念 聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似...
5个月前
04412

Spark是什么?Spark和Hadoop的区别

Spark是什么?Spark和Hadoop的区别-华尔子博-奥夏网
Spark 是加州大学伯克利分校 AMP(Algorithms,Machines,People)实验室开发的通用内存并行计算框架。 Spark 在 2013 年 6 月进入 Apache 成为孵化项目,8 个月后成为 Apache 顶级项目。 Spark...
2年前
07411

MapReduce编程实例:单词计数

MapReduce编程实例:单词计数-华尔子博-奥夏网
本节介绍如何编写基本的 MapReduce 程序实现数据分析。本节代码是基于 Hadoop 2.7.3 开发的。 任务准备 单词计数(WordCount)的任务是对一组输入文档中的单词进行分别计数。假设文件的量比较大...
2年前
08611

Hadoop HBase数据库的详解介绍及使用范例

Hadoop HBase数据库的详解介绍及使用范例-华尔子博-奥夏网
这里我们继续深入详细了解HBase,并通过一个实例使用HBase进行数据操作。 1. HBase数据模型HBase的数据模型主要包含: - Table:对应关系数据库中的表,用于存储类似数据。 - Row:对应表中的行,根据...
3年前
07911

NoSQL数据库类型简介

NoSQL数据库类型简介-华尔子博-奥夏网
近些年来,NoSQL 数据库的发展势头很快。据统计,目前已经产生了 50 到 150 个 NoSQL 数据库系统。但是,归结起来,可以将典型的 NoSQL 划分为 4 种类型,分别是键值数据库、列式数据库、文档数...
3年前
0659

NoSQL非关系型数据库简介及与关系数据库的区别

NoSQL非关系型数据库简介及与关系数据库的区别-华尔子博-奥夏网
虽然关系型数据库系统很优秀,但是在大数据时代,面对快速增长的数据规模和日渐复杂的数据模型,关系型数据库系统已无法应对很多数据库处理任务。 NoSQL 凭借易扩展、大数据量和高性能及灵活的...
3年前
05114

HDFS读取和写入数据简介 HDFS的文件访问机制

HDFS读取和写入数据简介 HDFS的文件访问机制-华尔子博-奥夏网
HDFS的文件访问机制为流式访问机制,即通过 API 打开文件的某个数据块之后,可以顺序读取或者写入某个文件。由于 HDFS 中存在多个角色,且对应的应用场景主要为一次写入、多次读取的场景,因此...
4年前
016711

Scrapy是什么,Scrapy网络爬虫简介

Scrapy是什么,Scrapy网络爬虫简介-华尔子博-奥夏网
Scrapy 是一个为了爬取网站数据、提取结构性数据而编写的应用框架,可以应用在包括数据挖掘、信息处理或存储历史数据等一系列的程序中。 1. Scrapy 架构 Scrapy 的整体架构由 Scrapy 引擎(Scra...
5年前
02230