大数据共66篇 第2页
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

DBSCAN聚类算法简介

DBSCAN聚类算法简介-华尔子博-奥夏网
DBSCAN(Density—Based Spatial Clustering of Application with Noise)算法是一种典型的基于密度的聚类方法。它将簇定义为密度相连的点的最大集合,能够把具有足够密度的区域划分为簇,并可...
子博兄的头像-华尔子博-奥夏网子博兄4个月前
04412

k-means聚类算法简介

k-means聚类算法简介-华尔子博-奥夏网
k-means 算法是一种基于划分的聚类算法,它以 k 为参数,把 n 个数据对象分成 k 个簇,使簇内具有较高的相似度,而簇间的相似度较低。 1. 基本思想 k-means 算法是根据给定的 n 个数据对象的数...
王麻子的头像-华尔子博-奥夏网王麻子4个月前
0495

什么是聚类分析?聚类分析方法的类别

什么是聚类分析?聚类分析方法的类别-华尔子博-奥夏网
聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。 基本概念 聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似...
子博兄的头像-华尔子博-奥夏网子博兄4个月前
03812

回归分析预测技术简介

回归分析预测技术简介-华尔子博-奥夏网
回归分析的基本概念是用一群变量预测另一个变量的方法。通俗点来讲,就是根据几件事情的相关程度来预测另一件事情发生的概率。回归分析的目的是找到一个联系输入变量和输出变量的最优模型。 回...
王麻子的头像-华尔子博-奥夏网王麻子4个月前
03111

决策树和朴素贝叶斯算法简介

决策树和朴素贝叶斯算法简介-华尔子博-奥夏网
本节主要介绍数据挖掘中常见的分类方法决策树和朴素贝叶斯算法。 决策树算法 决策树(Decision Tree,DT)分类法是一个简单且广泛使用的分类技术。 决策树是一个树状预测模型,它是由结点和有向...
子博兄的头像-华尔子博-奥夏网4个月前
05110

数据挖掘之分类和预测简介

数据挖掘之分类和预测简介-华尔子博-奥夏网
分类和预测是两种使用数据进行预测的方式,可用来确定未来的结果。 分类是用于预测数据对象的离散类别的,需要预测的属性值是离散的、无序的。 预测则是用于预测数据对象的连续取值的,需要预测...
子博兄的头像-华尔子博-奥夏网4个月前
05711

Spark MLlib简介

MLlib 是 Spark 的机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。 MLlib 由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优...
子博网的头像-华尔子博-奥夏网子博网2年前
0606

数据挖掘是什么?

数据挖掘是什么?-华尔子博-奥夏网
什么是数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取出蕴涵在其中的,人们事先不知道的,但是具有潜在有用性的信息和知识的过程。 用来进行数据挖掘的数据...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
04412

Spark Streaming编程实战(开发实例)

Spark Streaming编程实战(开发实例)-华尔子博-奥夏网
本节介绍如何编写 Spark Streaming 应用程序,由简到难讲解使用几个核心概念来解决实际应用问题。 流数据模拟器 在实例演示中模拟实际情况,需要源源不断地接入流数据,为了在演示过程中更接近...
天山雪莲的头像-华尔子博-奥夏网天山雪莲2年前
03413

Spark DStream相关操作

Spark DStream相关操作-华尔子博-奥夏网
与 RDD 类似,DStream 也提供了自己的一系列操作方法,这些操作可以分成 3 类:普通的转换操作、窗口转换操作和输出操作。 普通的转换操作 普通的转换操作如表 1 所示 表 1 普通的转换操作 Suo ...
子博兄的头像-华尔子博-奥夏网2年前
04613