大数据共66篇 第6页
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

数据挖掘是什么?

数据挖掘是什么?-华尔子博-奥夏网
什么是数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取出蕴涵在其中的,人们事先不知道的,但是具有潜在有用性的信息和知识的过程。 用来进行数据挖掘的数据...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
04412

DBSCAN聚类算法简介

DBSCAN聚类算法简介-华尔子博-奥夏网
DBSCAN(Density—Based Spatial Clustering of Application with Noise)算法是一种典型的基于密度的聚类方法。它将簇定义为密度相连的点的最大集合,能够把具有足够密度的区域划分为簇,并可...
子博兄的头像-华尔子博-奥夏网子博兄4个月前
04412

大数据在物流行业的应用

大数据在物流行业的应用-华尔子博-奥夏网
物流大数据就是通过海量的物流数据,即运输、仓储、搬运装卸、包装及流通加工等物流环节中涉及的数据、信息等,挖掘出新的增值价值,通过大数据分析可以提高运输与配送效率,减少物流成本,更有...
子博网的头像-华尔子博-奥夏网子博网3个月前
0438

基于大数据的个性化推荐系统

基于大数据的个性化推荐系统-华尔子博-奥夏网
随着互联网时代的发展和大数据时代的到来,人们逐渐从信息匮乏的时代走入了信息过载的时代。为了让用户从海量信息中高效地获取自己所需的信息,推荐系统应运而生。 推荐系统的主要任务就是联系...
王麻子的头像-华尔子博-奥夏网王麻子4个月前
0428

Spark是什么?Spark和Hadoop的区别

Spark是什么?Spark和Hadoop的区别-华尔子博-奥夏网
Spark 是加州大学伯克利分校 AMP(Algorithms,Machines,People)实验室开发的通用内存并行计算框架。 Spark 在 2013 年 6 月进入 Apache 成为孵化项目,8 个月后成为 Apache 顶级项目。 Spark...
子博兄的头像-华尔子博-奥夏网子博兄2年前
04211

HBase常用Java API

本节介绍与 HBase 数据存储管理相关的 Java API(基于 HBase 版本 1.2.3)。 HBase 的常用Java API HBase 主要包括 5 大类操作:HBase 的配置、HBase 表的管理、列族的管理、列的管理、数据操作...
王麻子的头像-华尔子博-奥夏网王麻子2年前
04013

Spark RDD是什么?

Spark RDD是什么?-华尔子博-奥夏网
Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。本节...
子博兄的头像-华尔子博-奥夏网2年前
03910

什么是聚类分析?聚类分析方法的类别

什么是聚类分析?聚类分析方法的类别-华尔子博-奥夏网
聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。 基本概念 聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似...
子博兄的头像-华尔子博-奥夏网子博兄4个月前
03812

Spark开发实例(编程实践)

Spark开发实例(编程实践)-华尔子博-奥夏网
本节将介绍如何实际动手进行 RDD 的转换与操作,以及如何编写、编译、打包和运行 Spark 应用程序。 启动 Spark Shell Spark 的交互式脚本是一种学习 API 的简单途径,也是分析数据集交互的有力...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
0385

Spark Streaming编程实战(开发实例)

Spark Streaming编程实战(开发实例)-华尔子博-奥夏网
本节介绍如何编写 Spark Streaming 应用程序,由简到难讲解使用几个核心概念来解决实际应用问题。 流数据模拟器 在实例演示中模拟实际情况,需要源源不断地接入流数据,为了在演示过程中更接近...
天山雪莲的头像-华尔子博-奥夏网天山雪莲2年前
03413