大数据共66篇 第5页
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

Spark Streaming编程实战(开发实例)

Spark Streaming编程实战(开发实例)-华尔子博-奥夏网
本节介绍如何编写 Spark Streaming 应用程序,由简到难讲解使用几个核心概念来解决实际应用问题。 流数据模拟器 在实例演示中模拟实际情况,需要源源不断地接入流数据,为了在演示过程中更接近...
天山雪莲的头像-华尔子博-奥夏网天山雪莲2年前
08213

NoSQL非关系型数据库简介及与关系数据库的区别

虽然关系型数据库系统很优秀,但是在大数据时代,面对快速增长的数据规模和日渐复杂的数据模型,关系型数据库系统已无法应对很多数据库处理任务。 NoSQL 凭借易扩展、大数据量和高性能及灵活的...
子博兄的头像-华尔子博-奥夏网子博兄3年前
08114

Spark RDD是什么?

Spark RDD是什么?-华尔子博-奥夏网
Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。本节...
子博兄的头像-华尔子博-奥夏网2年前
08010

数据挖掘是什么?

数据挖掘是什么?-华尔子博-奥夏网
什么是数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取出蕴涵在其中的,人们事先不知道的,但是具有潜在有用性的信息和知识的过程。 用来进行数据挖掘的数据...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
07812

Hadoop MapReduce简介

Hadoop MapReduce简介-华尔子博-奥夏网
本节首先简单介绍大数据批处理概念,然后介绍典型的批处理模式 MapReduce,最后对 Map 函数和 Reduce 函数进行描述。 批处理模式 批处理模式是一种最早进行大规模数据处理的模式。批处理主要操...
王麻子的头像-华尔子博-奥夏网王麻子2年前
0755

大数据在互联网行业的应用

大数据在互联网行业的应用-华尔子博-奥夏网
互联网企业拥有大量的线上数据,而且数据量还在快速增长,除了利用大数据提升自己的业务之外,互联网企业已经开始实现数据业务化,利用大数据发现新的商业价值。 以阿里巴巴为例,它不仅在不断...
王麻子的头像-华尔子博-奥夏网王麻子6个月前
07513

数据挖掘之分类和预测简介

数据挖掘之分类和预测简介-华尔子博-奥夏网
分类和预测是两种使用数据进行预测的方式,可用来确定未来的结果。 分类是用于预测数据对象的离散类别的,需要预测的属性值是离散的、无序的。 预测则是用于预测数据对象的连续取值的,需要预测...
子博兄的头像-华尔子博-奥夏网7个月前
07511

大数据在金融行业的应用

大数据在金融行业的应用-华尔子博-奥夏网
金融行业是典型的数据驱动行业,每天都会产生大量的数据,包括交易、报价、业绩报告、消费者研究报告、各类统计数据、各种指数等。所以,金融行业拥有丰富的数据,数据维度比较广泛,数据质量也...
子博兄的头像-华尔子博-奥夏网6个月前
07313

Apriori算法和FP-Tree算法简介

Apriori算法和FP-Tree算法简介-华尔子博-奥夏网
基于 Apriori 算法的关联分析方法。为了克服 Apriori 算法在复杂度和效率方面的缺陷,进一步的介绍了基于 FP-Tree 的频繁模式挖掘方法。 Apriori关联分析算法 Apriori 算法是挖掘产生关联规则所...
子博网的头像-华尔子博-奥夏网子博网7个月前
07313

HBase常用Java API

本节介绍与 HBase 数据存储管理相关的 Java API(基于 HBase 版本 1.2.3)。 HBase 的常用Java API HBase 主要包括 5 大类操作:HBase 的配置、HBase 表的管理、列族的管理、列的管理、数据操作...
王麻子的头像-华尔子博-奥夏网王麻子2年前
07113