数据挖掘共13篇
数据挖掘技术是数据处理的技术,从数据本身来考虑,通常数据挖掘需要有数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。

基于大数据的个性化推荐系统

基于大数据的个性化推荐系统-华尔子博-奥夏网
随着互联网时代的发展和大数据时代的到来,人们逐渐从信息匮乏的时代走入了信息过载的时代。为了让用户从海量信息中高效地获取自己所需的信息,推荐系统应运而生。 推荐系统的主要任务就是联系...
王麻子的头像-华尔子博-奥夏网王麻子21天前
0408

基于大数据的精准营销

在大数据时代到来之前,企业营销只能利用传统的营销数据,包括客户关系管理系统中的客户信息、广告效果、展览等一些线下活动的效果。数据的来源仅限于消费者某一方面的有限信息,不能提供充分的...
天山雪莲的头像-华尔子博-奥夏网天山雪莲24天前
0419

数据挖掘之关联规则分析简介

关联分析是指从大量数据中发现项集之间有趣的关联和相关联系。关联分析的一个典型例子是购物篮分析。在大数据时代,关联分析是最常见的数据挖掘任务之一。 概述 关联分析是一种简单、实用的分析...
王麻子的头像-华尔子博-奥夏网王麻子28天前
0429

什么是聚类分析?聚类分析方法的类别

什么是聚类分析?聚类分析方法的类别-华尔子博-奥夏网
聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。 基本概念 聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似...
子博兄的头像-华尔子博-奥夏网子博兄35天前
03812

决策树和朴素贝叶斯算法简介

决策树和朴素贝叶斯算法简介-华尔子博-奥夏网
本节主要介绍数据挖掘中常见的分类方法决策树和朴素贝叶斯算法。 决策树算法 决策树(Decision Tree,DT)分类法是一个简单且广泛使用的分类技术。 决策树是一个树状预测模型,它是由结点和有向...
子博兄的头像-华尔子博-奥夏网39天前
04910

数据挖掘之分类和预测简介

数据挖掘之分类和预测简介-华尔子博-奥夏网
分类和预测是两种使用数据进行预测的方式,可用来确定未来的结果。 分类是用于预测数据对象的离散类别的,需要预测的属性值是离散的、无序的。 预测则是用于预测数据对象的连续取值的,需要预测...
子博兄的头像-华尔子博-奥夏网39天前
05411

Spark MLlib简介

MLlib 是 Spark 的机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。 MLlib 由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优...
子博网的头像-华尔子博-奥夏网子博网1年前
0606

数据挖掘是什么?

数据挖掘是什么?-华尔子博-奥夏网
什么是数据挖掘 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取出蕴涵在其中的,人们事先不知道的,但是具有潜在有用性的信息和知识的过程。 用来进行数据挖掘的数据...
南宫世家的头像-华尔子博-奥夏网南宫世家1年前
04212

Spark生态圈简介

Spark生态圈简介-华尔子博-奥夏网
Spark 生态圈是加州大学伯克利分校的 AMP 实验室打造的,是一个力图在算法(Algorithms)、机器(Machines)、人(People)之间通过大规模集成来展现大数据应用的平台。 AMP 实验室运用大数据、...
王麻子的头像-华尔子博-奥夏网王麻子1年前
04510

Spark RDD是什么?

Spark RDD是什么?-华尔子博-奥夏网
Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。本节...
子博兄的头像-华尔子博-奥夏网1年前
03310