数据集合共23篇 第2页
数据集合(Dataset)‌是指由多个数据项组成的集合,通常以表格形式出现。每一列代表一个特定变量,每一行对应于某一成员的数据。数据集合可以包含数值数据、文本数据、图像数据、视频数据等多种类型的信息,并且可以以各种格式存储,如CSV、JSON、SQL等‌。

Hadoop MapReduce简介

Hadoop MapReduce简介-华尔子博-奥夏网
本节首先简单介绍大数据批处理概念,然后介绍典型的批处理模式 MapReduce,最后对 Map 函数和 Reduce 函数进行描述。 批处理模式 批处理模式是一种最早进行大规模数据处理的模式。批处理主要操...
王麻子的头像-华尔子博-奥夏网王麻子2年前
0475

Spark是什么?Spark和Hadoop的区别

Spark是什么?Spark和Hadoop的区别-华尔子博-奥夏网
Spark 是加州大学伯克利分校 AMP(Algorithms,Machines,People)实验室开发的通用内存并行计算框架。 Spark 在 2013 年 6 月进入 Apache 成为孵化项目,8 个月后成为 Apache 顶级项目。 Spark...
子博兄的头像-华尔子博-奥夏网子博兄2年前
05011

PHP5.5迭代生成器用法实例详解

PHP5.5迭代生成器用法。具体如下: PHP5.5引入了迭代生成器的概念,迭代的概念早就在PHP有了,但是迭代生成器是PHP的一个新特性,这跟python3中的迭代生成器类似,看看PHP5.5的迭代生成器如何定...
王麻子的头像-华尔子博-奥夏网王麻子4个月前
02713

决策树和朴素贝叶斯算法简介

决策树和朴素贝叶斯算法简介-华尔子博-奥夏网
本节主要介绍数据挖掘中常见的分类方法决策树和朴素贝叶斯算法。 决策树算法 决策树(Decision Tree,DT)分类法是一个简单且广泛使用的分类技术。 决策树是一个树状预测模型,它是由结点和有向...
子博兄的头像-华尔子博-奥夏网4个月前
05110

解析Oracle 8i/9i的计划稳定性

由Oralce8.1开始,Oracle增加了一个新的特性就是StoredOutlines,或者称为PlanStability(计划稳定性)。这个特性带来三个好处。首先,你可以优化开销很大的语句的处理。第二,如果有一些语句Orac...
子博兄的头像-华尔子博-奥夏网子博兄1个月前
05115

Redis实现唯一计数的3种方法分享

唯一计数是网站系统中十分常见的一个功能特性,例如网站需要统计每天访问的人数 unique visitor (也就是 UV)。计数问题很常见,但解决起来可能十分复杂:一是需要计数的量可能很大,比如大型...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
0438

MongoDB 语法使用示例代码大全

MongoDB支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类...
子博网的头像-华尔子博-奥夏网子博网5年前
02380

mongodb 数据库操作详解–创建,切换,删除

一,创建,切换,删除数据库 1 2 3 4 5 6 7 [root@localhost zhangy]# mongo MongoDB shell version: 2.4.6 connecting to: tank > use test      //创建 or 切换数据库 switched to db...
南宫世家的头像-华尔子博-奥夏网南宫世家2年前
04815

Java操作MongoDB数据库示例分享

MongoDB是一个文档型数据库,是NOSQL家族中最重要的成员之一,以下代码封装了MongoDB的基本操作。 MongoDBConfig.java 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 ...
王麻子的头像-华尔子博-奥夏网王麻子4个月前
04312

SQLite数据库管理系统,关联式数据库引擎

SQLite数据库管理系统,关联式数据库引擎-华尔子博-奥夏网
SQLite 是一款轻量级的、被设计用于嵌入式系统的关联式数据库管理系统。SQLite 是一个实现自我依赖、纯客户端、零配置且支持事务的数据库引擎。它由D. Richard Hipp首次开发,目前已是世界上最...
南宫世家的头像-华尔子博-奥夏网南宫世家5年前
01730