数据集合共19篇
数据集合(Dataset)‌是指由多个数据项组成的集合,通常以表格形式出现。每一列代表一个特定变量,每一行对应于某一成员的数据。数据集合可以包含数值数据、文本数据、图像数据、视频数据等多种类型的信息,并且可以以各种格式存储,如CSV、JSON、SQL等‌。

什么是大数据?一分钟带你了解大数据及特性

什么是大数据?一分钟带你了解大数据及特性-华尔子博-奥夏网
大数据本身是一个抽象的概念。从一般意义上讲,大数据是指无法在有限时间内用常规软件工具对其进行获取、存储、管理和处理的数据集合。 目前,业界对大数据还没有一个统一的定义,但是大家普遍...
子博兄的头像-华尔子博-奥夏网4年前
12460

Hadoop MapReduce简介

Hadoop MapReduce简介-华尔子博-奥夏网
本节首先简单介绍大数据批处理概念,然后介绍典型的批处理模式 MapReduce,最后对 Map 函数和 Reduce 函数进行描述。 批处理模式 批处理模式是一种最早进行大规模数据处理的模式。批处理主要操...
王麻子的头像-华尔子博-奥夏网王麻子12个月前
0475

Go语言切片详解

Go语言切片详解-华尔子博-奥夏网
切片(slice)是对数组的一个连续片段的引用,所以切片是一个引用类型(因此更类似于 C/C++ 中的数组类型,或者 Python 中的 list 类型),这个片段可以是整个数组,也可以是由起始和终止索引标...
天山雪莲的头像-华尔子博-奥夏网天山雪莲10个月前
04812

Redis的6种数据类型比较及使用要点

Redis 是一种基于内存的数据库,并且提供一定的持久化功能,它是一种键值(key-value)数据库,使用 key 作为索引找到当前缓存的数据,并且返回给程序调用者。 当前的 Redis 支持 6 种数据类型...
子博网的头像-华尔子博-奥夏网子博网4年前
02420

Redis HyperLogLog常用命令总结

Redis HyperLogLog常用命令总结-华尔子博-奥夏网
基数是一种算法。举个例子,一本英文著作由数百万个单词组成,你的内存却不足以存储它们,那么我们先分析一下业务。 英文单词本身是有限的,在这本书的几百万个单词中有许许多多重复单词,扣去...
子博兄的头像-华尔子博-奥夏网子博兄4年前
01980

Redis的超时命令和垃圾回收策略详解

Redis的超时命令和垃圾回收策略详解-华尔子博-奥夏网
正如 Java 虚拟机,它提供了自动 GC(垃圾回收)的功能,来保证 Java 程序使用过且不再使用的 Java 对象及时的从内存中释放掉,从而保证内存空间可用。 当程序编写不当或考虑欠缺的时候(比如读...
子博兄的头像-华尔子博-奥夏网3年前
0940

大数据开发涉及到的关键技术及开发流程有哪些?

大数据开发涉及到的关键技术及开发流程有哪些?-华尔子博-奥夏网
大数据本身是一种现象而不是一种技术。大数据技术是一系列使用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的数据处理技术。 大数据价值的完整体现...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02790

大数据预处理之数据集成需要注意的问题

数据处理常常涉及数据集成操作,即将来自多个数据源的数据,如数据库、数据立方、普通文件等,结合在一起并形成一个统一数据集合,以便为数据处理工作的顺利完成提供完整的数据基础。 在数据集...
王麻子的头像-华尔子博-奥夏网王麻子4年前
03590

大数据预处理之数据消减

大数据预处理之数据消减-华尔子博-奥夏网
我们都知道对大规模数据进行复杂的数据分析通常需要耗费大量的时间,这时就需要我们的数据消减技术了。 数据消减技术的主要目的就是从原有巨大数据集中获得一个精简的数据集,并使这一精简数据...
南宫世家的头像-华尔子博-奥夏网南宫世家4年前
01550

NoSQL非关系型数据库简介及与关系数据库的区别

虽然关系型数据库系统很优秀,但是在大数据时代,面对快速增长的数据规模和日渐复杂的数据模型,关系型数据库系统已无法应对很多数据库处理任务。 NoSQL 凭借易扩展、大数据量和高性能及灵活的...
子博兄的头像-华尔子博-奥夏网子博兄2年前
03914