数据集合共22篇 第2页
数据集合(Dataset)‌是指由多个数据项组成的集合,通常以表格形式出现。每一列代表一个特定变量,每一行对应于某一成员的数据。数据集合可以包含数值数据、文本数据、图像数据、视频数据等多种类型的信息,并且可以以各种格式存储,如CSV、JSON、SQL等‌。

Redis的超时命令和垃圾回收策略详解

Redis的超时命令和垃圾回收策略详解-华尔子博-奥夏网
正如 Java 虚拟机,它提供了自动 GC(垃圾回收)的功能,来保证 Java 程序使用过且不再使用的 Java 对象及时的从内存中释放掉,从而保证内存空间可用。 当程序编写不当或考虑欠缺的时候(比如读...
子博兄的头像-华尔子博-奥夏网3年前
0940

决策树和朴素贝叶斯算法简介

决策树和朴素贝叶斯算法简介-华尔子博-奥夏网
本节主要介绍数据挖掘中常见的分类方法决策树和朴素贝叶斯算法。 决策树算法 决策树(Decision Tree,DT)分类法是一个简单且广泛使用的分类技术。 决策树是一个树状预测模型,它是由结点和有向...
子博兄的头像-华尔子博-奥夏网38天前
04910

Go语言切片详解

Go语言切片详解-华尔子博-奥夏网
切片(slice)是对数组的一个连续片段的引用,所以切片是一个引用类型(因此更类似于 C/C++ 中的数组类型,或者 Python 中的 list 类型),这个片段可以是整个数组,也可以是由起始和终止索引标...
天山雪莲的头像-华尔子博-奥夏网天山雪莲1年前
04812

mongodb 数据库操作详解–创建,切换,删除

一,创建,切换,删除数据库 1 2 3 4 5 6 7 [root@localhost zhangy]# mongo MongoDB shell version: 2.4.6 connecting to: tank > use test      //创建 or 切换数据库 switched to db...
南宫世家的头像-华尔子博-奥夏网南宫世家1年前
04815

Hadoop MapReduce简介

Hadoop MapReduce简介-华尔子博-奥夏网
本节首先简单介绍大数据批处理概念,然后介绍典型的批处理模式 MapReduce,最后对 Map 函数和 Reduce 函数进行描述。 批处理模式 批处理模式是一种最早进行大规模数据处理的模式。批处理主要操...
王麻子的头像-华尔子博-奥夏网王麻子1年前
0475

mysql数据插入效率比较

mysql数据插入效率比较-华尔子博-奥夏网
做数据插入时,发现之前上班做哪些办公系统压根就没考虑过数据库性能这些,因为涉及的数据量小,时间和效率看不出来,可当数据量很大了,大到了每秒需要10000次插入时,这时就不得不考虑你的sql...
南宫世家的头像-华尔子博-奥夏网南宫世家1年前
04512

NoSQL非关系型数据库简介及与关系数据库的区别

虽然关系型数据库系统很优秀,但是在大数据时代,面对快速增长的数据规模和日渐复杂的数据模型,关系型数据库系统已无法应对很多数据库处理任务。 NoSQL 凭借易扩展、大数据量和高性能及灵活的...
子博兄的头像-华尔子博-奥夏网子博兄2年前
03914

Redis实现唯一计数的3种方法分享

唯一计数是网站系统中十分常见的一个功能特性,例如网站需要统计每天访问的人数 unique visitor (也就是 UV)。计数问题很常见,但解决起来可能十分复杂:一是需要计数的量可能很大,比如大型...
天山雪莲的头像-华尔子博-奥夏网天山雪莲3年前
0398

Java操作MongoDB数据库示例分享

MongoDB是一个文档型数据库,是NOSQL家族中最重要的成员之一,以下代码封装了MongoDB的基本操作。 MongoDBConfig.java 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 ...
王麻子的头像-华尔子博-奥夏网王麻子21天前
03912

Spark RDD是什么?

Spark RDD是什么?-华尔子博-奥夏网
Spark 的核心是建立在统一的抽象弹性分布式数据集(Resiliennt Distributed Datasets,RDD)之上的,这使得 Spark 的各个组件可以无缝地进行集成,能够在同一个应用程序中完成大数据处理。本节...
子博兄的头像-华尔子博-奥夏网1年前
03310