排序
Spark RDD是什么?
Spark是什么?Spark和Hadoop的区别
Hadoop MapReduce简介
大数据处理技术有哪些?大数据处理系统核心技术
大数据技术的基本概念进行简单介绍,包括分布式计算、服务器集群和 Google 的 3 个大数据技术。 分布式计算 对于如何处理大数据,计算机科学界有两大方向。 第一个方向是集中式计算,就是通过不...
数据在内存中的存储机制(二进制形式存储)
计算机要处理的信息是多种多样的,如数字、文字、符号、图形、音频、视频等,这些信息在人们的眼里是不同的。但对于计算机来说,它们在内存中都是一样的,都是以二进制的形式来表示。 要想学习...
大数据开发涉及到的关键技术及开发流程有哪些?
大数据处理的基本流程:数据抽取与集成+数据分析+数据解释
大数据的数据来源广泛,应用需求和数据类型都不尽相同,但是最基本的处理流程是一致的。 整个大数据的处理流程可以定义为,在合适工具的辅助下,对广泛异构的数据源进行抽取和集成,将结果按照...