大数据共50篇
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

HDFS基本原理和设计理念,HDFS 的局限性有哪些

HDFS基本原理和设计理念,HDFS 的局限性有哪些-华尔子博-奥夏网
本节将对 HDFS 的基本原理进行讲解。 文件系统的问题 文件系统是操作系统提供的磁盘空间管理服务,该服务只需要用户指定文件的存储位置及文件读取路径,而不需要用户了解文件在磁盘上是如何存放...
王麻子的头像-华尔子博-奥夏网王麻子3年前
05150

大数据预处理之数据集成需要注意的问题

数据处理常常涉及数据集成操作,即将来自多个数据源的数据,如数据库、数据立方、普通文件等,结合在一起并形成一个统一数据集合,以便为数据处理工作的顺利完成提供完整的数据基础。 在数据集...
王麻子的头像-华尔子博-奥夏网王麻子4年前
03590

大数据开发涉及到的关键技术及开发流程有哪些?

大数据开发涉及到的关键技术及开发流程有哪些?-华尔子博-奥夏网
大数据本身是一种现象而不是一种技术。大数据技术是一系列使用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的数据处理技术。 大数据价值的完整体现...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02770

大数据采集方法,大数据采集技术概述

大数据采集方法,大数据采集技术概述-华尔子博-奥夏网
大数据采集是指从传感器和智能设备、企业在线系统、企业离线系统、社交网络和互联网平台等获取数据的过程。 数据包括 RFID 数据、传感器数据、用户行为数据、社交网络交互数据及移动互联网数据...
南宫世家的头像-华尔子博-奥夏网南宫世家4年前
02750

Hadoop HDFS分布式文件系统简介及特性

Hadoop HDFS分布式文件系统简介及特性-华尔子博-奥夏网
在大数据时代,需要处理分析的数据集的大小已经远远超过了单台计算机的存储能力,因此需要将数据集进行分区并存储到若干台独立的计算机中。但是,分区存储的数据不方便管理和维护,迫切需要一种...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
02530

Google的三种大数据处理系统GFS、MapReduce和BigTable解析

Google的三种大数据处理系统GFS、MapReduce和BigTable解析-华尔子博-奥夏网
Google 在搜索引擎上所获得的巨大成功,很大程度上是由于采用了先进的大数据管理和处理技术。Google 的搜索引擎是针对搜索引擎所面临的日益膨胀的海量数据存储问题,以及在此之上的海量数据处理...
子博兄的头像-华尔子博-奥夏网4年前
12490

什么是大数据?一分钟带你了解大数据及特性

什么是大数据?一分钟带你了解大数据及特性-华尔子博-奥夏网
大数据本身是一个抽象的概念。从一般意义上讲,大数据是指无法在有限时间内用常规软件工具对其进行获取、存储、管理和处理的数据集合。 目前,业界对大数据还没有一个统一的定义,但是大家普遍...
子博兄的头像-华尔子博-奥夏网4年前
12440

大数据时代的10个重大变化,大数据带来的影响

大数据时代的10个重大变化,大数据带来的影响-华尔子博-奥夏网
大数据时代的到来改变了人们的生活方式、思维模式和研究范式,我们可以总结出 10 个重大变化,如图 1 所示。 图 1  大数据时代的 10 个重大变化 对研究范式的新认识:从第三范式到第四范式 20...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02420

通过系统日志采集大数据的实现方法

通过系统日志采集大数据的实现方法-华尔子博-奥夏网
许多公司的平台每天都会产生大量的日志,并且一般为流式数据,如搜索引擎的 pv 和查询等。处理这些日志需要特定的日志系统,这些系统需要具有以下特征。 构建应用系统和分析系统的桥梁,并将它...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
02220

什么是大数据时代?大数据能给我们带来什么?

什么是大数据时代?大数据能给我们带来什么?-华尔子博-奥夏网
近年来,信息技术迅猛发展,尤其是以互联网、物联网、信息获取、社交网络等为代表的技术日新月异,促使手机、平板电脑、pc 等各式各样的信息传感器随处可见,虚拟网络快速发展,现实世界快速虚...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02190