大数据共64篇 第6页
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据预处理架构和方法简介

大数据预处理架构和方法简介-华尔子博-奥夏网
数据预处理主要包括数据清洗(Data Cleaning)、数据集成(Data Integration)、数据转换(Data Transformation)和数据消减(Data Reduction)。本节在介绍大数据预处理基本概念的基础上对数据...
子博网的头像-华尔子博-奥夏网子博网4年前
01850

Scrapy是什么,Scrapy网络爬虫简介

Scrapy是什么,Scrapy网络爬虫简介-华尔子博-奥夏网
Scrapy 是一个为了爬取网站数据、提取结构性数据而编写的应用框架,可以应用在包括数据挖掘、信息处理或存储历史数据等一系列的程序中。 1. Scrapy 架构 Scrapy 的整体架构由 Scrapy 引擎(Scra...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02130

通过网络爬虫采集大数据的方法

通过网络爬虫采集大数据的方法-华尔子博-奥夏网
网络数据采集是指通过网络爬虫或网站公开 API 等方式从网站上获取数据信息。该方法可以将非结构化数据从网页中抽取出来,将其存储为统一的本地数据文件,并以结构化的方式存储。它支持图片、音...
子博网的头像-华尔子博-奥夏网子博网4年前
01790

通过系统日志采集大数据的实现方法

通过系统日志采集大数据的实现方法-华尔子博-奥夏网
许多公司的平台每天都会产生大量的日志,并且一般为流式数据,如搜索引擎的 pv 和查询等。处理这些日志需要特定的日志系统,这些系统需要具有以下特征。 构建应用系统和分析系统的桥梁,并将它...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
02220

大数据采集方法,大数据采集技术概述

大数据采集方法,大数据采集技术概述-华尔子博-奥夏网
大数据采集是指从传感器和智能设备、企业在线系统、企业离线系统、社交网络和互联网平台等获取数据的过程。 数据包括 RFID 数据、传感器数据、用户行为数据、社交网络交互数据及移动互联网数据...
南宫世家的头像-华尔子博-奥夏网南宫世家4年前
02770

大数据开发涉及到的关键技术及开发流程有哪些?

大数据开发涉及到的关键技术及开发流程有哪些?-华尔子博-奥夏网
大数据本身是一种现象而不是一种技术。大数据技术是一系列使用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的数据处理技术。 大数据价值的完整体现...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02790

大数据处理的基本流程:数据抽取与集成+数据分析+数据解释

大数据的数据来源广泛,应用需求和数据类型都不尽相同,但是最基本的处理流程是一致的。 整个大数据的处理流程可以定义为,在合适工具的辅助下,对广泛异构的数据源进行抽取和集成,将结果按照...
子博兄的头像-华尔子博-奥夏网4年前
02030

Google的三种大数据处理系统GFS、MapReduce和BigTable解析

Google的三种大数据处理系统GFS、MapReduce和BigTable解析-华尔子博-奥夏网
Google 在搜索引擎上所获得的巨大成功,很大程度上是由于采用了先进的大数据管理和处理技术。Google 的搜索引擎是针对搜索引擎所面临的日益膨胀的海量数据存储问题,以及在此之上的海量数据处理...
子博兄的头像-华尔子博-奥夏网4年前
12630

Hadoop大数据处理框架简介,什么是Hadoop 生态圈?

Hadoop大数据处理框架简介,什么是Hadoop 生态圈?-华尔子博-奥夏网
Hadoop 是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由 Yahoo 的工程师 Doug Cutting 和 Mike Cafarella 在 2005 年合作开发。后来,Hadoop 被贡献给了 Apache 基金会,...
天山雪莲的头像-华尔子博-奥夏网天山雪莲4年前
02050

大数据时代的10个重大变化,大数据带来的影响

大数据时代的10个重大变化,大数据带来的影响-华尔子博-奥夏网
大数据时代的到来改变了人们的生活方式、思维模式和研究范式,我们可以总结出 10 个重大变化,如图 1 所示。 图 1  大数据时代的 10 个重大变化 对研究范式的新认识:从第三范式到第四范式 20...
子博兄的头像-华尔子博-奥夏网子博兄4年前
02480