导航:首页 > 前程往事 > 大数据的故事有哪些

大数据的故事有哪些

发布时间：2023-06-11 06:20:07

‘壹’ 什么是大数据，大数据的典型案例有哪些

"大数据"是一个体量特别大，数据类别特别大的数据集，并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量(volumes)?大，指代大型数据集，一般在10TB?规模左右，但在实际应用中，很多企业用户把多个数据集放在一起，已经形成了PB级的数据量；其次是指数据类别(variety)大，数据来自多种数据源，数据种类和格式日渐丰富，已冲破了以前所限定的结构化数据范畴，囊括了半结构化和非结构化数据。接着是数据处理速度（Velocity）快，在数据量非常庞大的情况下，也能够做到数据的实时处理。最后一个特点是指数据真实性（Veracity）高，随着社交数据、企业内容、交易与应用数据等新数据源的兴趣，传统数据源的局限被打破，企业愈发需要有效的信息之力以确保其真实性及安全性。
数据采集：ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成，最后加载到数据仓库或数据集市中，成为联机分析处理、数据挖掘的基础。
数据存取：关系数据库、NOSQL、SQL等。
基础架构：云存储、分布式文件存储等。
数据处理：自然语言处理(NLP，NaturalLanguageProcessing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机"理解"自然语言，所以自然语言处理又叫做自然语言理解(NLU，NaturalLanguage Understanding)，也称为计算语言学(Computational Linguistics。一方面它是语言信息处理的一个分支，另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
统计分析：假设检验、显着性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析（最优尺度分析）、bootstrap技术等等。
数据挖掘：分类（Classification）、估计（Estimation）、预测（Prediction）、相关性分组或关联规则（Affinity grouping or association rules）、聚类（Clustering）、描述和可视化、Description and Visualization）、复杂数据类型挖掘(Text, Web ,图形图像，视频，音频等)
模型预测：预测模型、机器学习、建模仿真。
结果呈现：云计算、标签云、关系图等。
要理解大数据这一概念，首先要从"大"入手，"大"是指数据规模，大数据一般指在10TB(1TB=1024GB)规模以上的数据量。大数据同过去的海量数据有所区别，其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity)，即体量大、多样性、价值密度低、速度快。

第一，数据体量巨大。从TB级别，跃升到PB级别。
第二，数据类型繁多，如前文提到的网络日志、视频、图片、地理位置信息，等等。
第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。
第四，处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器，无一不是数据来源或者承载的方式。

大数据技术是指从各种各样类型的巨量数颂闹据中，快速获得有价值信息的技术。解决大数据问题的核心是大数据技术。目前所说的"大数据"不仅指数据圆樱孝本身的规模，也包括采集数据的工具、平台和数据分析系统。大数据研发目的是发展大数据技术并将其应用到相关领域，通过解决巨量数据处理问题促进其突破性发展。因此橘稿，大数据时代带来的挑战不仅体现在如何处理巨量

阅读全文

与大数据的故事有哪些相关的资料

热点内容

涂磊节目婚姻究竟给女人带来什么发布：2025-03-23 18:28:40 浏览：750

不开心怎么安慰爱情公寓发布：2025-03-23 18:10:37 浏览：7

qq关注什么公众号可以看美女发布：2025-03-23 18:06:32 浏览：610

最近长沙有哪些企事业单位招聘发布：2025-03-23 18:05:09 浏览：251

你写的写是什么的小故事呢发布：2025-03-23 17:54:28 浏览：939

长时间分居对婚姻有什么影响发布：2025-03-23 17:38:16 浏览：569

身体健康应该怎么办发布：2025-03-23 17:22:18 浏览：268

爱情纸包怎么做发布：2025-03-23 17:20:49 浏览：536

民政局负责慈善事业的怎么样发布：2025-03-23 16:59:35 浏览：988

安全舒适需要哪些经济基础发布：2025-03-23 16:58:02 浏览：533

杭州考事业编上哪个网站发布：2025-03-23 16:49:21 浏览：28

最幸福的教育在哪里发布：2025-03-23 16:36:34 浏览：77

高手的爱情观是什么发布：2025-03-23 16:31:00 浏览：922

美丽乡村幸福家园是什么意思发布：2025-03-23 16:05:11 浏览：674

爱你是快乐爱你是幸福还有什么发布：2025-03-23 16:03:40 浏览：240

风水幸福树什么属相不能养发布：2025-03-23 15:54:33 浏览：863

十二星座是怎么看待爱情的发布：2025-03-23 15:53:43 浏览：174

肠胃健康指哪些发布：2025-03-23 15:46:57 浏览：105

你什么时候才能幸福感最强发布：2025-03-23 15:46:51 浏览：815

广西如何为未成年申请健康码发布：2025-03-23 15:46:49 浏览：639