大数据算法大家已经不陌生了,到研究生阶段听到最多的就是什么是大数据、大数据的特点,在这个大数据的背景下的算法有什么特点,是不是就是把spark、flink跑起来就叫大数据了,其实并不是这样的。
所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、
管理、处理、并整理成为人类所能解读的信息
不用随机分析法(抽样调查)这样的捷径,而采用所有数据的方法
“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力
和流程优化能力的海量、高增长率和多样化的信息资产。


在给定的资源约束下,以大数据为输入,在给定时间约束内可以生成满足给定约束
结果的算法。
(1)访问全部数据时间过长
读取部分数据
(2)数据难于放入内存计算
(3)单个计算机难以保存全部数据,计算需要整体数据
并行处理
(4)计算机计算能力不足或知识不足
人来帮忙
