发布网友 发布时间:2022-04-03 03:43
共2个回答
热心网友 时间:2022-04-03 05:13
数据科学并没有一个的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。但从狭义上来看,我认为数据科学就是解决三个问题:1、原始数据要经过一连串收集、提取、清洗、整理等等的预处理过程,才能形成高质量的数据;2、我们想看看数据“长什么样”,有什么特点和规律;3、按照自己的需要,比如要对数据贴标签分类,或者预测,或者想要从大量复杂的数据中提取有价值的且不易发现的信息,都要对数据建模,得到output。
热心网友 时间:2022-04-03 06:31
大数据的基础是分布式
包括分布式存储和分布式计算
从技术的角度,这两者都是很困难的
分布式存储最难的就是一致性的问题,分布式计算,最难的是效率问题
虽然现在已经有很多成熟的产品,但,这些产品都是有特定的应用场景,很难进行通用,当然,趋势是越来越多产品走向通用化,