传统数据仓库有哪些缺点

发布网友发布时间：2022-04-20 14:15

共1个回答

热心网友时间：2023-06-23 21:03

传统数据库是以数据块来存储数据，简单来说，你的表字段越多，占用的数据空间就越多，那么查询就有可能要跨数据块。在大型系统中一张表有上百个字段，并且表中的数据上亿条也有可能。因此会带来数据库查询的瓶颈。数据库中表的记录数是多少对查询的性能有非常大的影响。而一般的解决办法是分表或分库，用来平衡数据库运算的压力，那么又会带来新的问题，如：分布式事务、全局唯一ID的生成、跨数据库查询等。
如果采用一种基于列存储的模式，由于查询中的选择规则是通过列来定义的，因此整个数据库是自动索引化的。按照列存储每个字段的数据聚集存储，可以动态增加，并且列为空就不存储数据，节省存储空间。每个ian 的数据按照聚集存储，能大大减小读取的数据量，查询时的命中率就会提高，使查找更为直接，无需考虑分库]分表，来提高命中率、减少IO等瓶颈。
Hbase数据库支持数据自动切分存储，并支持高并发读写操作，使得海量数据存储自动具有更强的扩展性。

Hadoop 本身就支持通过JDBC 从数据库中抽取数据。大部分数据库系统有批量导出、导入功能。无论是哪种情况，将整个数据库中的数据经常性地或者以增量的方式导入到Hadoop 中来都是很容易的。由于数据库系统存储的数据减少，数据库系统的软件授权成本也会得到降低。图1是Hadoop 与关系型数据库协同处理计算任务的应用场景。其中，关系型数据库系统用来处理实时数据，从而保证交易过程中的数据一致性。如果要求同一个数据库系统从
大容量数据中生成复杂的分析报表是极其耗费计算资源的，降低了系统的性能和其处理实时数据工作的能力。
Hadoop 被设计用来存储海量数据、按任意方式处理海量数据以及按需向任意系统传递数据。数据可以经常性地从关系型数据库系统导出到Hadoop 中，关系型数据库系统可以经过调整，专门用来处理交互式任务，而复杂的分析工作就可以按离线的方式交由Hadoop 来完成，对实施系统没有任何影响。追问可是我问的是数据仓库而不是数据库

全部栏目

传统数据仓库有哪些缺点