数据体系架构_数据库架构

编程小6 (2) 2024-06-18 21:23

Hi，大家好，我是编程小6，很荣幸遇见你，我把这些年在开发过程中遇到的问题或想法写出来，今天说一说
数据体系架构_数据库架构,希望能够帮助你!!!。

传统系统的问题

“我们正在从IT时代走向DT时代(数据时代)。IT和DT之间，不仅仅是技术的变革，更是思想意识的变革，IT主要是为自我服务，用来更好地自我控制和管理，DT则是激活生产力，让别人活得比你好”——阿里巴巴董事局主席马云。

数据量从M的级别到G的级别到现在T的级、P的级别。数据量的变化数据管理系统（DBMS）和数仓系统（DW）也在悄然的变化着。

传统应用的数据系统架构设计时，应用直接访问数据库系统。当用户访问量增加时，数据库无法支撑日益增长的用户请求的负载时，从而导致数据库服务器无法及时响应用户请求，出现超时的错误。出现这种情况以后，在系统架构上就采用图（A）的架构，在数据库和应用中间过一层缓冲隔离，缓解数据库的读写压力。然而，当用户访问量持续增加时，就需要考虑读写分离技术（Master－Slave）架构如图（B），分库分表技术。现在，架构变得越来越复杂了，增加队列、分区、复制等处理逻辑。应用程序需要了解数据库的schema，才能访问到正确的数据。

图（A）

图（B）

Lambda架构的背景

大数据处理技术需要解决这种可伸缩性与复杂性。首先要认识到这种分布式的本质，要很好地处理分区与复制，不会导致错误分区引起查询失败，而是要将这些逻辑内化到数据库中。当需要扩展系统时，可以非常方便地增加节点，系统也能够针对新节点进行rebalance。其次是要让数据成为不可变的。原始数据永远都不能被修改，这样即使犯了错误，写了错误数据，原来好的数据并不会受到破坏。

Storm的作者NathanMarz提出的一个实时大数据处理框架（Lambda架构）就满足以上两点。Marz在Twitter工作期间开发了著名的实时大数据处理框架Storm，Lambda架构是其根据多年进行分布式大数据系统的经验总结提炼而成。

Lambda架构的目标是设计出一个能满足实时大数据系统关键特性的架构，包括有：高容错、低延时和可扩展等。Lambda架构整合离线计算和实时计算，融合不可变性（Immunability），读写分离和复杂性隔离等一系列架构原则，可集成Hadoop，Kafka，Storm，Spark，Hbase等各类大数据组件。

大数据系统的关键特性

Marz介绍BigData System许具备的属性：

a、Robustandfault-tolerant（容错性和鲁棒性）：对大规模分布式系统来说，机器是不可靠的，可能会当机，但是系统需要是健壮、行为正确的，即使是遇到机器错误。除了机器错误，人更可能会犯错误。在软件开发中难免会有一些Bug，系统必须对有Bug的程序写入的错误数据有足够的适应能力，所以比机器容错性更加重要的容错性是人为操作容错性。对于大规模的分布式系统来说，人和机器的错误每天都可能会发生，如何应对人和机器的错误，让系统能够从错误中快速恢复尤其重要。

b、Lowlatency reads and updates（低延时）：很多应用对于读和写操作的延时要求非常高，要求对更新和查询的响应是低延时的。

c、Scalable（横向扩容）：当数据量/负载增大时，可扩展性的系统通过增加更多的机器资源来维持性能。也就是常说的系统需要线性可扩展，通常采用scale out（通过增加机器的个数）而不是scale up（通过增强机器的性能）。

d、General（通用性）：系统需要能够适应广泛的应用，包括金融领域、社交网络、电子商务数据分析等。

e、Extensible（可扩展）：需要增加新功能、新特性时，可扩展的系统能以最小的开发代价来增加新功能。

f、Allows ad hoc queries（方便查询）：数据中蕴含有价值，需要能够方便、快速的查询出所需要的数据。

d、Minimal maintenance（易于维护）：系统要想做到易于维护，其关键是控制其复杂性，越是复杂的系统越容易出错、越难维护。

h、Debuggable（易调试）：当出问题时，系统需要有足够的信息来调试错误，找到问题的根源。其关键是能够追根溯源到每个数据生成点。

数据系统的本质

Marz认为：数据系统通过查询过去的（部分、全部）数据去回答问题。如：他是一个什么样的人？他有多少朋友？这个账号是否收支平衡？。因此，DataSystem的通用定义为Query＝Function（alldata）。对通用的表达式进行分解得到：数据系统

今天的分享到此就结束了，感谢您的阅读，如果确实帮到您，您可以动动手指转发给其他人。

已是最后文章

已是最新文章

发表回复取消回复

请先登录账户再评论哦

数据体系架构_数据库架构

传统系统的问题

Lambda架构的背景

大数据系统的关键特性

数据系统的本质

发表回复取消回复

相关推荐

电路图常用符号大全图解_学看电路图入门

云原生的优势_云原生的优势

openssl des加密_ssl加密解密流程

linux怎么查看操作系统版本号_Linux查看版本号命令

最新文章

电路图常用符号大全图解_学看电路图入门

云原生的优势_云原生的优势

openssl des加密_ssl加密解密流程

linux怎么查看操作系统版本号_Linux查看版本号命令

数据体系架构_数据库架构

电脑性能测试工具软件_benchmark性能测试工具

代码阅读器app_source insight怎么编译

百货店布局的图片大全_超市布局规划图

系统详细设计说明书模板_管理信息系统课程设计

activiti7 教程_activiti哪个版本比较好

数据体系架构_数据库架构

传统系统的问题

Lambda架构的背景

大数据系统的关键特性

数据系统的本质

发表回复 取消回复

相关推荐

电路图常用符号大全图解_学看电路图入门

云原生的优势_云原生的优势

openssl des加密_ssl加密解密流程

linux怎么查看操作系统版本号_Linux查看版本号命令

最新文章

电路图常用符号大全图解_学看电路图入门

云原生的优势_云原生的优势

openssl des加密_ssl加密解密流程

linux怎么查看操作系统版本号_Linux查看版本号命令

数据体系架构_数据库架构

电脑性能测试工具软件_benchmark性能测试工具

代码阅读器app_source insight怎么编译

百货店布局的图片大全_超市布局规划图

系统详细设计说明书模板_管理信息系统课程设计

activiti7 教程_activiti哪个版本比较好

发表回复取消回复