百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 运营笔记 > 正文

9大亿级数据拆分原则(图文全面总结)

ann3311 2025-03-29 14:56 14 浏览 0 评论

大家好,我是mikechen。

海量数据拆分是大型架构的必备技能,也是大厂重点考察对象,下面我就重点详解9大海量数据拆分原则@mikechen

本文作者:陈睿|mikechen

文章来源:mikechen.cc

第一:首选垂直拆分

在进行数据库架构优化时,垂直拆分通常是首选的拆分策略,尤其是在数据库表数量多、业务复杂...等等情况下。

垂直拆分:是指根据不同的业务功能、或模块,将一个数据库中的多个表按功能划分到不同的数据库实例中。

每个数据库实例只处理特定功能模块的相关数据,从而实现业务模块之间的隔离,避免单一数据库实例承载过多的数据、和访问压力。

比如:淘宝电商平台的数据库,包含:多个模块,如用户、商品、订单、支付...等。

这些模块的数据表具有不同的业务特性,彼此之间的访问频率和数据量也存在差异,因此可以将它们拆分到不同的数据库中。

例如:

  • 用户数据库:存储用户基本信息、登录数据、账户数据等。
  • 交易数据库:存储订单信息、支付记录、交易日志等。
  • 商品数据库:存储商品信息、库存数据、商品分类等。
  • 店铺数据库:存储店铺信息、商家资料、商品发布等。

优点:

通过将数据按功能模块分割到不同的数据库中,可以有效减轻单一数据库实例的压力,提升系统的响应速度和处理能力。

并且,每个业务模块独立管理自己的数据,降低了模块之间的耦合度,使得数据库架构更容易维护和扩展。

缺点:

垂直拆分后的架构会涉及到多个数据库之间的协作,尤其是需要跨库的查询和事务处理,会引入复杂性和性能问题。

以及,在垂直拆分的系统中,如何保证跨数据库事务的一致性是一个挑战。

第二:其次水平拆分

当单一数据库实例的性能达到瓶颈时,“分库分表”,是扩展性能的一种有效手段。

分库

将数据库拆分为多个数据库实例,每个数据库实例存储部分数据。

目的是减少单一数据库的压力,提升性能与可扩展性。

分表

在同一个数据库实例内,将数据表拆分成多个小表。

每个小表存储原数据表的一部分数据,通常是按照某种规则(如ID范围、哈希值等)进行拆分。

假设一个电商系统中的订单表数据量非常大,我们可以按照用户ID进行水平分片:

  • 创建多个数据库: db_order_0, db_order_1, db_order_2, ...
  • 计算分片键: 根据用户ID的哈希值,计算出该订单应该存储在哪个数据库中。

分库分表的核心在于如何将数据合理地分布到不同的库和表中。常见的分片策略有:

  • 按范围分片(Range Sharding):根据某个字段的值范围将数据拆分到不同的分片中。比如按照时间范围、ID范围等。
  • 按哈希分片(Hash Sharding):通过哈希算法将数据均匀分布到各个分片中,确保数据分布较为均匀。
  • 按列表分片(List Sharding):根据某个字段的离散值将数据拆分到不同的分片中。例如,按照地区或产品类型进行分片。
  • 复合分片:结合两种或多种分片策略,进行多维度的分片。

数据库拆分原则总结

  1. 优先考虑缓存:在进行数据库拆分之前,应优先考虑使用缓存(如Redis、Memcached)来减轻数据库的压力,尤其是读操作。
  2. 读写分离:对于读写压力较大的数据库,可以采用读写分离的方案,将读请求和写请求分发到不同的数据库实例上。
  3. 垂直拆分优先:在进行数据库拆分时,应优先考虑垂直拆分。垂直拆分可以根据业务功能或字段属性进行拆分,拆分后的表结构更加清晰,管理也更加方便。
  4. 水平拆分原则
  5. 范围划分: 根据某个字段的范围进行划分,例如订单表可以按订单创建时间进行划分。
  6. 哈希划分: 根据字段的哈希值进行划分,可以保证数据均匀分布。
  7. 混合划分: 结合范围划分和哈希划分,以达到更好的效果。
  8. 数据一致性:在进行数据库拆分后,需要保证数据的一致性,可以使用分布式事务、最终一致性等方式来解决。
  9. 分库分表中间件:对于复杂的分布式数据库系统,可以使用分库分表中间件(如Sharding-JDBC、MyCat)来管理和维护。

本文作者:陈睿|mikechen

文章来源:mikechen.cc

相关推荐

夸克发布全新“AI相机” 形成多模态产品入口和交互体验

来源:环球网【环球网科技综合报道】4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回...

拍照问夸克!“AI相机”上线(ai相机和普通相机有什么区别)

来源:新华网新华网北京4月27日电(记者张漫子)又一国产多模态AI应用上线。夸克AI超级框27日发布“AI相机”,上新“拍照问夸克”功能。基于视觉理解与思考推理的模型能力,“拍照问夸克”支持用户在手...

夸克推出“拍照问夸克” ,提升超级框多模态能力

4月27日,夸克AI超级框上新了“拍照问夸克”功能。基于AI超级框的视觉理解和推理模型能力,“拍照问夸克”能在手机和电脑上进行图片搜索、问答、思考、编辑以及创作。夸克搜索负责人张帆表示:“我们希望通过...

淘宝链接上小红书有什么用(怎么在小红书上挂淘宝链接)

一、小红书与淘宝链接互通的影响小红书和淘宝的合作,允许在小红书平台上直接挂载淘宝链接,这一变化具有多方面的意义。对于消费者而言,购物体验得到了极大的优化。以往在小红书上看到心仪的商品,若想购买,往往需...

如何批量下载淘宝上的商品图片信息

在电商领域中,图片具有决定性作用。优质的商品图片能第一时间抓住消费者眼球,快速传递产品信息,有效提升点击率和购买转化率。它直观展示商品细节、功能及应用场景,弥补了线上购物无法实物感知的短板。高质量的图...

教你快速轻松获取淘宝,天猫等平台商品图片的方法

在这个网络时代电商是我们日常会接触到,像淘宝,天猫,拼多多等一些平台,那么当我们想要下载这些产品的图片做参考的时候,我们都知道主图,详情图非常的多,下载下来是很麻烦的事情,那么现在有了好的解决方法,感...

一键批量下载淘宝图片信息,节省时间

图片在电商中的重要性不言而喻,它就像一家店铺的门面,直接影响着消费者的第一印象。高质量的图片能吸引顾客,提升购买欲望,而低质量的图片则可能导致潜在客户的流失。因此,投资于优质的产品摄影和设计是提升电商...

2025淘宝京东618活动时间表发布:从5月13日开始到6月18日结束,附优惠红包指南!

根据2025年京东和淘宝618最新活动规则,红包领取方式已全面升级,以下是整合多平台信息的一站式领取攻略,覆盖口令、时间、技巧及隐藏福利,建议收藏备用!...

淘宝双十一抢购攻略,如何能快人一步 小编来帮您

淘宝双十一抢购攻略,如何能快人一步小编来帮您

2025年淘宝京东618活动关键时间点,618选购攻略哪天买最便宜最优惠,活动力度最大

各位小伙伴注意啦!2025年京东618年中购物狂欢节即将盛大开启,今年的活动不仅延续了"全网最低价"的硬核承诺,更通过超长周期、多重补贴和创新玩法,为消费者打造一场覆盖全场景...

淘宝闪购奶茶免单再加码:单日70万杯,还有秒杀频道红包

天猫618期间,淘宝闪购加码奶茶免单,宣布天天送奶茶,5月24日全天再送出70万杯。用户进入淘宝App搜索“奶茶免单”,或者进入淘宝闪购频道,点击左下角的“抽免单”就有机会抢到奶茶免单卡。此外,5月2...

网店标品应该怎么去运营?运营的方法有什么?

在平台中,商品也分为标品和非标品,所以对商家来说,我们要做好不同产品间的运营工作。网络店铺的标品应该怎么去运营?运营的方法有什么?今天我们就来给各位商家分享一些方法与技巧。  广大商家们如想要知道商品...

淘宝 2025 年新玩法揭秘——内容种草与互动权重

咱做淘宝的,都知道这平台的规则和算法那是一年一个样,到了2025年,又有不少新变化。今天咱就来唠唠现在淘宝的一些玩法,看看咋在这新规则下把店铺搞起来。...

淘宝直通车如何合理运用大词、精准词、长尾词?

随着淘宝不断的更新,不断的变化,平台对词的人群筛选越来越精准了,优质的词能给我们带来跟多的流量,直通车也不例外,直通车的词如何运用到每一个场景是很重要的,下面我来分享下,我平时用词的一些技巧。直通车用...

直通车投放的关键词怎么选?(直通车标准投放)

直通车关键词的选择是我们直通车推广的重中之重。选择什么样的关键词,就会直接影响我们店铺的访客和最终成交量、以及直通车的推广效果,而它也从另一个侧面反映了客户的需求。投放什么样的关键词最适合直通车投放关...

取消回复欢迎 发表评论: