混沌工程在分布式数据库领域的实践

案例来源:PingCAP
会议地点:深圳
分享时间: 2020-07-03 13:30-14:30

周强  |

PingCAP 基础工具团队负责人

周强,PingCAP 基础工具负责人, Chaos Mesh 负责人,专注稳定性和性能测试平台。在混沌工程领域有3年的从业经验,领导开发分布式测试平台 Chaos Mesh。前豌豆荚、阿里巴巴资深 SA/SRE, 长期从事分布式产品的运维等工作

课程概要

案例背景:
分布式计算领域,你所在的集群可能会经常发生不可预知的错误,特别是当他们运行在云上时。为了让分布式数据库在 K8s 上更可靠,我们使用混沌工程来做最后一道保障
成功要点:
我们开发了 Chaos Mesh 分布式混沌测试平台,该平台依托于 k8s 基础设施,通过对 pod/container 进行诸如杀节点、IO 错误和延时注入、时间回退、内核分配内存失败等等来进行混沌测试,能够很大的提升我们分布式数据库的稳健程度。
成果:
我们使用 Chaos Mesh 提前发现了诸多 bug. 同时我们开源了分布式混沌平台 Chaos Mesh,目前已有 1.5k star. Chaos Mesh 是 K8s 上进行混沌测试的一体化解决方案

听众收益

1. 首先会分享在云上的数据库的挑战,观众可以很直观的感受到云上数据库构建的不易
2.介绍混沌工程在云上的使用经验和踩过的坑,观众后续可以通过混沌工程来进行相关实践
3.介绍 k8s 上分布式混沌测试平台的构建建议和社区发展以及一些 case study. 可以帮助大家构建分布式混沌测试平台

周强  |

PingCAP
基础工具团队负责人

周强,PingCAP 基础工具负责人, Chaos Mesh 负责人,专注稳定性和性能测试平台。在混沌工程领域有3年的从业经验,领导开发分布式测试平台 Chaos Mesh。前豌豆荚、阿里巴巴资深 SA/SRE, 长期从事分布式产品的运维等工作

课程概要

案例背景:
分布式计算领域,你所在的集群可能会经常发生不可预知的错误,特别是当他们运行在云上时。为了让分布式数据库在 K8s 上更可靠,我们使用混沌工程来做最后一道保障
成功要点:
我们开发了 Chaos Mesh 分布式混沌测试平台,该平台依托于 k8s 基础设施,通过对 pod/container 进行诸如杀节点、IO 错误和延时注入、时间回退、内核分配内存失败等等来进行混沌测试,能够很大的提升我们分布式数据库的稳健程度。
成果:
我们使用 Chaos Mesh 提前发现了诸多 bug. 同时我们开源了分布式混沌平台 Chaos Mesh,目前已有 1.5k star. Chaos Mesh 是 K8s 上进行混沌测试的一体化解决方案

听众收益

1. 首先会分享在云上的数据库的挑战,观众可以很直观的感受到云上数据库构建的不易
2.介绍混沌工程在云上的使用经验和踩过的坑,观众后续可以通过混沌工程来进行相关实践
3.介绍 k8s 上分布式混沌测试平台的构建建议和社区发展以及一些 case study. 可以帮助大家构建分布式混沌测试平台

CopyRight © 2008-2020 Msup & 高可用架构

京ICP备09001521号