😊杨鼎睿的笔记

Search

Search IconIcon to open search

2022-10-12

Last updated Dec 15, 2022 Edit Source

今天研究了一下 etcd 的性能瓶颈etcd 的 event 事件太多,影响 etcd 性能,有很多大公司有过分离存储 event 的实践。 通过参数--etcd-servers-overrides stringSlice可以将event存储到单独的集群。

Etcd is used for two distinct cluster purposes - cluster state and event processing. These have different i/o characteristics. It is important to scalability testing efforts that the iops provided by the servers to etcd be consistent and protected. These leads to two requirements:

  • Split etcd: Two different etcd clusters for events and cluster state (note: this is currently the GKE production default as well).
  • Dedicated separate IOPS for the etcd clusters on each control plane node. On a bare metal install this could look like a dedicated SSD. This requires a more specific configuration per provider. Config table below

今天翻以前的语雀笔记,找到了之前想了解的开源项目,他们都有巨大的改变或者进步。比如 VictoriaMetrics已经成为大家都愿意无缝替代 Prometheus 的新软件了。另外是 Code Server 领域中的 sail,之前试用的时候还有 chrome 插件,用起来由于天朝网络问题并不好用。现在也进步成为新项目了。这个项目停止开发了,然而 Coder 项目从中新生,结合 Terraform 描述基础架构的能力, Coder 不仅可以构建一致共享的开发环境,还能通过 code 声明式利用云上和自己的基础架构设施(比如在 Google Cloud 申请一个 ec2 用于开发环境的运行)。当然,基础的能力应该还是 Code Server 提供的。 Coder 首页一个问题我很喜欢,正好问到了我的关注点:当我可以用 Terraform 来配置开发环境的时候为什么还需要 Coder?:Coder 支持开/关调度以降低成本,让您控制您的团队可以配置哪些基础设施值(例如,我只想让我的团队控制 CPU),将您的云开发环境网络连接到您的本地机器等等。 这个笔记是 #DevelopmentEnvironment 主题下的,当时的想法其实是构建学习环境,降低新人培养成本。

slipbox

Terraform 配置本地离线源