版本：v1.4

YurtHub Performance Test

背景

YurtHub是OpenYurt的重要组件，它为APIServer提供了一层额外的抽象，接管了边缘到云的请求流量，支撑了OpenYurt的边缘自治，流量闭环等重要能力。另一方面，大量边缘云原生场景面临着边缘节点资源受限的问题，YurtHub作为边缘侧的重要组件，它在各种环境下的性能表现对OpenYurt集群都有着很大影响。因此我们需要对YurtHub组件的性能有更深入的了解。

测试环境

Kubernetes版本

Major:"1", Minor:"22", GitVersion:"v1.22.12", GitCommit:"b058e1760c79f46a834ba59bd7a3486ecf28237d", GitTreeState:"clean", BuildDate:"2022-07-13T14:53:39Z", GoVersion:"go1.16.15", Compiler:"gc", Platform:"linux/amd64"

OpenYurt 版本

GitVersion:"v0.7.0", GitCommit:"d331a42", BuildDate:"2022-08-29T13:33:43Z", GoVersion:"go1.17.12", Compiler:"gc", Platform:"linux/amd64"

节点配置

Master 节点与Node节点使用不同配置的ECS，集群中包含1个master节点和其他100个node节点。100个node节点均通过yurtadm以edge模式接入。

操作系统

	Master	Node
LSB Version	:core-4.1-amd64:core-4.1-noarch	:core-4.1-amd64:core-4.1-noarch
Distributor ID	CentOS	CentOS
Description	CentOS Linux release 7.9.2009 (Core)	CentOS Linux release 7.9.2009 (Core)
Release	7.9.2009	7.9.2009
Codename	Core	Core

CPU

	Master	Node
Architecture	x86_64	x86_64
CPU op-mode (s)	32-bit, 64-bit	32-bit, 64-bit
Byte Order	Little Endian	Little Endian
CPU (s)	8	2
On-line CPU(s) list	0-7	0,1
Thread(s) per core	2	2
Core(s) per socket	4	4
Socket(s)	1	1
NUMA node(s)	1	1
Vendor ID	GenuineIntel	GenuineIntel
CPU family	6	6
Model	106	106
Model name	Intel(R) Xeon(R) Platinum 8369B CPU @ 2.70GHz	Intel(R) Xeon(R) Platinum 8369B CPU @ 2.70GHz
Stepping	6	6
CPU MHz	2699.998	2699.998

Memory

	Master	Node
Total memory	32245896 K	7862304 K

Disk

	Master	Node
Total Size	40GiB (3800 IOPS)	40GiB (3800 IOPS)
Type	ESSD云盘 PL0	ESSD云盘 PL1

测试方法

通过Promethus收集OpenYurt集群中边缘侧yurthub的三类指标

资源占用：yurthub容器 CPU/Mem 使用情况
数据流量：yurthub 转发请求流量
请求延迟：yurthub 转发请求的延迟

整体的测试架构如下图所示

测试结果

15:00-19:00 陆续接入100节点 19:30 创建2000 Pod， 1000 Service（以Daemonset形式部署，每个节点部署20个Pod，单个Service包含50个endpoints） 19:35 所有资源创建完成 21:06 删除所有资源

Traffic

上图是100个边缘节点的Yurthub在整个过程中的请求流量表现，可以观察到一下特征：

流量数据在正常情况下有一个5min周期性的波动，峰值大概在15-20 KB/s
workload部署过程中流量有一个激增，峰值在350 KB/s
workload卸载时流量也有一个激增，而且持续时间更短，峰值更高大概在780 KB/s

针对流量来源进一步探究，我们选取一台机器的流量情况分析上图时workload部署时，该机器的流量情况，可以看到流量突变时从上到下的使用排名：

endpointslices, watch, 240 KB/s
endpoints, watch, 50 KB/s
services, watch, 25 KB/s
nodes, watch, 24 KB/s
pod, watch, 3 KB/s

该机器的峰值流量大约在320 KB/s，绝大多数来源于service相关的watch请求（endpointslice, endpoint, service），这可能也与service中endpoint较多（单个service50个endpoints）有关系。另外，正常情况下周期5min的流量变化也是由nodes资源的watch请求引起的。

上图是该机器在卸载时的流量表现，总的峰值流量大概在780k左右，按资源与动作划分，从大到小流量使用情况如下：

endpointslices, watch, 540 KB/s
service, watch, 140 KB/s
endpoints, watch, 100 KB/s

Latency

在latency采集时，我们区分了两类latency：

full_latency：记录从请求到达yurthub到请求从yurthub离开时总时长
apiserver_latency：记录请求从yurthub转发到apiserver的时长

实际测试过程中发现这两类latency几乎没有区别，所以以full_latency为准

下图中我们根据verb查看每类请求中耗时最多的latency情况：

Delete

Create

List

Update

Patch

可以看到最耗时的请求主要是node的create，get， list请求，以及service的list请求。

Memory

在初始状态下，workload部署前，yurthub的内存占用集中在35-40MB，有两台机器因为Prometheus的监控套件部署在上面，所以使用内存较多。另外最下方那条曲线是master节点上以cloud模式部署的yurthub。在19:30每个节点部署了20Pod后，节点内存有约 2-5MB 的小幅提升，并且一直维持在这个水平，当workload删除后，内存占用先是10MB的明显下降，接着又回升到workload删除前的水平。

CPU

CPU的单核占用率情况与流量使用情况类似，正常状态下呈周期性的波动但都维持在一个较低的水平（约0.02%），两个波峰分别出现在workload部署（22%）以及workload删除时（25%）。

结论及分析

无workload的压力下 yurthub 约占用30-40MB的内存以及极少的（< 0.02）的CPU资源。
- CPU资源的使用主要是用于处理yurthub收到的请求，在资源创建时单核占用率的峰值可以达到25%左右。
- 内存资源水平与节点上的workload分布情况有关，对着资源的创建和删除有5MB左右的变化。但是在所有测试workload都删除后, yurthub的内存占用先是大幅下降接着又回到了删除前的水平，具体原因有待进一步的分析。
Yurthub的流量使用情况可以看出，在资源创建和销毁过程中，会在短时间会出现大量的请求（分别达到350 KB/s 和 780 KB/s），其中大部分流量都来源于Service相关资源(endpointslice, endpoint, service) 的watch请求。
Yurthub的请求处理转发过程相比于请求本身的延迟可以忽略不计，请求延迟主要和请求资源的大小有关。

背景​

测试环境​

Kubernetes版本​

OpenYurt 版本​

节点配置​

操作系统​

CPU​

Memory​

Disk​

测试方法​

测试结果​

Traffic​

Latency​

Memory​

CPU​

结论及分析​

背景

测试环境

Kubernetes版本

OpenYurt 版本

节点配置

操作系统

CPU

Memory

Disk

测试方法

测试结果

Traffic

Latency

Memory

CPU

结论及分析