宁夏自治区建设厅官方网站,济南网站seo公司,移动开发网,网页界面设计的内容五大设计要素I/O虚拟化 全虚拟化#xff1a;宿主机截获客户机对I/O设备的访问请求#xff0c;然后通过软件模拟真实的硬件。这种方式对客户机而言非常透明#xff0c;无需考虑底层硬件的情况#xff0c;不需要修改操作系统。
半虚拟化#xff1a;通过前端驱动/后端驱动模拟实现I/O虚拟…I/O虚拟化 全虚拟化宿主机截获客户机对I/O设备的访问请求然后通过软件模拟真实的硬件。这种方式对客户机而言非常透明无需考虑底层硬件的情况不需要修改操作系统。
半虚拟化通过前端驱动/后端驱动模拟实现I/O虚拟化。客户机中的驱动程序为前端宿主机提供的与客户机通信的驱动程序为后端。前端驱动将客户机的请求通过与宿主机间的特殊通信机制发送给后端驱动后端驱动在处理完请求后再发送给物理驱动。
IO透传直接把物理设备分配给虚拟机使用这种方式需要硬件平台具备I/O透传技术例如Intel VT-d技术。它能获得近乎本地的性能并且CPU开销不高。
DPDK支持半虚拟化的前端virtio和后端vhost并且对前后端都有性能加速的设计。而对于I/O透传DPDK可以直接在客户机里使用就像在宿主机里直接接管物理设备进行操作。
I/O透传
I/O透传技术如SR-IOV通过直接将硬件设备的访问权限分配给虚拟机VM提供高性能的网络和存储操作。这主要是利用Intel® VT-d的支持减少虚拟机操作时对宿主机的干预从而避免性能瓶颈。 Intel® VT-d该技术允许虚拟机直接访问物理设备减少了传统虚拟化中常见的“VM-Exit”虚拟机退出到宿主机的开销 SR-IOV单根I/O虚拟化允许一个物理网卡通过虚拟化生成多个虚拟网卡。这些虚拟网卡可以分配给不同的虚拟机使每个虚拟机能获得几乎独立的网络设备访问从而提升性能。 VT-d主要给宿主机软件提供了以下的功能 I/O设备的分配可以灵活地把I/O设备分配给虚拟机把对虚拟机的保护和隔离的特性扩展到I/O的操作上来。 DMA重映射可以支持来自设备DMA的地址翻译转换。 中断重映射可以支持来自设备或者外部中断控制器的中断的隔离和路由到对应的虚拟机。 可靠性记录并报告DMA和中断的错误给系统软件否则的话可能会破坏内存或影响虚拟机的隔离。
SR-IOV SR-IOV技术是由PCI-SIG制定的一套硬件虚拟化规范全称是Single Root IO Virtualization单根IO虚拟化。SR-IOV规范主要用于网卡NIC、磁盘阵列控制器RAID controller和光纤通道主机总线适配器Fibre Channel Host Bus AdapterFC HBA使数据中心达到更高的效率。SR-IOV架构中一个I/O设备支持最多256个虚拟功能同时将每个功能的硬件成本降至最低。SR-IOV引入了两个功能类型
PFPhysical Function物理功能这是支持SR-IOV扩展功能的PCIe功能主要用于配置和管理SR-IOV拥有所有的PCIe设备资源。PF在系统中不能被动态地创建和销毁PCI Hotplug除外。VFVirtual Function虚拟功能“精简”的PCIe功能包括数据迁移必需的资源以及经过谨慎精简的配置资源集可以通过PF创建和销毁。 Virtio网络设备
在客户机操作系统中实现的前端驱动程序一般直接叫Virtio在宿主机实现的后端驱动程序目前常用的叫Vhost。
Linux内核驱动设计
Virtio网络设备Linux内核驱动主要包括三个层次底层PCI-e设备层中间Virtio虚拟队列层上层网络设备层。 DPDK用户空间virtio设备的优化
DPDK用户空间驱动和Linux内核驱动相比主要不同点在于DPDK只暂时实现了Virtio网卡设备所以整个构架和优化上面可以暂时只考虑网卡设备的应用场景。
关于单帧mbuf的网络包收发优化将描述符表和可用环表用于管理数据包的映射关系固定。这意味着每个环表项用于描述网络数据包的内存位置和描述符表中的位置是一一对应的。在接收数据时每个可用环表项固定指向一个描述符表的位置发送数据时描述符表的映射被优化以加速数据处理。固定映射减少了不同CPU核之间的缓存迁移开销也节省了描述符表的分配和释放操作。
Indirect特性在网络包发送中的支持发送网络包时通常需要两个描述符来管理一个数据包一个描述符用于指向数据包本身另一个用于管理数据包的头部信息。支持间接描述符的特性允许将这两个描述符的需求简化为一个描述符。这个描述符指向一个额外分配的内存区域间接描述符表这个表可以包含多个描述符的信息。通过这种方式不论是发送单个小数据包还是巨型帧大数据包只需要一个描述符就能管理。这减少了描述符的开销和管理复杂性提高了发送效率。 Vhost
Virtio-net 的后端驱动经历了以下演进过程 Virtio-net 后端最初的虚拟网络设备驱动直接在虚拟化管理程序中实现用于处理虚拟机中的网络数据。 内核态 Vhost-net为了提高性能引入了 Vhost-net 框架将数据路径的一部分移到内核空间减少了用户态和内核态之间的开销。 用户态 Vhost-user进一步提高性能和灵活性通过将 Vhost 的实现移到用户态使虚拟化管理程序可以更灵活地管理网络数据同时保持高效的性能。
Vhost 是一个框架它最初在内核态实现了高效的虚拟设备操作后续的 Vhost-user 将这个框架扩展到了用户态以支持更灵活的虚拟化场景。
virtio-net
virtio-net后端驱动的最基本要素是虚拟队列机制、消息通知机制和中断机制。虚拟队列机制连接着客户机和宿主机的数据交互。消息通知机制主要用于从客户机到宿主机的消息通知。中断机制主要用于从宿主机到客户机的中断请求和处理。 Tap设备Tap Interface是一个虚拟网络接口用于将虚拟机的网络流量传输到宿主机的网络栈。它通常用于虚拟化环境中使虚拟机能够与宿主机或其他网络设备进行通信。 QEMUQuick Emulator是一个开源的虚拟机管理程序和模拟器。它可以模拟各种硬件平台并提供虚拟化支持使得多个虚拟机可以在一个物理机上运行。QEMU通过处理虚拟机的硬件请求、管理虚拟机的资源来实现虚拟化。 数据通道的瓶颈
从Tap设备到QEMUTap设备是虚拟网络接口用于处理虚拟机的网络流量。数据包从Tap设备接收后需要复制到QEMU虚拟机管理程序。这意味着数据包需要经过一个拷贝操作才能从Tap设备转移到QEMU。从QEMU到客户机QEMU处理完数据包后再将其发送到虚拟机的网络栈。这也需要一个拷贝操作。这两个拷贝操作Tap设备到QEMUQEMU到虚拟机都增加了延迟和处理开销成为性能瓶颈。
消息通知路径的瓶颈
内核到QEMU的通知消息当数据包到达Tap设备时内核需要通知QEMU有新的数据可供处理。这个通知过程涉及内核发出一个消息告知QEMU有数据到达。IOCTL请求和中断QEMU在接收到内核的通知后会使用IOCTL输入输出控制调用请求KVM内核虚拟机管理程序发送一个中断。中断用于通知虚拟机有新的数据到达。KVM到客户机的中断KVM接到QEMU的中断请求后向虚拟机发送中断信号。这个中断信号让虚拟机知道有新的数据包需要处理。
Linux内核态vhost-net
vhost-net通过卸载virtio-net在报文收发处理上的工作使Qemu从virtio-net的虚拟队列工作中解放出来减少上下文切换和数据包拷贝进而提高报文收发的性能。除此以外宿主机上的vhost-net模块还需要承担报文到达和发送消息通知及中断的工作。
报文接收仍然包括数据通路和消息通知路径两个方面
数据通路是从Tap设备接收数据报文通过vhost-net模块把该报文拷贝到虚拟队列中的数据区从而使客户机接收报文。消息通路是当报文从Tap设备到达vhost-net时通过KVM模块向客户机发送中断通知客户机接收报文。 用户态vhost
Linux内核态的vhost-net模块需要在内核态完成报文拷贝和消息处理这会给报文处理带来一定的性能损失因此用户态的vhost应运而生。用户态vhost采用了共享内存技术通过共享的虚拟队列来完成报文传输和控制大大降低了vhost和virtio-net之间的数据传输成本。
数据通路不再涉及内核直接通过共享内存发送给用户态应用如DPDKOVS
消息通路通过Unix Domain Socket实现是一种在同一台计算机上进程间通信IPC的方法。与网络套接字不同它不涉及网络协议栈数据通过内存中的文件描述符进行传输。
DPDK vhost
DPDK vhost支持vhost-cuse用户态字符设备和vhost-user用户态socket服务两种消息机制它负责为客户机中的virtio-net创建、管理和销毁vhost设备。
当使用vhost-user时首先需要在系统中创建一个Unix domain socket server用于处理Qemu发送给vhost的消息。 DPDK示例程序vhost-switch是基于vhost lib的一个用户态以太网交换机的实现可以完成在virtio-net设备和物理网卡之间的报文交换。还使用了虚拟设备队列VMDQ技术来减少交换过程中的软件开销该技术在网卡上实现了报文处理分类的任务大大减轻了处理器的负担。