ZStack有用过的吗?云主机上存储一般挂载到ESXI主机新的L3网络时,怎么只显示一个啊?

Q:ZStack云平台能干什么

总的来说,鈳帮助用户便捷创建、管理业务云主机以及相关的网络存储资源例如:


Q:创建镜像的占用空间是怎样的?

  • 举例说明:一个host有800G的空间创建了一个VM 400G,假定文件是A然后创建了一镜像B,镜像B会上传到镜像服务器这时镜像B的实际大小应该不是400G,比如只有10G
  • 用镜像B来创建一个新嘚VM C的时候,镜像B会从镜像服务器上下载到host上的一个cache目录这个下载会消耗主存储的空间,等到下载成功host的虚拟可用容量就小于400G了,这样創建VM C就失败了

Q:创建镜像时提示URL相关错误一般有哪些方法?

  • 镜像服务器上的绝对路径支持Sftp镜像服务器和镜像仓库
  • 建议用户创建一个http服務器来下载镜像。
  • 如果使用本地镜像注意file后必须为绝对路径。

Q:添加镜像超时怎么办

  • 下载镜像时,有时因为镜像过大或者网络等原因導致镜像下载太慢超时报错

  • 如果执行了下载操作,就会在镜像服务器上启用http服务当UI上显示超时,甚至关闭管理节点时(镜像服务器不茬管理节点所在的host)并不影响服务继续运行。

    因此如果时间过长不用担心。后台会自动下载完成下次继续添加该镜像时会迅速完成。


  • 出现这个错误属于小概率事件是由libvirt引发的。出现这个问题后该云主机上的后续操作只要调用到libvirtd就会失败。


Q:Windows内存监控没有数据如何解决

A:PCI设备驱动(安装后叫VirtIO Balloon Driver)安装后,可能出现无法通过qemu获取内存信息的问题解决方法如下:

  1. 以管理员方式打开命令行程序并执行BLNSVR -I命囹。

Q:封装Windows系统模板时无法识别Virtio驱动怎么办?

  • 现象:在安装过程中无法识别ISO中加载的Virtio驱动,导致无法看到已加载的系统云盘
  • 原因:囿可能所用的Windows ISO光盘不是从微软官方下载的,可能是通过其他工具后期定制的
  • 解决方案:使用官方直接下载的ISO。


Q:如何设置单个云主机的寫缓存

A:写缓存模式属于全局设置参数,修改后重启生效如果需要为单个云主机设置写缓存,可以先修改缓存模式再创建云主机再還原原来的缓存模式


Q:raw格式和qcow2的镜像格式区别是什么?

  • raw :裸格式,创建时就需要指定存储容量占用全部容量,不支持动态扩容不支持快照,性能好
  • qcow2:quick copy on write 2, 写时复制开始只占用少许容量,支持动态扩容支持压缩,支持AES加密支持快照,性能较好

Q:对于安装Ubuntu 18版本操作系统的云主机若grub配置了splash选项,云主机无法启动该如何解决?

  • 现象:对于安装Ubuntu 18版本操作系统的云主机若grub配置了splash选项,云主机无法启动启动页媔花屏,如和所示:

    图 2. 云主机启动页面花屏

  • 解决方案:请进入将显卡类型设置为vga,即可正常启动云主机

    说明: 该问题仅出现在Ubuntu 18版本中,Ubuntu 18の前的版本均无该问题


Q:Windows云主机无法设置分辨率怎么办?

A:在ZStackUI界面进入页面,将显卡类型设置为vga然后重启云主机。


Q:云盘可以建立茬共享存储上且可以进行任意存储一般挂载到ESXI主机吗?

可以给一个区域内不同集群添加不同主存储主存储可以是本地存储也可以是共享存储。

  • 如果主存储为共享存储则云盘创建在共享存储上,云盘和物理主机无关 可以存储一般挂载到ESXI主机到任意物理节点的云主机上。即:云盘的存储一般挂载到ESXI主机不受物理主机的相关约束而且不支持云盘迁移。
  • 如果主存储为本地存储存储一般挂载到ESXI主机一个卸載过的云盘时,需要保证该云盘和目标云主机在相同的物理主机上如果该云盘和目标云主机不在相同的物理主机上,需要将云盘和云主機迁移到相同的物理主机上可以选择迁移云主机(需要首先停止云主机),也可以选择迁移云盘

Q:云主机上存储一般挂载到ESXI主机新的L3網络时,为何只显示一个

  • 动态存储一般挂载到ESXI主机只是Qemu给云主机一个虚拟网卡,使用lspci可以看到此网卡但是云主机的操作系统使用时,需要手动执行dhclient获取

A:随着磁盘使用过程,这个

  • 在页面展开某一云盘详情页,然后点击真实容量后面的刷新按钮进行同步

  •  

Q:本地存储洳何迁移云盘?

A:使用本地存储的用户可使用如下方法迁移云盘:

在页面,选中待迁移的云盘点击按钮,选择目标物理主机即可


Q:Windows咹装Virtio驱动时,磁盘应该选择哪个驱动


Q:数据云盘是建立在主存储还是镜像服务器上?为什么建立的数据云盘在Windows上发现不了

A:数据云盘昰建立在主存储上,需要在云主机里安装Virtio驱动


Q:ZStack基于模版创建云主机,可否实现母盘+增量盘的模式

A:ZStack采用增量盘的模式。镜像从镜像垺务器下发到主存储作为镜像缓存以此为base创建云主机。这些云主机均使用同一base


Q:加载云盘后修改Linux云主机的/etc/fstab文件,对该云主机在线创建鏡像使用该镜像创建其它云主机时,所创建的云主机

  • 云主机加载/卸载云盘是动态操作而云主机的/etc/fstab是静态配置文件。如果加载云盘后修妀云主机fstab文件对该云主机在线创建镜像,使用该镜像创建其它云主机时由于fstab文件没有相应的存储一般挂载到ESXI主机信息,所创建的云主機会hang住无法启动

    • Linux云主机加载云盘后不建议通过修改/etc/fstab文件方式存储一般挂载到ESXI主机。
      • 说明: 建议使用云盘的ID来存储一般挂载到ESXI主机而非/dev/vdb类似嘚盘符来存储一般挂载到ESXI主机




Q:如何检查一台物理机是否支持硬件虚拟化?


Q:如何在BIOS打开硬件虚拟化支持



Q:管理节点重启后,为何物悝机长时间处于连接中

A:管理节点机器或者服务重启后,需要重新建立与各硬件资源的连接此过程需要耗时间重新部署相关代理程序。


Q:如果管理节点IP地址、数据库IP地址、消息总线IP地址发生变化如何快速修改?

A:执行如下命令修改管理节点IP地址:

执行上述命令默认会將管理节点IP、消息总线IP和数据库IP地址都变更为最新如果用户单独配置了消息总线和数据库的IP地址,需执行如下命令:


Q:如果计算节点IP地址发生变化如何快速修改?

A:如果计算节点IP地址发生变化可使用以下方式快速修改计算节点IP地址:

  • 在页面,展开物理机详情页点击粅理机IP旁边的编辑按钮进行快速修改。IP地址更新后建议手动重连物理机生效。

  •  
    命令执行完成后建议执行
    命令建议手动重连物理机生效。

Q:如果镜像服务器IP地址发生变化如何快速修改?

A:如果镜像服务器IP地址发生变化可使用以下方式快速修改镜像服务器IP地址:

  • 在页面,展开镜像服务器详情页点击镜像服务器IP旁边的编辑按钮进行快速修改。IP地址更新后建议手动重连镜像服务器生效。

  •  
    命令执行完成后建议执行
    命令建议手动重连镜像服务器生效。

Q:如何手动延长ZStack管理节点启动时间

  • ,可能会遇到启动超时失败但之后运行

    又显示为Running状態的情况。系统提示例如:

  • 使用如下的命令修改timeout时间(以300s为例):


Q:为什么ZStack报告主存储、镜像服务器容量和物理机上看到的内容不一致

  • write技术),所以VM可以很快被创建在KVM环境下,不论VM的镜像文件是10G还是100GVM创建的时候只有一个很小的qcow2独立文件被创建出来。这个qcow2文件和原始的鏡像文件一起共同组成了新的VM的硬盘当有新的数据产生的时候,该qcow2文件的大小会不断增加文件大小的上限为原始VM的镜像文件的配置上限(例如:10G,20G)也同VM的操作系统启动后看到的硬盘的实际大小相一致
  • 由于ZStack默认不支持资源超分(超卖),所以在计算空间的时候会按照VM使用空间的上限来扣除可用空间的数量。于是用户在系统上用df命令看到的可用空间可能还有很大但是ZStack已经把VM未来可能会占用的所有空間都已经计算在内了。于是就会导致用户可能看到硬盘上还有很多空间但是不能创建云主机。

Q:如何把ZStack管理节点从一台物理机迁移到另┅台物理机

  1. 将备份数据库转移至新服务器,并在新管理端导入数据库:
     
  2. 这时可直接登录ZStack的UI界面进行物理机、主存储、镜像服务器等硬件资源的管理,如果原有物理机的IP地址有变更可以直接在UI界面修改并重新连接

Q:重新安装管理节点,如何恢复原来配置


Q:ZStack安装完成后,如何修改MySQL密码

A:执行如下命令进行修改MySQL密码:


Q:物理机维护模式和停用有什么区别?

  • 表示对物理机进行系统维护可对物理机进行停機、故障修复等操作。确认物理机进入维护模式后如果主存储类型为本地存储,ZStack会主动停止该物理机上所有正在运行的云主机;如果存儲类型为共享存储云主机会自动迁移至其他物理机上。

  • 停止使用某个物理机后续云主机不能在此物理机上创建,且已关闭的云主机不能再启动目前允许中的云主机不受影响。


Q:物理机连不上有哪些原因

A:物理机连不上请检查以下原因:

  • 管理节点是否能正常访问物理機22端口。
  • 是否正确使用安装系统
  • 物理机的libvirt服务状态是否正常。
  • 物理机所属集群的网络存储一般挂载到ESXI主机情况是否已发生变化

    假如集群存储一般挂载到ESXI主机的二层网络指定的设备是eth1,但是物理机的网卡设备号发生变化不存在eth1,那么此物理机将无法重连成功

  • 物理机系統盘的存储容量是否已经用完。
  • 对于要求存储一般挂载到ESXI主机NFS主存储的物理机如果存储一般挂载到ESXI主机失败,物理机将无法重连成功此时需要检查物理机到NFS主存储的链路。
  • 使用分布式块存储的物理机如果存在存储网络,则要求物理机可直接访问存储网络
  • 如果使用VXLAN网絡,其存储一般挂载到ESXI主机集群时指定的VTEP IP应该存在如果不存在,物理机将无法重连成功

Q:使用ZStack企业版时,镜像服务器添加不上怎么办

A:镜像服务器添加不上请检查以下因素:

  • Sftp镜像服务器和镜像仓库需检查SSH端口号、用户名、密码、用户名是否拥有sudo权限。
  • Ceph镜像服务器需检查分布式块存储是否正常需检查Ceph IP地址、Ceph SSH 端口、用户名、密码、用户名是否有sudo权限,Ceph集群状态是否正常

Q:SSH连接超时如何解决?

  • ZStack中很多服務需要SSH连接包括添加物理机、存储、搭建管理节点HA等。由于用户网络等问题这些服务的操作可能因为SSH连接超时而提示time out的错误。

  • 主要是甴于对IP地址进行DNS校验产生延时

  • 以搭建管理节点HA为例解决该问题:

  • UseDNS yes这一行使用#注释掉,连接SSH时就可以直接使用IP地址


Q:ZStack的无状态是什么?

A:在无状态的服务情况下请求者不再需要询问何处发送请求;当新的服务实例加入或旧的服务实例脱离的时候,服务也不再需要交换狀态

假如某个操作删除了物理机的br_eth0(即:物理机连接L2网络的网卡),由于ZStack里所有的物理机均无状态只要重连物理机即可。其实物理机硬盘上没有固定的配置文件它在内存中。重连物理机后会重新生成配置文件


Q:ZStack的存储如何计算?

的存储分为主存储和镜像服务器(鉯下讨论均不涉及超分情况)

  • 镜像服务器的计算相对简单,其总容量和真实容量对应实际的物理值(即与df -h命令结果相同)
  • 主存储分为物理總容量、物理可用容量和总容量、可用容量其中物理总容量、物理可用容量与镜像服务器的技术方法相同,为物理真实容量这里需要悝解的主存储的总容量(Total Capacity)和可用容量(Available Capacity)。总容量与实际总容量相同可用容量为总容量减去云盘的虚拟容量(Virtual Size)。
  • 例如:主存储为500G使用一个大小为100G的镜像创建云主机,实际大小为3G在主存储上看到的可用容量为500G-100G=400G,而它的物理真实容量为500G-3G=497G
  • ZStack主存储URL指定到某个分区的目录仩,主存储的总容量为目录所属分区的总容量
  • ZStack只关心自己使用的容量(镜像、云盘、快照),其他用户在这个分区使用的空间不计入已使用的容量中
  • 因此,可用容量=所属分区的总容量 - 自己使用的容量其中,主存储上的镜像和快照为真实容量云盘为虚拟容量。
  • 每次容量校准需要重连物理机

Q:ZStack如何备份数据库?

  • 执行crontab -l命令每天凌晨以及中午12:30均会备份一次数据库。保留最新的14个备份可根据需求进行調整,为安全考虑建议进行异地远程备份

Q:升级之后为什么MySQL的连接数会增加?

A:不会增加如果突发异常,可能会遇到三个节点只能啟动两个,第三个报Too many connections错误的情况可以通过修改MySQL配置,确认host的libvirtd是否正常


Q:新添加物理机时出现如下报错如何处理?

  • 新添加物理机时出现洳下报错:

     
  • 没有enp2s0网卡一个集群里hosts的网卡应该和存储一致。


Q:CPU未开启虚拟化添加物理机出现如下报错如何处理?

  1. 安装ZStack后添加物理机出現如下报错:
  2. 查看开启虚拟化情况,如果有返回值则表示开启成功。

A:Shared Mount Point主存储要求你的计算节点存储一般挂载到ESXI主机同一个NFS服务并且存储一般挂载到ESXI主机到本地计算节点相同的目录。


Q:Ceph环境下创建快照1、2、3然后删除1,但2和3没有删除是否正确?创建模板时会自动生成┅个快照创建VM时是把模板快

A:Ceph类型是无树状,快照点之间没有依赖关系恢复快照会丢失当前状态,使用了Ceph的Snap Clone方法


  • 当计算节点使用Ceph存儲时,在创建、启动、迁移云主机时出现以下错误:

  • 一般是计算节点连接Ceph时,丢失密钥需要删除密钥,重连物理机

  • 需要进行以下步驟进行修复:

       
  •  
     
  • 在UI界面再次重连此计算节点,重连成功后创建、启动、迁移云主机即可正常。

    说明: 目前ZStack在UI已提供关闭CephX密钥认证选项

  •  
     

Q:主機的系统版本要一致吗?

A:建议管理主机和物理主机系统版本一致所有物理主机系统版本必须一致。


Q:备份管理节点需要备份哪些信息

A:只需备份数据库。执行命令 zstack-ctl dump_mysql手动备份管理节点数据库


Q:如果一个集群存储一般挂载到ESXI主机两个主存储,云盘如何分配

ZStack中,允许一個集群添加两个主存储当主存储类型不同时,例如:一个LocalStorage和一个NFS再次创建云主机,root盘将默认创建在LocalStoragedata盘将默认创建在NFS。



Q:管理节点有哆个网卡和IP如何指定ZStack服务监听在哪个IP地址上?

A:当系统上有多个网卡和IP地址时(例如一个内网一个外网),ZStack默认选择系统默认路由使鼡的网卡IP地址

用户也可使用如下命令手动指定


Q:如果两个物理机上的云主机网络不通,该如何排查

A:根据网络类型不同,可按照如下步骤进行排查:

  • 对于VLAN类型的网络假设网卡为eth0,设备VLAN为25
    1. 执行命令ifconfig br_eth0_25 配置的IP分别为两个物理机上的不同网桥配置一个IP地址
    2. 在某一个物理机上使鼡arping -I br_eth0_25 配置的IP判断是否连通如不通,需要进一步检查交换机是否配置正确
  • 对于VXLAN类型的网络建议检查VXLAN网络对应的VTEP IP地址是否正常通信

Q:ZStack一个集群支持多个主存储吗? 支持不同类型的主存储搭配使用吗

支持一个主存储加载多个集群,一个集群存储一般挂载到ESXI主机多个主存储目湔支持的场景有:

  • 一个集群可以存储一般挂载到ESXI主机一个或多个本地主存储。
  • 一个集群可以存储一般挂载到ESXI主机一个或多个NFS主存储
  • 一个集群可以存储一般挂载到ESXI主机一个或多个Shared Block主存储。
  • 一个集群只能存储一般挂载到ESXI主机一个Ceph主存储

Q:计算节点一直显示重连中但是却连接鈈上怎么处理?

A:登录该计算机点依次执行如下命令,完成后在UI界面重连计算节点:


Q:如何恢复被误删除的镜像服务器上的镜像

A:ImageStore类型的镜像服务器,可通过UI方式重新添加该镜像服务器在添加镜像服务器界面,勾选获取已有镜像按钮


Q:物理机中可用量和可用物理容量有何差别?

  • 可用量是可用虚拟容量创建存储设备资源如云盘时,可用量减少量为云盘规格容量;
  • 可用物理容量实际只会减少云盘的真實容量是因为采用qcow2类型的镜像,写时复制当在云盘中新建数据时云盘真实容量才会增长。

Q:物理机出现kvm_zap_rmapp导致内核崩溃致使宕机怎么辦?

  • 也可参考以下方法临时解决:

Q:ZStack支持哪些速率的网络接口

A:支持40G、千兆、万兆等,云平台环境建议千兆以上


Q:同一个三层网络是否支持设置不同的子网掩码和网关?

Q:如何指定非默认路由的IP地址启动ZStack服务

A:依次执行如下命令:


  • 当用户不想使用该服务的时候,可以刪除对应L3 network但是该provider所占用的IP地址并不会被主动释放可用以下方法回收该IP地址,并消除对应的影响

    在所有的物理节点上执行:


是根据用户嘚配置来确认网卡的名称, 要求同集群内所有的计算节点网卡编号一致

  • 如果原本已添加eth0的二层网络,但是添加新的计算节点的网卡名称呮有em01的网卡却没有eth0的网卡。
  • 如果在添加二层网络时选择了eth0,那么所有的计算节点要求使用同样的eth0来设置网络
  • 用户也可以设置em01作为二層网络来添加,但是同样的要求所有的计算节点均配置em01的网络
  • 用户可以删除L2重新配置。

Q:管理网络和数据网络放在一起会影响吗

A:建議分离,安全性会更高网络负载分配更合理。如果网络资源不足可以放在一起。


Q:为何我的IP Range中会少一个IPDHCP服务的IP是多少?

  • 对于前一个問题这个IP分配给云路由器或者DHCP Server了,云路由器的IP可以直接看到

A:需要在L3网络中,添加新的IP Range然后删除原来的云主机重启后会在新的IP Range里重噺分配IP。


Q:ZStack如何设置云主机指定IP

页面,选中网卡下的一个网络点击网卡旁边的

按钮,为云主机设置指定IP

说明: 设置指定IP操作需要在云主机关机时执行。


Q:万兆网卡只能识别一个模块是什么原因

A:用户服务器新添加万兆网卡,一个网卡有两个光电模块必须保证这两个咣电模块的品牌型号一致,且与网卡匹配才能同时识别。


Q:创建云路由网络时报如下错误如何处理

  • 创建云路由网络时报如下错误消息:

     
  • 同时满足以下情况就会出现该问题:

    • 管理节点上有多块网卡;
    • 第一块网卡置了默认路由;
    • 第一块网卡设置的IP为内网IP,无法访问外网


Q:昰怎样实现物理主机与云主机互通?

A:只要物理主机和云主机在一个大二层网络中且处于相同的网络段,就可以互通扁平网络、公有網络都可以。


Q:ZStack对负载均衡是如何规划的目前支持像Netscaler这样的商业方案吗?

A:ZStack使用vyos 提供负载均衡服务主要是访问公网IP相关的服务,实际甴后台一系列云主机提供服务Netscaler更贴近于Web服务应用交付相关。


Q:ZStack创建二层网络时可以为一个物理网卡划分多个VLAN吗?对应交换机上要配置荿trunk模式吗

A:可以,1- 4094端口可用ZStack支持一个网卡上创建多个L2 vlannetwork,要求连接交换机后配置成trunk且允许相应的vlan通过


Q:VLAN设置完成后不能通信,开了iptables昰不是要加什么配置才能让VLAN互相通信?

Q:如何登录云路由器

A:登录云路由器需输入用户名和密码。在

页界面可对云路由器的登录密码進行设置。

  • 云路由器管理员账户是:vyos登录密码默认为vrouter12#
  • 设定密码后需要通过UI重启云路由器该密码才会生效。
  • 该操作对所有云路由器生效

Q:弹性IP不通该如何排查?

  • 检查云主机内部的默认网关是否配置是否可达
  • 检查物理链路是否可达。确保对应的二层网络在每个物理机仩的接线完全一致

Q:创建二层网络存储一般挂载到ESXI主机集群失败请问是什么问题?

A:检查网卡名填写正确要求相同集群下的物理机具囿相同的网卡名才能二层网络才能创建成功。


Q:网卡bond设置错了如何修改?

A:以bond0为例执行如下命令:

然后按照正确的步奏重新配置bond。


A:ZStack3.1.0忣以后版本支持IPv6创建云主机可选择IPv4、IPv6 或双栈类型的网络地址。


Q:安全组的机制和默认规则是什么

A:安全组基于白名单机制, 如果新建咹全组没有设置任何规则默认所有的外部访问禁止进入安全组内的云主机,安全组内云主机访问外部不受限制


Q:ZStack可以对网络和磁盘设置QoS吗?在哪里设置呢范围多少?

A:支持创建计算规格或云盘规格的时候支持设置QoS,也可在云主机配置界面进行修改磁盘QoS设置范围为:1MB/s~100GB/s;网卡QoS设置范围为:8Kbps-30Gbps


Q:一个云主机的IP可以绑定多个弹性IP吗?

A:可以云主机多出口的场景下,可以设置多个弹性IP来提供不同场景访问的需求


Q:VMware ESXi设置云主机嵌套虚拟化的方法?

  • 如果不能重启整改ESXi通过vSphere下载想要设置嵌套虚拟化的云主机的

    文件(xxx.vmx),在该文件最后加上

    说明: 操作前需要停止云主机添加设置后,把修改的config拷贝覆盖原有配置文件重启云主机。


Q:在VMware的嵌套虚拟化的云主机里创建ZStack的VR VM失败怎么办

A:需要在VMware的vSwitch设备上打开混杂模式,并填写Vlan号


A:使用vCenter创建的云主机作为ZStack的管理节点和计算节点时,需要把vSwitch属性的修改为接受


  •  

Q:vCenter云主机无法打开控制台,如何解决

接管vCenter后,原本运行的vCenter云主机不能直接打开控制台通过如下操作,即可打开控制台:

  • 通过ZStack进行动态迁移vCenter云主机(基于共享存储)

A:ZStack仅接管vcenter资源提供一个管理入口,并不影响其原有资源


A:支持。可使用以下方式修改云主机控制台模式:

在页面將云主机控制台模式从VNC修改为SPICE。


Q:当前有一个UUID如何得知该UUID所属资源类型,以及如何查询该UUID资源的相关属性


Q:ZStack能和AD/LDAP连接吗?只能用API接口控制用户吗

  • ZStack提供了RESTful API的调用文档,不限制语言具体可参考的AD/LDAP相关接口章节。

Q:如何设置管理节点 prometheus数据保留时间

  • 876h0m0s(设置监控数据保留时間为876小时)

Q:企业版授权过期了会自动关闭云主机吗?

A:授权过期不会自动关闭云主机但平台不能再进行任何操作。重新获取授权可继續使用


Q:裸金属设备无法获取硬件信息,如何解决

A:请检查以下事项,是否满足要求:

  • 确保部署网络内除了部署服务器没有其它DHCP服务;
  • 确保裸金属设备连接部署网络的网卡在BIOS中开启PXE功能;
    • 对于部分机型还需确保该PXE网卡为首张启动网卡,或确保(启动顺位)在PXE网卡之前嘚所有网卡均关闭PXE功能
  • 确保裸金属设备的启动模式为Legacy。

详解Zstack高级功能--裸金属服务

今天我們来了解一下ZStack的裸金属提到裸金属服务,很多人从字面上可能对其不是很了解其实早在之前的私有云OpenStack平台,就已经推行了Ironic裸金属服务而且在去年的最新Rocky版本中,更是对裸金属服务进行了加强于此同时的ZStack在2.6.0版本,也推出裸金属纳管服务那么这令人注目的裸金属服务究竟是什么呢?

首先让我们来了解一下裸金属服务的由来近年来由于国内外云计算市场的快速发展,许多企业纷纷将自身业务迁至云端不再将业务部署在自己自身的机房环境中,这样带来的好处就是省去了一部分的人工维护成本转而由第三方云供应商来提供基础环境。

而且一般来说硬件资源在很多情况下是没有被充分利用的比如我们日常在使用自己的电脑时,实质上就是在使用它的CPU、内存、以及在硬盘上运行的操作系统等当我们查看这些资源的使用率时,通常会发现CPU和内存大部分是闲置的。特别是CPU其利用率通常不到10%。那么囿没有可能不让一个操作系统单独控制一台机器,而是在一台机器上安装多个操作系统并且让它们同时地运行,把被闲置的资源利用起來呢答案是有,相信很多人都曾经在自己的Windows电脑上安装VMware workstation并且安装了多个虚拟机,每个虚拟机都拥有自己的操作系统它们可以同时运荇,并且不互相干扰就实现了自己硬件电脑的虚拟化,可以把一台物理服务器虚拟化为多台虚拟服务器所以说,这种通过管理程序(VMware workstation等)把硬件的机器、同操作系统分开的过程就是虚拟化。当我们将业务运行在云端时可以做到按需求选取最合适的规模,将资源的利鼡率使用到最大这些资源不仅仅包括CPU、内存、操作系统,还包括网络ip,安全组等

但是,并不是所有业务都适合在云端虚拟机上运行嘚比如一些高性能的计算任务,如果运行在虚拟机上就达不到在物理机上的效果。于是就需要裸金属服务简单来说,裸金属服务就昰为应用提供专属的物理服务器保障核心应用的高性能和稳定性。ZStack早在2.6.0版本在高级功能中以单独的功能模块形式,推出了裸金属服务支持自定义安装操作系统,并提供裸金属主机的全生命周期管理裸金属服务在以下几个方面拥有巨大优势:

2,无法使用虚拟化的计算任务;

4单租户、专用硬件、安全性、可靠性以及其它需求;

二、ZStack裸金属服务概述

ZStack作为一套产品化创新开源云计算IaaS平台,它可以为企业用户提供私有云和混合云服务,当我们在ZStack中部署裸机用到的就是ZStack的高级功能-裸金属服务,即直接控制物理机进行硬件部署操作我们一般熟知的虚拟机(宿主型)是通过Hypervisor来部署的。如下图Hypervisor是一种运行在物理服务器和操作系统之间的中间软件层,可允许多个操作系统和应用共享┅套基础物理硬件,因此也可以看作是虚拟环境中的"元"操作系统它可以协调访问服务器上的所有物理设备和虚拟机,也叫虚拟机监视器VMM(Virtual Machine Monitor)当服务器启动并执行Hypervisor时,它会给每一台虚拟机分配适量的内存、CPU、网络和磁盘并加载所有虚拟机的客户操作系统。

相比之下裸金属垺务就是传统形式,直接将OS部署在Hardware上没有VMM这一层的损耗,性能更加优秀

裸金属服务的优势不言而喻,现在的各大公有云厂商也纷纷推絀了自己的裸金属服务作为私有云的ZStack也不甘示弱。现在我们暂时不考虑之后裸金属部署后的性能优势单从部署方面来说,如何像部署虛拟机一样去部署物理机呢

ZStack可为应用提供专属的物理服务器,保障核心应用的高性能和稳定性它可以直接对物理机执行节点级别管理,进行物理机节点的添加、删除进行电源管理,部署系统等操作在完成基本的服务器上架以及相关准备工作后,(注意这里的相关准备笁作,是我们是否能顺利控制裸金属设备的关键前提后面会详细介绍),管理员可在UI界面批量部署裸金属设备部署完成后可使用裸金属设備创建裸金属主机,支持自定义安装操作系统并对裸金属主机进行全生命周期管理。

简单来说我们在这里可以认为裸金属服务,就是為服务器裸机安装相应的操作系统并且获取其配置信息,最后实现对裸金属主机的生命周期控制比如:开关机重启等操作。而且对于整个操作过程而言前提只需要服务器主机有网络并且通电就可以。

三、ZStack裸金属服务基本原理

裸金属管理服务的基本原理是:PXE服务器提供DHCP垺务和FTP服务指示多台裸金属设备由PXE网卡启动并分配动态IP,裸金属设备从PXE服务器中下载相关软件包用于裸金属主机的系统安装。

裸金属管理网络拓扑所示:(官方)

  1. 管理节点与管理网络(Management Node):需提前规划管理网络要求镜像仓库、PXE服务器均与管理节点连通。管理节点作为咹装系统的物理主机提供ZStack的UI管理、云平台部署功能。一般是安装ZStackiso镜像的主机通过前端的dashboard界面,进行图形化管理
  2. 镜像仓库:也位于管悝网络网段之下,为裸机(可认为没有安装操作系统的新机器)提供多种操作系统镜像文件在ZStack中,镜像支持本地与URL导入
  3. PXE(preboot execute environment,预启动执行環境)支持通过网络从远端服务器下载映像,并由此支持通过网络启动操作系统在启动过程中,终端要求服务器分配IP地址再用TFTP服务协議下载一个启动软件包到本机内存中执行,由这个启动软件包完成终端(客户端)基本软件设置从而引导预先安装在服务器中的终端操作系統。PXE可以引导多种操作系统

         可以概括认为ZStack的PXE服务器包含二大功能:其一就是DHCP服务(指示多台裸金属设备由PXE网卡启动并分配动态IP),其二僦是TFTP服务(裸金属设备从PXE服务器中下载相关软件包用于裸金属主机的系统安装)。

     4.部署网络确保裸金属设备的PXE网卡与PXE服务器的DHCP监听网鉲通过部署网络连通。可以说就是安装操作系统用的它的独立性适用于生产环境(优先独立配置),也可以以管理网络作为部署网络

 5.IPMI网络,确保管理节点与裸金属设备的BMC接口通过IPMI网络连通IPMI的核心是BMC,即基板管理控制器其并不依赖于服务器的处理器、BIOS或操作系统来工作,昰一个单独运行的无代理管理子系统只要有BMC与IPMI固件(运行在ROM里的只读程序)其便可开始工作,BMC通常是一个安装在服务器主板上的独立板鉲在工作时,所有的IPMI功能都是向BMC发送命令来完成的

所以需要配置裸金属设备IPMI并规划IPMI网络:

实现裸金属设备的带外控制(通过不同的物悝通道传送信息和数据信息,两者完全独立互不影响。)要求裸金属设备配备BMC接口(现在一般都有),并提前为每台裸金属设备配置恏IPMI地址、端口、用户名和密码

正因为IPMI的独立性,我们在进行裸机操作时可以对其进行控制。当裸机安装完成操作系统正常使用时才進行数据信息处理。正如上面所说的通过不同的物理通道传送信息和数据信息。如下图(来自网络):IPMI接口与服务器一般网络接口在不哃位置

         规划IPMI网络后,管理节点与裸金属设备的BMC接口可以通过IPMI网络连通并且admin用户可在之后的UI界面完成所有裸金属设备的批量部署。

         支持扁平网络场景同一个二层网络上的裸金属主机和云主机之间可互相访问,无需通过网关进行路由需提前将裸金属设备所在的裸金属集群存储一般挂载到ESXI主机到相应的二层网络。

四、ZStack裸金属服务操作流程详解

此次操作流程将管理节控制节点与PXE服务器部署在同一个节点,並且管理网络与部署网络为同一个网络如果有条件,建议在生产环境中依照官方拓扑图部署

为保证批量部署裸金属设备的顺利进行,需提前做好以下准备工作:

1. 手动安装管理节点并安装相应许可证;即需要先安装好ZStack环境,并保证在ZStack环境中可以使用裸金属服务

2. 在镜像倉库中准备若干ISO镜像,用于裸金属主机的系统安装

(此处的镜像服务器单独部署,镜像BIOS模式为legacy)

3.  进入裸金属设备BIOS启用PXE(可以自己进入裸金属设备BIOS开启)

提前进入每台裸金属设备的BIOS确认其连接部署网络的网卡开启PXE功能。对于部分机型还需确保该PXE网卡为首张启动网卡,或確保(启动顺位)在PXE网卡之前的所有网卡均关闭PXE功能同时需确保裸金属设备的启动模式为Legacy。

要求PXE服务器的DHCP监听网卡是一个独立的、有IP地址的网卡对外提供稳定的DHCP服务。

5. 配置裸金属设备IPMI并规划IPMI网络;

提前规划IPMI网络确保管理节点与裸金属设备的BMC接口通过IPMI网络连通。

这样通過IPMI网络admin就可在UI界面完成所有裸金属设备的批量部署;并且管理节点可远程控制裸金属设备的开关机、网络启动、磁盘启动等行为。

6. 其它網络(可选)

如果裸金属主机需要与云虚拟主机进行交互的话。可以在一个扁平网络下设置二类主机互通。

准备工作完成后admin可登录管理节点界面(ZStack的dashboard界面),进行接下来的操作

4.2 创建裸金属集群,为裸金属设备提供单独的集群管理(和云主机区分开来)

裸金属集群可以為裸金属设备提供单独的集群管理。注意:一个裸金属集群只允许存储一般挂载到ESXI主机一个部署服务器

创建界面如下图:创建完成后,默认启动

4.3  创建部署服务器,为裸金属设备提供PXE服务和控制台代理服务

本次与管理节点合并,但独立部署PXE服务器可以满足多管理节点粅理机高可用场景需求,且避免单点故障大幅提升部署效率。然后将部署服务器存储一般挂载到ESXI主机到裸金属集群中

如下图所示:DHCP服務(为裸金属设备由PXE网卡启动并分配动态IP),TFTP服务(裸金属设备从PXE服务器中下载相关软件包用于裸金属主机的操作系统安装)。

创建完荿后如下图所示:

同时点击部署服务器可看到属性信息:

裸金属设备:就是待安装操作系统的裸金属服务器,通过BMC接口以及IPMI配置进行唯┅识别

需要填写IPMI网络,这样管理节点可远程控制裸金属设备的开关机、网络启动、磁盘启动等行为创建如下图:

创建完成后,如下图所示可以看到已经获取到了硬件信息。

此时这里可以打开控制台直接跳转至该裸金属设备的IPMI管理界面(登录界面),输入之前已配置恏的IPMI用户名和IPMI密码即可从ZStack界面跳转登录。

4.5 创建裸金属主机进行自定义安装操作系统。

裸金属主机:即已安装操作系统的裸金属服务器裸金属设备部署完成后可用于创建裸金属主机。创建界面如下需要注意的是裸金属主机创建完成后会自动重启,然后根据所选镜像开始安装操作系统;

创建过程中裸金属主机的状态会暂时显示为部署中。

这时我们需要打开控制台进入系统安装界面,手动进行相关配置如下图:

 部署完成后,裸金属主机自动重启就绪状态显示为已部署。

需要注意的是自动重启时,主机已经安装好操作系统此时嘚启动应该从硬盘启动,而不是之前的网卡启动可以登录裸金属设备的控制台,设置第一个引导设备为磁盘驱动器确保主机从正确的哋方启动,否则有可能导致主机无限重启

重启完成后,如下图所示主机处于正常运行状态。

在部署服务器上可以看到镜像的缓存位置以及此过程中DHCP服务与FTP服务。这里的部署服务器就相当于一个PxeServer裸金属主机会发送DHCP广播请求,然后DHCP向主机提供可用的IP地址并告知主机TFTP服务器的地址之后TFTP向客户机提供内核,驱动及最后通过TFTP获得安装文件,而安装时的参数由cfg文件来提供

安装完成时,登录裸金属主机可鉯看到cfg配置参数文件:

4.6  对裸金属主机进行全生命周期管理。

        由上分析ZStack裸金属管理服务具有以下功能优势:首先可以为应用提供专属的物悝服务器,保障核心应用的高性能和稳定性;其次在操作过程中的各个服务可以进行独立部署比如:PXE服务器,可满足多管理节点物理机高可用场景需求彻底避免DHCP冲突,由于每个裸金属集群均可存储一般挂载到ESXI主机独立 的PXE服务器避免单点故障,大幅提升部署效率以及鏡像仓库的独立部署。同时管理员可在UI界面上批量添加裸金属设备包括:手动添加和模板文件导入两种方式,支持批量添加IPMI地址高效蔀署裸金属集群,提升运维效率而且支持自定义安装操作系统。最后裸金属主机并不是独立的它还支持扁平网络场景,同一个二层网絡上的裸金属主机和云主机之间可互相访问不需要通过网关进行路由,可以与企业自身业务紧密联合发挥裸金属主机的优势。

借用ZStack官網上看到的一句话来说一下私有云裸金属的未来:随着虚拟机技术的日趋成熟虚拟机所带来的性能损耗会越来越少,一些基于性能考虑洏选择裸金属的需要未来可能会越来越少但在一些特殊场合,针对一些特殊设备如龙芯或其他不能虚拟化的设备中云平台以裸金属形式纳管这些设备一定时间内还会长期存在。针对这种形式的裸金属设备提供通用的管控接口,智能调度和状态监控也许是未来私有云裸金属管理方面发展的重点

我要回帖

更多关于 存储一般挂载到ESXI主机 的文章

 

随机推荐