Metonymical Deflection

ゆるく日々のコト・たまにITインフラ

Linux nmcliコマンドによるKVM&LXC/LXD with SR-IOVのInterface設定

LinuxのnmcliコマンドによるBonding、VLAN、Bridge Interfaceの設定方法に加えて、SR-IOVを使用した場合について記載しました。
SR-IOVの使用方法として、KVMとLXC/LXDのそれぞれについてもまとめました。
また、SR-IOVを使用する場合の注意点についても記載しました。
さらに、内部ネットワーク的な疎通可否についても記載しました。

1.構成

1-1.環境
筐体                             : ProLiant DL360p Gen8
System ROM                       : P71 01/22/2018
NIC                              : Intel X520-SR2
OS                               : CentOS7.5(1804)
Kernel                           : 4.19.0-1.el7.elrepo.x86_64
Installed Environment Groups     : Server with GUI
Add-Ons for Selected Environment : Virtualization Client, Virtualization Hypervisor, Virtualization Tools 
1-2.全体構成

f:id:metonymical:20181104144940j:plain

構成図上に(1)~(21)までの番号を割り振りました。

(1)~(10)については過去記事を参照してください。
metonymical.hatenablog.com

(11)~(21)については主にVLANやIPの設定となります。
各VLANとIPは以下の通りです。
 (11)(13)(16)(19)
 Untag:192.168.30.22x/24
 (12)(14)(18)(21)
 VLAN301:192.168.31.22x/24
 (15)
 Untag:192.168.31.222/24*1

SR-IOVを使用する場合、仮想マシンやコンテナを起動する前にVFを予めアタッチした後*2、起動させます。
アタッチ方法については、nmcliコマンドではできないため、適時解説します。

仮想マシンやコンテナは以下の通りです。
 c750~c753:KVM上の仮想マシン
 lxc754:LXC/LXD上のコンテナ

スイッチ側の設定は以下となります。

interface GigabitEthernet0/1
 switchport trunk encapsulation dot1q
 switchport trunk native vlan 300
 switchport trunk allowed vlan 300,301
 switchport mode trunk
 spanning-tree portfast trunk
!
interface Port-channel1
 switchport trunk encapsulation dot1q
 switchport trunk native vlan 300
 switchport trunk allowed vlan 300,301
 switchport mode trunk
 spanning-tree portfast trunk
!
interface TenGigabitEthernet0/1
 switchport trunk encapsulation dot1q
 switchport trunk native vlan 300
 switchport trunk allowed vlan 300,301
 switchport mode trunk
 spanning-tree portfast trunk
 channel-group 1 mode on
!
interface TenGigabitEthernet0/2
 switchport trunk encapsulation dot1q
 switchport trunk native vlan 300
 switchport trunk allowed vlan 300,301
 switchport mode trunk
 spanning-tree portfast trunk
 channel-group 1 mode on
!
interface Vlan300
 ip address 192.168.30.1 255.255.255.0
!
interface Vlan301
 ip address 192.168.31.1 255.255.255.0
1-3.全体の流れ ~概要~
  1. 物理+Bridge:(1)(2)
  2. 物理+Bonding:(3)(4)(5)
  3. Bonding+Bridge:(6)(7)
  4. Bonding+VLAN+Bridge:(8)(9)(10)
  5. c750のEthernet&VLAN+IP:(11)(12)
  6. c751のEthernet&VLAN+IP:(13)(14)
  7. c752のEthernet+IP:(15)
  8. c753のBonding&VLAN+IP:(16)(17)(18)
  9. lxc754のBonding&VLAN+IP:(19)(20)(21)
1-4.全体の流れ ~コマンドのみ~

以下のコマンドを投入していきます。
やりたいことが既に決まっている方は、構成図とコマンドの内容を見るだけでもよいと思います。

1.物理+Bridge
(1)
nmcli connection add type bridge autoconnect yes con-name br1 ifname br1
nmcli connection modify br1 bridge.stp no
nmcli connection modify br1 ipv4.method disabled ipv6.method ignore
nmcli connection up br1
nmcli con show
brctl show
(2)
nmcli connection add type bridge-slave ifname eno3 master br1
nmcli con show
brctl show

(3)
nmcli connection add type bond con-name bond0 ifname bond0 mode balance-xor
nmcli connection mod bond0 ipv4.method disabled ipv6.method ignore
nmcli con show
(4)
nmcli connection add type bond-slave autoconnect yes ifname ens1f0 master bond0
nmcli con show
(5)
nmcli connection add type bond-slave autoconnect yes ifname ens1f1 master bond0
nmcli con show

(6)
nmcli connection add type bridge autoconnect yes con-name br0 ifname br0
nmcli connection modify br0 bridge.stp no
nmcli connection modify br0 ipv4.method disabled ipv6.method ignore
nmcli connection up br0
nmcli con show
brctl show
(7)
nmcli connection modify bond0 connection.master br0 connection.slave-type bridge
nmcli con show
brctl show

(8)
nmcli connection add type bridge autoconnect yes con-name br301 ifname br301
nmcli connection modify br301 bridge.stp no
nmcli connection modify br301 ipv4.method disabled ipv6.method ignore
nmcli connection up br301
nmcli con show
brctl show
(9)
nmcli connection add type vlan autoconnect yes con-name bond0.301 ifname bond0.301 dev bond0 id 301
nmcli con show
brctl show
(10)
nmcli connection modify bond0.301 connection.master br301 connection.slave-type bridge
nmcli connection up bond0.301
nmcli con show
brctl show

c750
(11)
nmcli connection add type ethernet autoconnect yes con-name eth1 ifname eth1
nmcli connection mod eth1 ipv4.method manual ipv4.address 192.168.30.220/24
nmcli connection mod eth1 ipv6.method ignore
nmcli con up eth1
nmcli con show
(12)
nmcli connection add type vlan autoconnect yes con-name eth1.301 ifname eth1.301 dev eth1 id 301
nmcli connection mod eth1.301 ipv4.method manual ipv4.address 192.168.31.220/24
nmcli connection mod eth1.301 ipv6.method ignore
nmcli con up eth1.301
nmcli con show

c751
(13)
nmcli connection add type ethernet autoconnect yes con-name eth1 ifname eth1
nmcli connection mod eth1 ipv4.method manual ipv4.address 192.168.30.221/24
nmcli connection mod eth1 ipv6.method ignore
nmcli con up eth1
nmcli con show
(14)
nmcli connection add type vlan autoconnect yes con-name eth1.301 ifname eth1.301 dev eth1 id 301
nmcli connection mod eth1.301 ipv4.method manual ipv4.address 192.168.31.221/24
nmcli connection mod eth1.301 ipv6.method ignore
nmcli con up eth1.301
nmcli con show

c752
(15)
nmcli connection add type ethernet autoconnect yes con-name eth1 ifname eth1
nmcli connection mod eth1 ipv4.method manual ipv4.address 192.168.31.222/24
nmcli connection mod eth1 ipv6.method ignore
nmcli con up eth1
nmcli con show

c753
Virt-Manager画面上でPCIバイスを選択
 or
virsh edit c753

  <hostdev mode='subsystem' type='pci' managed='yes'>
    <source>
      <address domain='0x0000' bus='0x04' slot='0x10' function='0x0'/>
    </source>
    <address type='pci' domain='0x0000' bus='0x00' slot='0x04' function='0x0'/>
  </hostdev>
  <hostdev mode='subsystem' type='pci' managed='yes'>
    <source>
      <address domain='0x0000' bus='0x04' slot='0x10' function='0x1'/>
    </source>
    <address type='pci' domain='0x0000' bus='0x00' slot='0x05' function='0x0'/>
  </hostdev>

(16)
nmcli connection add type bond con-name bond0 ifname bond0 mode balance-xor
nmcli connection mod bond0 ipv4.method manual ipv4.address 192.168.30.223/24
nmcli connection mod bond0 ipv6.method ignore
nmcli con show
(17)
nmcli connection add type bond-slave autoconnect yes ifname ens4 master bond0
nmcli connection add type bond-slave autoconnect yes ifname ens5 master bond0
nmcli con show
(18)
nmcli connection add type vlan autoconnect yes con-name bond0.301 ifname bond0.301 dev bond0 id 301
nmcli connection mod bond0.301 ipv4.method manual ipv4.address 192.168.31.223/24
nmcli connection mod bond0.301 ipv6.method ignore
nmcli con up bond0
nmcli con up bond0.301
nmcli con show
ip add show

lxc754
lxc config device add lxc754 eth1 nic nictype=sriov parent=ens1f0
lxc config device add lxc754 eth2 nic nictype=sriov parent=ens1f1

(19)
nmcli connection add type bond con-name bond0 ifname bond0 mode balance-xor
nmcli connection mod bond0 ipv4.method manual ipv4.address 192.168.30.224/24
nmcli connection mod bond0 ipv6.method ignore
nmcli con show
(20)
nmcli connection add type bond-slave autoconnect yes ifname eth1 master bond0
nmcli connection add type bond-slave autoconnect yes ifname eth2 master bond0
nmcli con show
(21)
nmcli connection add type vlan autoconnect yes con-name bond0.301 ifname bond0.301 dev bond0 id 301
nmcli connection mod bond0.301 ipv4.method manual ipv4.address 192.168.31.224/24
nmcli connection mod bond0.301 ipv6.method ignore
nmcli con up bond0
nmcli con up bond0.301
nmcli con show
ip add show

(1)~(10)の詳細は省略し、以下は(11)から解説します。
また、全ての出力結果を表示させると不要な設定も記載することになるため、一部省略します。

2.c750のEthernet&VLAN+IP

物理とVLANインターフェースを作成しIPをアサインします。
(11)物理インターフェースeth1とIPの設定
(12)VLANインターフェースeth1.301とIPの設定

出力結果
[root@c750 ~]# nmcli con show
NAME      UUID                                  TYPE      DEVICE
eth0      2c180c0c-76b3-4f05-b04e-546812f51811  ethernet  eth0
eth1      5e55d7f8-1db1-48d0-a954-46c996ad5533  ethernet  eth1
eth1.301  e39150fd-d1ab-42e9-8a23-d48733229b38  vlan      eth1.301
virbr0    5ee27a89-6153-4e47-9a68-dbbd1caf1e04  bridge    virbr0
[root@c750 ~]# ip add show
3: eth1:  mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
    link/ether 52:54:00:4d:da:7b brd ff:ff:ff:ff:ff:ff
    inet 192.168.30.220/24 brd 192.168.30.255 scope global noprefixroute eth1
       valid_lft forever preferred_lft forever
    inet6 fe80::5054:ff:fe4d:da7b/64 scope link
       valid_lft forever preferred_lft forever
8: eth1.301@eth1:  mtu 1500 qdisc noqueue state UP group default qlen 1000
    link/ether 52:54:00:4d:da:7b brd ff:ff:ff:ff:ff:ff
    inet 192.168.31.220/24 brd 192.168.31.255 scope global noprefixroute eth1.301
       valid_lft forever preferred_lft forever
    inet6 fe80::5054:ff:fe4d:da7b/64 scope link tentative
       valid_lft forever preferred_lft forever

3.c751のEthernet&VLAN+IP

物理とVLANインターフェースを作成しIPをアサインします。
(13)物理インターフェースeth1とIPの設定
(14)VLANインターフェースeth1.301とIPの設定

出力結果
c750とほぼ同一のため省略
異なる点は、IPアドレスの第4オクテットが221となります。

4.c752のEthernet+IP

物理インターフェースを作成しIPをアサインします。
(15)物理インターフェースeth1とIPの設定

出力結果
c750とほぼ同一のため省略
異なる点は、IPアドレスの第4オクテットが222となります。

5.c753のBonding&VLAN+IP

仮想マシン起動前にVFをアタッチします。
ホストOSのVirt-Manager上でAdd Hardwareを実施し以下の画面のようにアタッチしてください。
f:id:metonymical:20181104170919j:plain
上記画面の場合、VFのBus:Device(Slot).function番号が0000:04:10:0となっていますが、以下のようにPFとVFのBus:Device(Slot).function番号は対応しています。
ens1f0=04:10:0, 04:10:2
ens1f1=04:10:1, 04:10:3

または、ホストOS上のvirshでアタッチする場合は、以下のように設定してください。
address domain=の行がVFのBus:Device(Slot).function番号に対応しています。

# virsh edit c753

  <hostdev mode='subsystem' type='pci' managed='yes'>
    <source>
      <address domain='0x0000' bus='0x04' slot='0x10' function='0x0'/>
    </source>
    <address type='pci' domain='0x0000' bus='0x00' slot='0x04' function='0x0'/>
  </hostdev>

  <hostdev mode='subsystem' type='pci' managed='yes'>
    <source>
      <address domain='0x0000' bus='0x04' slot='0x10' function='0x1'/>
    </source>
    <address type='pci' domain='0x0000' bus='0x00' slot='0x05' function='0x0'/>
  </hostdev>

上記設定が完了した後、仮想マシンを起動して以下の設定を仮想マシン上で行ってください。
BondingインターフェースとVLANインターフェースを作成します。
(16)Bondingインターフェースbond0とIPの設定
(17)ens4とens5をBond0にアサイ
(18)VLANインターフェースbond0.301とIPの設定

出力結果
[root@c753 ~]# nmcli con show
NAME             UUID                                  TYPE      DEVICE
bond-slave-ens4  461a812f-bb8f-4046-84bb-e1e9df598a76  ethernet  ens4
bond-slave-ens5  62bd54a3-bb07-4c0a-8ca4-ed7d3ea236b7  ethernet  ens5
bond0            9962c767-59ff-41bf-b8ed-097061f6016c  bond      bond0
bond0.301        44296f6c-a9b3-4435-be5e-541a0fd5e4b9  vlan      bond0.301
eth0             2c180c0c-76b3-4f05-b04e-546812f51811  ethernet  eth0
virbr0           42ae0bd5-a46a-4e7c-8038-8711ae2aab4d  bridge    virbr0
[root@c753 ~]# ip add show
2: ens4: <\BROADCAST,MULTICAST,SLAVE,UP,LOWER_UP> mtu 1500 qdisc mq master bond0 state UP group default qlen 1000
    link/ether 16:27:f0:0c:e1:4b brd ff:ff:ff:ff:ff:ff
3: ens5: <\BROADCAST,MULTICAST,SLAVE,UP,LOWER_UP> mtu 1500 qdisc mq master bond0 state UP group default qlen 1000
    link/ether 16:27:f0:0c:e1:4b brd ff:ff:ff:ff:ff:ff
9: bond0:  mtu 1500 qdisc noqueue state UP group default qlen 1000
    link/ether 16:27:f0:0c:e1:4b brd ff:ff:ff:ff:ff:ff
    inet 192.168.30.223/24 brd 192.168.30.255 scope global noprefixroute bond0
       valid_lft forever preferred_lft forever
10: bond0.301@bond0:  mtu 1500 qdisc noqueue state UP group default qlen 1000
    link/ether 16:27:f0:0c:e1:4b brd ff:ff:ff:ff:ff:ff
    inet 192.168.31.223/24 brd 192.168.31.255 scope global noprefixroute bond0.301
       valid_lft forever preferred_lft forever
[root@c753 ~]#

6.lxc754のBonding&VLAN+IP

コンテナ起動前にVFを仮想マシンにアタッチします。
ホストOS上で以下のように設定してください。*3

# lxc config device add lxc754 eth1 nic nictype=sriov parent=ens1f0
Device eth1 added to lxc754

# lxc config device add lxc754 eth2 nic nictype=sriov parent=ens1f1
Device eth2 added to lxc754

上記設定が完了した後、コンテナを起動して以下の設定をコンテナ上で行ってください。
また、コンテナ上で事前にyum -y install NetworkManagerを実施しておいてください。
BondingとVLANインターフェースを作成します。
(19)Bondingインターフェースbond0とIPの設定
(20)eth1とeth2をBond0にアサイ
(21)VLANインターフェースbond0.301とIPの設定

出力結果
c753とほぼ同一のため省略
異なる点は、IPアドレスの第4オクテットが224となります。

8.補足1:SR-IOVを使用する場合の注意点

以下3つの注意点があります。
先に結論だけ書きますと、以下の通りとしてください。

  1. VFのMACアドレスについて:固定設定は実施しない
  2. BlackListについて:ixgbevfはBlackListに含めない
  3. VFIO-PCIについて:固定設定は実施しない
8-1.VFのMACアドレスについて

VFのMACアドレスは固定設定とせずに、オール0(ゼロ)のままの状態にしておいてください。
通常、VFのMACアドレスを明示的に固定設定とする場合、/etc/rc.localに以下のように記載しますが、全てコメントアウトしてください。

# vi /etc/rc.local

echo 2 > /sys/class/net/ens1f0/device/sriov_numvfs
echo 2 > /sys/class/net/ens1f1/device/sriov_numvfs
sleep 1
#ip link set ens1f0 vf 0 mac 00:11:22:33:44:55
#ip link set ens1f0 vf 1 mac 00:11:22:33:44:56
#ip link set ens1f1 vf 0 mac 00:11:22:33:44:57
#ip link set ens1f1 vf 1 mac 00:11:22:33:44:58
sleep 1
ip link set ens1f0 vf 0 spoofchk off
ip link set ens1f0 vf 1 spoofchk off
ip link set ens1f1 vf 0 spoofchk off
ip link set ens1f1 vf 1 spoofchk off
exit 0

MACアドレスKVMやLXC/LXD側で動的にアサインさせないと、Bondingが機能しなくなる*4ためです。

8-2.BlackListについて

BlackListを使用した場合、LXC/LXDでVFをコンテナにアタッチしようする際、エラーで弾かれます。
このため、BlackListからixgbevfはコメントアウト、または削除してください。*5

# vi /lib/modprobe.d/dist-blacklist.conf

#
# Listing a module here prevents the hotplug scripts from loading it.
# Usually that'd be so that some other driver will bind it instead,
# no matter which driver happens to get probed first.  Sometimes user
# mode tools can also control driver binding.
#
# Syntax: see modprobe.conf(5).
#

# watchdog drivers
blacklist i8xx_tco

# framebuffer drivers
blacklist aty128fb
blacklist atyfb
blacklist radeonfb
blacklist i810fb
blacklist cirrusfb
blacklist intelfb
blacklist kyrofb
blacklist i2c-matroxfb
blacklist hgafb
blacklist nvidiafb
blacklist rivafb
blacklist savagefb
blacklist sstfb
blacklist neofb
blacklist tridentfb
blacklist tdfxfb
blacklist virgefb
blacklist vga16fb
blacklist viafb

# ISDN - see bugs 154799, 159068
blacklist hisax
blacklist hisax_fcpcipnp

# sound drivers
blacklist snd-pcsp

# I/O dynamic configuration support for s390x (bz #563228)
blacklist chsc_sch

# crypto algorithms
blacklist sha1-mb

# ixgbevf driver
#blacklist ixgbevf
8-3.VFIO-PCIについて

これも理由は8-2.と同様です。
また、KVMの場合、仮想マシン起動時に動的にVFIO-PCIを使用してくれるため、明示的に設定しなくても良いようです。

options行を削除してください。

# vi /etc/modprobe.d/vfio_pci.conf

options vfio_pci ids=8086:10ed

vfio_pci行を削除してください。

# vi /etc/modules-load.d/vfio_pci.conf

vfio_pci

上記8-1~8-2の設定が完了したら、ホストOSを一旦再起動してください。

9.補足2:内部ネットワーク的な疎通可否

全体構成図を見ながら、以下のマトリックスを見てください。
VLAN300:192.168.30.0/24
f:id:metonymical:20181104205525j:plain
VLAN301:192.168.31.0/24
f:id:metonymical:20181104221832j:plain
今回は(11)~(21)にIPアドレスアサインしました。
そこからPing疎通できた箇所にはRTTを記載しました。*6
Ping疎通できなかった箇所はNGと記載しています。

上記の表より、疎通NGだった箇所*7について記載したいと思います。

9-1.VLAN300:192.168.30.0/24の表について

以下2つのフローが疎通NGでした。

  • Src:(13), Dst:(16)
  • Src:(13), Dst:(19)

PF(ens1f0)⇔VF間におけるEtherフレームの受け渡しがうまくいっていないようでした。
ens1f0でPcapした結果、(13)→(16)、(13)→(19)のarpは確認できたものの、戻りのarp replayが見えず。
一方、c753のens4&5でPcapした結果、(13)→(16)へのarp受信後、(16)→(13)へのarp replayを返送していました。
このため、ens1f0での戻りのarp replayが見えない点が怪しいものの解決に至らず。。。

9-2.VLAN301:192.168.31.0/24の表について

以下2つのフローが疎通NGでしたが、疎通不可な理由は9-1に記載した事象と同一です。

  • Src:(15), Dst:(18)
  • Src:(15), Dst:(21)

以下の通信が全滅でした。

  • Src:(14), Dst:ALL

原因は、戻りのEtherフレームにVLAN301のタグが付いていることにより、(3)から(9)へ転送されてしまうためです。
実際、(9)や(15)でPcapしたところ、(14)宛てのVLANタグ付きフレームが受信できました。

9-3.RTTから見えてくるもの

宛先がSWになっているRTTを見てください。概ね1~2ms程度です。
また、自分自身にPingを打った場合のRTTは、おおむね100μs(0.100ms)以下となっています。
それ以外のRTTは概ね900~200μs(0.9~0.2ms)程度です。
Bridgeを使用したインターフェースのRTTと比較して、SR-IOVを使用したインターフェースのRTTは全体的に短時間(500μs程度)となっています。
加えて、SR-IOVを使用した者同士のRTTはさらに短時間(200~300μs程度)となっています。

10.補足3:KVMによるVF自動アサイン設定

「6.lxc754のBonding&VLAN+IP」に記載したアタッチ方法の場合、VFを自動的にアサインしてくれますが、今回紹介したKVMでの方法は手動設定を行いました。
理由は、KVMによるVF自動アサインを行った結果、(16)(17)を作成した際にens5がLinkUpしなかったためです。
但し、仮想マシン上でBondingしない場合は有用な設定方法だと思いますので、補足として記載しておきます。

10-1.定義ファイルの作成

以下のようにxmlの定義ファイルを作成し、virshコマンドで定義ファイルを読み込ませます。

# cat > sriov_ens1f0.xml << EOF
<network>
<name>sriov_ens1f0
<forward mode='hostdev' managed='yes'>
<pf dev='ens1f0'/>
</forward>
</network>
EOF

# virsh net-define sriov_ens1f0.xml
10-2.Virt-Manager上での設定

以下の画面にて、Edit→Connection Detailsを選択
f:id:metonymical:20181104223452j:plain

以下の画面にて、Autostartにチェックを入れApplyをクリック。
左下の再生ボタン*8をクリック。
f:id:metonymical:20181104223546j:plain
以下の画面にて、AddHardwareより、「Virtual Network 'sriov_ens1f0' : Hostdev network」を選択することができるようになります。
f:id:metonymical:20181104224002j:plain

これにより、ens1f0から自動的にVFがアサインされるようになります。
1つのPF上でVFを8個や16個など作成した場合には管理が煩雑となるため、どのVFを使用しているかを意識せずに設定することが可能となります。

以上です。

10.最後に

LinuxBridge*9とSR-IOVを駆使したネットワーク構成としては、概ね網羅できたと思います。

次のステップとしては、Open vSwitchによる分散仮想スイッチ*10の構成になると考えています。
さらに、パフォーマンス面ではDPDKを使用する*11ことに加え、足回りを全てSR-IOVにすることにより、ようやく最下層における基礎/基盤の部分が構成できるようになります。
その上で、あるホストから別のホストへトラフィック*12を転送する際に、MPLSやVxLANでトラフィックを識別し、対向スイッチ上では、MP-BGPやEVPNを使用することにより、Overlayネットワークが構成できるようになります。

SDN/NFVという言葉だけがあちこちに溢れていますが、最下層の仕組みを理解せずに上物だけをやってしまうのは、とても怖い気がしています。

*1:¥(9)にてVLAN301を付与しているためUntagとなります。

*2:厳密には、KVMとLXC/LXDでVFのアタッチ方法が異なります。詳しくは補足に記載します。

*3:補足で解説しますが、LXC/LXDの場合、PF=ens1f0やens1f1を指定するだけで、自動的に空いているVFをアタッチしてくれます。

*4:見かけ上の設定では上手くいったように見えますが、IP疎通性が無くなる場合があります。また、BondingインターフェースのSlaveのうちの一つがLinkUpしてくれないといった状態になります。

*5:つまり、ホストOS上でixgbevfがmodprobeされる状態にしておいてください。

*6:送信元:スイッチに関しては、min/avg/maxRTTの表記となっています。

*7:一部考察も含みます

*8:+ボタンの右隣になる横三角のボタン

*9:仮想スイッチのことです

*10:VMWareでいうところのvDistributionSwitch

*11:所謂、OvS-DPDKのことです

*12:所謂、East-Westトラフィック

LXC/LXDコンテナ上にEPC環境構築

LXC/LXDコンテナ上にEPC環境を構築しました。
利用するEPCはNextEPCとなります。

NextEPCに含まれるサービスは以下の通りです。
mme
hss
sgw
pgw
pcrf
webui

また、以下2つの内容が理解できていることを前提に記載しますので、LXC/LXD環境などは既に構築済みの状態からスタートします。
CentOS7でLXC/LXDのコンテナ環境構築 - Metonymical Deflection
LXC/LXDコンテナのネットワーク設定方法 - Metonymical Deflection

1.環境

1-1.VMWare
筐体                             : 自作PC
CPU                           : Intel(R) Core(TM) i7-2600 CPU @ 3.40GHz
VMWare              : VMware(R) Workstation 12 Pro 12.5.9 build-7535481  
OS                               : CentOS7.5(1804)
Kernel                           : 3.10.0-862.el7.x86_64
Installed Environment Groups     : Minimal Install

WinおよびVMWare環境は以下の画像で確認してもらった方が良いかもしれません。
Win環境
f:id:metonymical:20180529200243j:plain
VMWare環境
f:id:metonymical:20181021182810j:plain

1-2.全体構成

f:id:metonymical:20181029104855j:plain
今回用意するlxcコンテナはUbuntu18.04となります。
公式サイトを読む限りCentOS7のコンテナでもいけそうなのですが、ビルドが必要っぽいので。
ロードマップには、いずれRPMも公開される旨、記載されていました。

1-3.全体の流れ

lxcコンテナ準備
NextEPCインストール
NextEPCのWebUIにアクセス

2.lxcコンテナ準備準備

2-1.Ubuntu18.04のコンテナ作成

今回はimages:からではなく、ubuntu:からコンテナイメージを引っ張ってきます。

lxc image list ubuntu: | grep 18.04
lxc launch ubuntu:18.04/amd64 lxc8041

出力例
[root@c757 ~]# lxc image list ubuntu: | grep 18.04
| b (9 more)         | 7a4f7e85f1fa | yes    | ubuntu 18.04 LTS amd64 (release) (20181024)     | x86_64  | 174.40MB | Oct 24, 2018 at 12:00am (UTC) |
| b/arm64 (4 more)   | 50fed56edee1 | yes    | ubuntu 18.04 LTS arm64 (release) (20181024)     | aarch64 | 158.29MB | Oct 24, 2018 at 12:00am (UTC) |
| b/armhf (4 more)   | bf45f28d0dca | yes    | ubuntu 18.04 LTS armhf (release) (20181024)     | armv7l  | 157.74MB | Oct 24, 2018 at 12:00am (UTC) |
| b/i386 (4 more)    | 3867042a618e | yes    | ubuntu 18.04 LTS i386 (release) (20181024)      | i686    | 176.20MB | Oct 24, 2018 at 12:00am (UTC) |
| b/ppc64el (4 more) | 852f241c93e1 | yes    | ubuntu 18.04 LTS ppc64el (release) (20181024)   | ppc64le | 182.86MB | Oct 24, 2018 at 12:00am (UTC) |
| b/s390x (4 more)   | a987004cb9f9 | yes    | ubuntu 18.04 LTS s390x (release) (20181024)     | s390x   | 166.14MB | Oct 24, 2018 at 12:00am (UTC) |
~一部省略~
[root@c757 ~]# lxc launch ubuntu:18.04/amd64 lxc8041
Creating lxc8041
Starting lxc8041
[root@c757 ~]# lxc list
+-----------+---------+---------------------+------+------------+-----------+
|   NAME    |  STATE  |        IPV4         | IPV6 |    TYPE    | SNAPSHOTS |
+-----------+---------+---------------------+------+------------+-----------+
| lxc8041   | RUNNING | 10.150.81.57 (eth0) |      | PERSISTENT |           |
+-----------+---------+---------------------+------+------------+-----------+
2-2.コンテナのネットワーク設定

lxc8041のeth1をlxdbr30にアタッチします。

lxc network list
lxc network attach lxdbr30 lxc8041 eth1
lxc network list

出力例
[root@c757 ~]# lxc network list
+---------+----------+---------+-------------+---------+
|  NAME   |   TYPE   | MANAGED | DESCRIPTION | USED BY |
+---------+----------+---------+-------------+---------+
| ens33   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens34   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| lxdbr0  | bridge   | YES     |             | 2       |
+---------+----------+---------+-------------+---------+
| lxdbr30 | bridge   | YES     |             | 0       |
+---------+----------+---------+-------------+---------+
[root@c757 ~]# lxc network attach lxdbr30 lxc8041 eth1
[root@c757 ~]# lxc network list
+---------+----------+---------+-------------+---------+
|  NAME   |   TYPE   | MANAGED | DESCRIPTION | USED BY |
+---------+----------+---------+-------------+---------+
| ens33   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens34   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| lxdbr0  | bridge   | YES     |             | 2       |
+---------+----------+---------+-------------+---------+
| lxdbr30 | bridge   | YES     |             | 1       |
+---------+----------+---------+-------------+---------+
2-3.ubuntuのネットワーク設定

lxc8041のeth1に固定IPを設定します。
IPアドレスは各自の環境に合わせてください。

[root@c757 ~]# lxc exec lxc8041 vi /etc/netplan/50-cloud-init.yaml

# This file is generated from information provided by
# the datasource.  Changes to it will not persist across an instance.
# To disable cloud-init's network configuration capabilities, write a file
# /etc/cloud/cloud.cfg.d/99-disable-network-config.cfg with the following:
# network: {config: disabled}
network:
    version: 2
    ethernets:
        eth0:
            dhcp4: true
        eth1:
            dhcp4: false
            addresses: [192.168.30.50/24]
            dhcp6: false

設定反映後にIPアドレスが設定されているかを確認し一旦再起動します。

lxc exec lxc8041 netplan apply
lxc list
lxc exec lxc8041 reboot

出力例
[root@c757 ~]# lxc exec lxc8041 netplan apply
[root@c757 ~]# lxc list
+-----------+---------+----------------------+------+------------+-----------+
|   NAME    |  STATE  |         IPV4         | IPV6 |    TYPE    | SNAPSHOTS |
+-----------+---------+----------------------+------+------------+-----------+
| lxc8041   | RUNNING | 192.168.30.50 (eth1) |      | PERSISTENT |           |
|           |         | 10.150.81.57 (eth0)  |      |            |           |
+-----------+---------+----------------------+------+------------+-----------+
[root@c757 ~]# lxc exec lxc8041 reboot

3.NextEPCインストール

3-1.NextEPCのインストール
lxc exec lxc8041 bash
apt-get update
add-apt-repository ppa:acetcom/nextepc
apt-get -y install nextepc

ホストOS上からコンテナのbashへ移動
aptアップデート
リポジトリ登録
NextEPCのインストール

注意事項
リポジトリ登録時に以下のようにEnterキーを押すよう促してくるので、そのままEnterキーを押下してください。

root@lxc8041:~# add-apt-repository ppa:acetcom/nextepc
 NextEPC is a C-language Open Source implementation of the 3GPP Evolved
?Packet Core, i.e. the core network of an LTE network.(http://nextepc.org)
 More info: https://launchpad.net/~acetcom/+archive/ubuntu/nextepc
Press [ENTER] to continue or Ctrl-c to cancel adding it.
3-2.NextEPCのWebUIインストール
curl -sL https://deb.nodesource.com/setup_8.x | sudo -E bash -
apt-get -y install nodejs
curl -sL http://nextepc.org/static/webui/install | sudo -E bash -

NodeSource Node.js 8.x のスクリプトインストール
nodejsインストール
NextEPCのWebUIインストール

3-3.サービスの有効化
systemctl enable nextepc-mmed
systemctl enable nextepc-sgwd
systemctl enable nextepc-pgwd
systemctl enable nextepc-hssd
systemctl enable nextepc-pcrfd
systemctl enable nextepc-webui
reboot

各種サービスの有効化
一旦再起動

3-4.サービスの起動確認

再起動後、サービスが起動するまで3分程度待ってください。
再起動直後のステータス

[root@c757 ~]# lxc list
+-----------+---------+----------------------+------+------------+-----------+
|   NAME    |  STATE  |         IPV4         | IPV6 |    TYPE    | SNAPSHOTS |
+-----------+---------+----------------------+------+------------+-----------+
| lxc8041   | RUNNING | 192.168.30.50 (eth1) |      | PERSISTENT |           |
|           |         | 10.150.81.57 (eth0)  |      |            |           |
+-----------+---------+----------------------+------+------------+-----------+

再起動3分後のステータス
pgwtunインターフェースが表示されていればOKです。

[root@c757 ~]# lxc list
+-----------+---------+----------------------+------------------+------------+-----------+
|   NAME    |  STATE  |         IPV4         |       IPV6       |    TYPE    | SNAPSHOTS |
+-----------+---------+----------------------+------------------+------------+-----------+
| lxc8041   | RUNNING | 45.45.0.1 (pgwtun)   | cafe::1 (pgwtun) | PERSISTENT |           |
|           |         | 192.168.30.50 (eth1) |                  |            |           |
|           |         | 10.150.81.57 (eth0)  |                  |            |           |
+-----------+---------+----------------------+------------------+------------+-----------+

4.NextEPCのWebUIにアクセス

4-1.ログイン

ログインします。

http://192.168.30.50:3000
Username:admin
Password:1423

f:id:metonymical:20181029102633j:plain
トップページ
f:id:metonymical:20181029114657j:plain

4-2.Subscriber情報の登録

IMSIの登録
f:id:metonymical:20181029114817j:plain
APNの登録
f:id:metonymical:20181029114850j:plain

以上です。

6.最後に

以下のサイトを参考にさせて頂きました。
Home - LXDドキュメント翻訳プロジェクトNextEPC | Guides | Installation
Raspberry Pi 3上にLTEコア網(Evolved Packet Core:EPC)機能を構築してみた(Raspberry Pi 3+ubuntu16.04 LTS+NextEPC)

メインは公式サイトですが、@m0ch1m0ch1さんの記事が大変良くまとめられています。

ラズパイ上で動くならコンテナ上でも動くかな?と思ってやってみましたが、何とか動くところまでは確認できました。
基地局側の環境を用意するのは、USRPなどが必要となってくるようで、少々敷居が高いのですが、タイミングをみて検証したいなと思っています。
あとはキャリアのSGWと接続テストとかやってみて上手くいきそうであれば、IoT用途に特化したPGWとしては有効活用できそうな気がしています。
また、OAI(Open Air Interface)などにも興味が湧いてきたので、折をみて検証したいなと考えています。
Home · Wiki · oai / openairinterface5G · GitLab

LXC/LXDコンテナのネットワーク設定方法

前々回の続きとなります。
前々回:CentOS7でLXC/LXDのコンテナ環境構築 - Metonymical Deflection

また、前回の内容が理解できていることを前提として記載します。
前回:Linux nmcliコマンドによるBonding VLAN Bridge Interface設定 - Metonymical Deflection

LXC/LXDコンテナは「LightweightなKVM」というイメージで使用しています。
このため、コンテナのトラフィックをBridgeで外部ネットワークに流して使用する場合の設定方法を記載したいと思います。

1.環境

1-1.VMWare
筐体                             : 自作PC
CPU                           : Intel(R) Core(TM) i7-2600 CPU @ 3.40GHz
VMWare              : VMware(R) Workstation 12 Pro 12.5.9 build-7535481  
OS                               : CentOS7.5(1804)
Kernel                           : 3.10.0-862.el7.x86_64
Installed Environment Groups     : Minimal Install

WinおよびVMWare環境は以下の画像で確認してもらった方が良いかもしれません。
Win環境
f:id:metonymical:20180529200243j:plain
VMWare環境
f:id:metonymical:20181027233404p:plain
前々回の記事に加えてNICを追加していますが、実際に使用するのはトータル3つです。
具体的には以下の通りです。
仮想ネットワークエディタ
f:id:metonymical:20181027233530p:plain
ネットワーク接続
f:id:metonymical:20181027233605p:plain
Intel I219のプロパティ
f:id:metonymical:20181027233641p:plain
WindowsによるVLAN Interface設定方法は過去記事を参照ください。
metonymical.hatenablog.com

なお、ベアメタル環境でも同様に設定可能です。

1-2.全体構成

f:id:metonymical:20181027235006j:plain
上図のうちlxdbr0はLXD init時にDefaultで作成されています。
また、Default Profileの設定よりコンテナ作成時にlxdbr0が使用されるように構成されています。

但し、lxdbr0はNATして外部ネットワークに接続されています。私の用途としては、コンテナ上でyumなどを行いたい場合のInternet接続用マネジメントインターフェースとして使用しています。

しかし、KVMライクにLXC/LXDコンテナを使用したいので、今回行う設定は(1)~(2)となります。

具体的には新規でBridge lxdbr30を作成し、コンテナlxc751を収容します。
(1)はnmcliコマンドでも設定可能ですが、ここではlxc networkコマンドを使用して設定を行っていきます。

なお、前々回の続きという想定なので、lxc751というコンテナは既に作成済みという認識で進めます。

1-2.全体の流れ ~概要~
  1. DHCPによるIP固定設定の場合:(1)(2)
  2. 手動によるIP固定設定の場合:(1)(2)

 ※
 流れというよりも、それぞれ別々の設定となります。

1-3.全体の流れ ~コマンドのみ~

以下のコマンドを投入していきます。
やりたいことが既に決まっている方は、構成図とコマンドの内容を見るだけでもよいと思います。

1.DHCPによるIP固定設定の場合
(1)
lxc network create lxdbr30 \
bridge.external_interfaces=ens34 \
ipv4.address=192.168.30.16/24 \
ipv6.address=none
(2)
lxc network attach lxdbr30 lxc751 eth1
lxc config device set lxc751 eth1 ipv4.address 192.168.30.48
lxc start lxc751
lxc exec lxc751 dhclient eth1
lxc list

lxc exec lxc751 cp /etc/sysconfig/network-scripts/ifcfg-eth0 /etc/sysconfig/network-scripts/ifcfg-eth1
lxc exec lxc751 vi /etc/sysconfig/network-scripts/ifcfg-eth1
:s/eth0/eth1/g
:wq
lxc exec lxc751 cat /etc/sysconfig/network-scripts/ifcfg-eth1
lxc restart lxc751
lxc list

2.手動によるIP固定設定の場合
(1)
lxc network create lxdbr30 \
bridge.external_interfaces=ens34 \
ipv4.address=none \
ipv6.address=none
(2)
lxc network attach lxdbr30 lxc751 eth1
lxc start lxc751
lxc exec lxc751 cp /etc/sysconfig/network-scripts/ifcfg-eth0 /etc/sysconfig/network-scripts/ifcfg-eth1
lxc exec lxc751 vi /etc/sysconfig/network-scripts/ifcfg-eth1
:s/eth0/eth1/g
:s/dhcp/none/g
IPADDR=192.168.30.48  #追記
PREFIX=24        #追記
:wq
lxc exec lxc751 cat /etc/sysconfig/network-scripts/ifcfg-eth1
lxc restart lxc751
lxc list

2.DHCPによるIP固定設定の場合

物理インターフェースとBridgeインターフェースを1対1でアサインします。
nmcliよりもコマンド数は少ないです
(1)Bridgeインターフェースlxdbr30の作成+ens34をlxdbr30にアタッチ*1
(2)lxdbr30にコンテナlxc751のeth1をアタッチ+IP設定

(1)Bridgeインターフェースlxdbr30の作成+ens34をlxdbr30にアタッチ

投入コマンド
lxc network create lxdbr30 \
bridge.external_interfaces=ens34 \
ipv4.address=192.168.30.16/24 \
ipv6.address=none

出力例
[root@c756 ~]# lxc network create lxdbr30 \
> bridge.external_interfaces=ens34 \
> ipv4.address=192.168.30.16/24 \
> ipv6.address=none
Network lxdbr30 created
[root@c756 ~]# lxc network list
+---------+----------+---------+-------------+---------+
|  NAME   |   TYPE   | MANAGED | DESCRIPTION | USED BY |
+---------+----------+---------+-------------+---------+
| ens33   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens34   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens37   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens38   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens39   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens40   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| lxdbr0  | bridge   | YES     |             | 1       |
+---------+----------+---------+-------------+---------+
| lxdbr30 | bridge   | YES     |             | 0       |
+---------+----------+---------+-------------+---------+
[root@c756 ~]# lxc network show lxdbr30
config:
  bridge.external_interfaces: ens34
  ipv4.address: 192.168.30.16/24
  ipv6.address: none
description: ""
name: lxdbr30
type: bridge
used_by: []
managed: true
status: Created
locations:
- none

lxdbr30が作成され、物理インターフェースens34にもアタッチされました。
また、コンテナに対してDHCPIPアドレス割り当てを行うため、lxdbr30自身にもIPアドレスを設定しています。

(2)lxdbr30にコンテナlxc751のeth1をアタッチ+IP設定

投入コマンドその1
lxc network attach lxdbr30 lxc751 eth1
lxc config device set lxc751 eth1 ipv4.address 192.168.30.48
lxc start lxc751
lxc exec lxc751 dhclient eth1

出力例
[root@c756 ~]# lxc network attach lxdbr30 lxc751 eth1
[root@c756 ~]# lxc config device set lxc751 eth1 ipv4.address 192.168.30.48
[root@c756 ~]# lxc start lxc751
[root@c756 ~]# lxc exec lxc751 dhclient eth1
[root@c756 ~]# lxc list
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
|  NAME   |  STATE  |         IPV4         |                     IPV6                     |    TYPE    | SNAPSHOTS |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
| lx75mas | STOPPED |                      |                                              | PERSISTENT |           |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
| lxc751  | RUNNING | 192.168.30.48 (eth1) | fd42:d3a:78c6:6d8c:216:3eff:fe8f:a6c3 (eth0) | PERSISTENT |           |
|         |         | 10.106.42.75 (eth0)  |                                              |            |           |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+

lxdbr30にコンテナlxc751のeth1をアタッチし、コンテナのIP設定を行っています。
その後コンテナを起動し、lxc751のeth1上でdhclientコマンドを実行しています。
「コンテナのIP設定」と記載しましたが厳密には異なります。
これは、LXDの管理下におかれているlxdbr30に対して、DHCP固定IP 設定を行っています。
なお、上記コマンドの場合、恒久設定ではないためコンテナ上で設定ファイルを作成します。

投入コマンドその2
lxc exec lxc751 cp /etc/sysconfig/network-scripts/ifcfg-eth0 /etc/sysconfig/network-scripts/ifcfg-eth1
lxc exec lxc751 vi /etc/sysconfig/network-scripts/ifcfg-eth1
:s/eth0/eth1/g
:wq
lxc exec lxc751 cat /etc/sysconfig/network-scripts/ifcfg-eth1
lxc restart lxc751

出力例
[root@c756 ~]# lxc exec lxc751 cp /etc/sysconfig/network-scripts/ifcfg-eth0 /etc/sysconfig/network-scripts/ifcfg-eth1
[root@c756 ~]# lxc exec lxc751 vi /etc/sysconfig/network-scripts/ifcfg-eth1
DEVICE=eth0
BOOTPROTO=dhcp
ONBOOT=yes
HOSTNAME=LXC_NAME
NM_CONTROLLED=no
TYPE=Ethernet
MTU=
DHCP_HOSTNAME=`hostname`

#コンテナのviが起動されるため、sed(:s/eth0/eth1/g)して保存(:wq)します。

[root@c756 ~]# lxc exec lxc751 cat /etc/sysconfig/network-scripts/ifcfg-eth1
DEVICE=eth1
BOOTPROTO=dhcp
ONBOOT=yes
HOSTNAME=LXC_NAME
NM_CONTROLLED=no
TYPE=Ethernet
MTU=
DHCP_HOSTNAME=`hostname`
[root@c756 ~]# lxc restart lxc751
[root@c756 ~]# lxc list
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
|  NAME   |  STATE  |         IPV4         |                     IPV6                     |    TYPE    | SNAPSHOTS |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
| lx75mas | STOPPED |                      |                                              | PERSISTENT |           |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
| lxc751  | RUNNING | 192.168.30.48 (eth1) | fd42:d3a:78c6:6d8c:216:3eff:fe8f:a6c3 (eth0) | PERSISTENT |           |
|         |         | 10.106.42.75 (eth0)  |                                              |            |           |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+

「lxc exec lxc751」によりコンテナ上でコマンドを実行できます。
ifcfg-eth0 をコピーして、DEVICE=eth1に書き換え、コンテナを再起動しています。
しばらくして、lxc listによりeth1のアドレスが取得できていればOKです。

3.手動によるIP固定設定の場合

やっていることは前項と同様です。
では、何が異なるか?と言いますと、lxdbr30にIPアドレスを設定したくない場合を想定しています。
具体的には、以下のような構成の場合です。
f:id:metonymical:20181028010926j:plain
コンテナlxc751からLBまで、LBからコンテナlxc752までをそれぞれ同一VLANとしたい場合、Bridgeインターフェース上でIPアドレスを設定してしまうと、ホストOS上のRoutingテーブルにlxdbr30とlxdbr31がconnectedで載ってきてしまうため、LBまで到達せずに内部で折り返してしまいます。
一方でnet.ipv4.ip_forwardを無効にしてしまうと、今度はlxdbr0で稼働しているNAT+Routingが動作しなくなるため、lxdbr30にIPアドレスを設定せずに構成する方法を記載します。

(1)Bridgeインターフェースlxdbr30の作成+ens34をlxdbr30にアタッチ

投入コマンド
lxc network create lxdbr30 \
bridge.external_interfaces=ens34 \
ipv4.address=none \
ipv6.address=none

出力例
[root@c756 ~]# lxc network create lxdbr30 \
> bridge.external_interfaces=ens34 \
> ipv4.address=none \
> ipv6.address=none
Network lxdbr30 created
[root@c756 ~]# lxc network list
+---------+----------+---------+-------------+---------+
|  NAME   |   TYPE   | MANAGED | DESCRIPTION | USED BY |
+---------+----------+---------+-------------+---------+
| ens33   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens34   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens37   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens38   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens39   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens40   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| lxdbr0  | bridge   | YES     |             | 1       |
+---------+----------+---------+-------------+---------+
| lxdbr30 | bridge   | YES     |             | 0       |
+---------+----------+---------+-------------+---------+
[root@c756 ~]# lxc network show lxdbr30
config:
  bridge.external_interfaces: ens34
  ipv4.address: none
  ipv6.address: none
description: ""
name: lxdbr30
type: bridge
used_by: []
managed: true
status: Created
locations:
- none

lxdbr30が作成され、物理インターフェースens34にもアタッチされました。
但し、lxdbr30自身にはIPアドレスが設定されていません。

(2)lxdbr30にコンテナlxc751のeth1をアタッチ+IP設定

投入コマンドその1
lxc network attach lxdbr30 lxc751 eth1
lxc start lxc751

出力例
[root@c756 ~]# lxc network attach lxdbr30 lxc751 eth1
[root@c756 ~]# lxc start lxc751
[root@c756 ~]# lxc list
+---------+---------+---------------------+----------------------------------------------+------------+-----------+
|  NAME   |  STATE  |        IPV4         |                     IPV6                     |    TYPE    | SNAPSHOTS |
+---------+---------+---------------------+----------------------------------------------+------------+-----------+
| lx75mas | STOPPED |                     |                                              | PERSISTENT |           |
+---------+---------+---------------------+----------------------------------------------+------------+-----------+
| lxc751  | RUNNING | 10.106.42.75 (eth0) | fd42:d3a:78c6:6d8c:216:3eff:fe8f:a6c3 (eth0) | PERSISTENT |           |
+---------+---------+---------------------+----------------------------------------------+------------+-----------+

lxdbr30にコンテナlxc751のeth1をアタッチしましたが、コンテナのIPは設定されていません。

投入コマンドその2
lxc exec lxc751 cp /etc/sysconfig/network-scripts/ifcfg-eth0 /etc/sysconfig/network-scripts/ifcfg-eth1
lxc exec lxc751 vi /etc/sysconfig/network-scripts/ifcfg-eth1
:s/eth0/eth1/g
:s/dhcp/none/g
IPADDR=192.168.30.48  #追記
PREFIX=24        #追記
:wq
lxc exec lxc751 cat /etc/sysconfig/network-scripts/ifcfg-eth1
lxc restart lxc751

出力例
[root@c756 ~]# lxc exec lxc751 cp /etc/sysconfig/network-scripts/ifcfg-eth0 /etc/sysconfig/network-scripts/ifcfg-eth1
[root@c756 ~]# lxc exec lxc751 vi /etc/sysconfig/network-scripts/ifcfg-eth1
DEVICE=eth0
BOOTPROTO=dhcp
ONBOOT=yes
HOSTNAME=LXC_NAME
NM_CONTROLLED=no
TYPE=Ethernet
MTU=
DHCP_HOSTNAME=`hostname`

#コンテナのviが起動されるため、sedで置換してIPとPrefixを追記して保存します。

[root@c756 ~]# lxc exec lxc751 cat /etc/sysconfig/network-scripts/ifcfg-eth1
DEVICE=eth1
BOOTPROTO=none
IPADDR=192.168.30.48
PREFIX=24
ONBOOT=yes
HOSTNAME=LXC_NAME
NM_CONTROLLED=no
TYPE=Ethernet
MTU=
DHCP_HOSTNAME=`hostname`
[root@c756 ~]# lxc restart lxc751
[root@c756 ~]# lxc list
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
|  NAME   |  STATE  |         IPV4         |                     IPV6                     |    TYPE    | SNAPSHOTS |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
| lx75mas | STOPPED |                      |                                              | PERSISTENT |           |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+
| lxc751  | RUNNING | 192.168.30.48 (eth1) | fd42:d3a:78c6:6d8c:216:3eff:fe8f:a6c3 (eth0) | PERSISTENT |           |
|         |         | 10.106.42.75 (eth0)  |                                              |            |           |
+---------+---------+----------------------+----------------------------------------------+------------+-----------+

ifcfg-eth0 をコピーして、DEVICE=eth1に書き換え、コンテナを再起動しています。
しばらくして、lxc listによりeth1のアドレスが表示されていればOKです。

4.補足1:nmcliコマンドでBridgeを作成した場合

nmcliコマンドでBridgeインターフェースを作成しても、lxc上で利用可能です。
しかし、nmcliコマンドで作成した場合、lxdの管理下から外れるため、以下のようにMANAGED=NOとなります。

[root@c756 ~]# lxc network list
+---------+----------+---------+-------------+---------+
|  NAME   |   TYPE   | MANAGED | DESCRIPTION | USED BY |
+---------+----------+---------+-------------+---------+
| ens33   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens34   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens37   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens38   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens39   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| ens40   | physical | NO      |             | 0       |
+---------+----------+---------+-------------+---------+
| lxdbr0  | bridge   | YES     |             | 1       |
+---------+----------+---------+-------------+---------+
| lxdbr30 | bridge   | NO      |             | 0       |
+---------+----------+---------+-------------+---------+

nmcliでBridgeを作成した場合、LXDクラスタを組んだときなどに困りそうな予感はしていますが、もう少し検証してみようと思います。

なお、LXC/LXDのネットワーク周りの設定は以下の公式サイトに詳細が記載されています。
https://lxd-ja.readthedocs.io/ja/latest/networks/

5.補足2:PortForwarding設定

コンテナ内のサービスを外部に公開したい場合、今回解説したBridgeの他に、Defaultで作成されるlxdbr0上でPortForwardingを行う方法があります。

lxc config device add lxc751 httpd proxy listen=tcp:0.0.0.0:80 connect=tcp:localhost:80

lxc751:コンテナ名
httpd:任意の名前
listen=tcp:0.0.0.0:80:ホスト側の待受けポート*2
connect=tcp:localhost:80:コンテナ側(lxc751)の待受けポート

以上です。

6.最後に

以下のサイトを参考にさせて頂きました。
Home - LXDドキュメント翻訳プロジェクト
第535回 LXD 3.0のネットワーク設定:Ubuntu Weekly Recipe|gihyo.jp … 技術評論社

LXC/LXDはコンテナ起動後、ちょいちょいいじりたい時に便利だなと思っています。
なので「LightweightなKVM」とか「KVMライク」といった使い方が、私にはマッチしています。

ちなみに、SR-IOVやCloud-initにも対応しているため、そちらの検証もやってみたいなと思います。

*1:lxcコマンドでは、アサインではなく、アタッチという言葉を使っているため統一します。

*2:IPはホストOSの物理インターフェースのIPアドレスにアクセスしてください。

Linux nmcliコマンドによるBonding VLAN Bridge Interface設定

LinuxのnmcliコマンドによるBonding、VLAN、Bridge Interfaceの設定方法をまとめました。
KVMやLXCなどで仮想マシンやコンテナを構築する前段階として、ホストOS内で構成されるNWをきちんと理解し、自分のイメージした通りに構築できるようにすることが目的です。

1.構成

1-1.全体構成

f:id:metonymical:20181026155830p:plain

構成図上に(1)~(10)までの番号を割り振りました。
この項番ごとにnmcliコマンドを投入した後の確認方法までを解説していきたいと思います。

また、補足としてbrctlコマンドについての解説も行いたいと思います。
Linuxで「Bridge」や「Bridgeインターフェース」と言った場合、それは「仮想スイッチ」*1を意味します。

しかし、本当にスイッチであるなら

  • どのスイッチポートにどのインターフェースが接続されているのか?
  • 接続したスイッチポートの先にどのMACアドレスが存在しているのか?(arpによってどんなMACアドレスを学習したのか?)

といったことが確認できるハズです。
このため、この辺りの確認方法も併せて解説します。

1-2.全体の流れ ~概要~
  1. 物理+Bridge:(1)(2)
  2. 物理+Bonding:(3)(4)(5)
  3. Bonding+Bridge:(6)(7)
  4. Bonding+VLAN+Bridge:(8)(9)(10)
1-3.全体の流れ ~コマンドのみ~

以下のコマンドを投入していきます。
やりたいことが既に決まっている方は、構成図とコマンドの内容を見るだけでもよいと思います。

1.物理+Bridge
(1)
nmcli connection add type bridge autoconnect yes con-name br1 ifname br1
nmcli connection modify br1 bridge.stp no
nmcli connection modify br1 ipv4.method disabled ipv6.method ignore
nmcli connection up br1
nmcli con show
brctl show
(2)
nmcli connection add type bridge-slave ifname ens36 master br1
nmcli con show
brctl show

2.物理+Bonding
(3)
nmcli connection add type bond con-name bond0 ifname bond0 mode balance-xor
nmcli connection mod bond0 ipv4.method disabled ipv6.method ignore
nmcli con show
(4)
nmcli connection add type bond-slave autoconnect yes ifname ens37 master bond0
nmcli con show
(5)
nmcli connection add type bond-slave autoconnect yes ifname ens38 master bond0
nmcli con show

3.Bonding+Bridge
(6)
nmcli connection add type bridge autoconnect yes con-name br0 ifname br0
nmcli connection modify br0 bridge.stp no
nmcli connection modify br0 ipv4.method disabled ipv6.method ignore
nmcli connection up br0
nmcli con show
brctl show
(7)
nmcli connection modify bond0 connection.master br0 connection.slave-type bridge
nmcli con show
brctl show

4.Bonding+VLAN+Bridge
(8)
nmcli connection add type bridge autoconnect yes con-name br301 ifname br301
nmcli connection modify br301 bridge.stp no
nmcli connection modify br301 ipv4.method disabled ipv6.method ignore
nmcli connection up br301
nmcli con show
brctl show
(9)
nmcli connection add type vlan autoconnect yes con-name bond0.301 ifname bond0.301 dev bond0 id 301
nmcli con show
brctl show
(10)
nmcli connection modify bond0.301 connection.master br301 connection.slave-type bridge
nmcli connection up bond0.301
nmcli con show
brctl show

2.物理+Bridge

物理インターフェースとBridgeインターフェースを1対1でアサインします。
(1)Bridgeインターフェースbr1の作成
(2)ens36をbr1にアサイ

(1)Bridgeインターフェースbr1の作成

投入コマンド
nmcli connection add type bridge autoconnect yes con-name br1 ifname br1
nmcli connection modify br1 bridge.stp no
nmcli connection modify br1 ipv4.method disabled ipv6.method ignore
nmcli connection up br1
nmcli con show
brctl show

出力例
[root@c752 ~]# nmcli connection add type bridge autoconnect yes con-name br1 ifname br1
Connection 'br1' (431ecf74-7476-4009-b13c-d6bb9b286697) successfully added.
[root@c752 ~]# nmcli connection modify br1 bridge.stp no
[root@c752 ~]# nmcli connection modify br1 ipv4.method disabled ipv6.method ignore
[root@c752 ~]# nmcli connection up br1
Connection successfully activated (master waiting for slaves) (D-Bus active path: /org/freedesktop/NetworkManager/ActiveConnection/13)
[root@c752 ~]# nmcli con show
NAME    UUID                                  TYPE      DEVICE
br1     431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
ens33   004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0  23ade1e4-3822-4bc9-83fd-3504ad9b5efe  bridge    virbr0
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br1             8000.000000000000       no
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

br1は作成されましたが、物理インターフェースがbr1にアサインされていない状態です。
この状態だと、仮想マシントラフィックを外部のスイッチへ流すことができません。

(2)ens36をbr1にアサイ

投入コマンド
nmcli connection add type bridge-slave ifname ens36 master br1
nmcli con show
brctl show

出力例
[root@c752 ~]# nmcli connection add type bridge-slave ifname ens36 master br1
Connection 'bridge-slave-ens36' (211c573e-7133-40c3-bba9-c3c19e751417) successfully added.
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              23ade1e4-3822-4bc9-83fd-3504ad9b5efe  bridge    virbr0
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br1             8000.000c299755f7       no              ens36
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

nmcli con showの出力にはbridge-slave-ens36が追加され、brctl showの出力にてbr1にens36がアサインされたことが確認できます。*2

3.物理+Bonding

Bondingインターフェースに2つの物理インターフェースをアサインします。
(3)Bondingインターフェースbond0の作成
(4)ens37をBond0にアサイ
(5)ens38をBond0にアサイ

(3)Bondingインターフェースbond0の作成

投入コマンド
nmcli connection add type bond con-name bond0 ifname bond0 mode balance-xor
nmcli connection mod bond0 ipv4.method disabled ipv6.method ignore
nmcli con show

出力例
[root@c752 ~]# nmcli connection add type bond con-name bond0 ifname bond0 mode balance-xor
Connection 'bond0' (25a6c049-251e-464a-87fc-6f25112c712e) successfully added.
[root@c752 ~]# nmcli connection mod bond0 ipv4.method disabled ipv6.method ignore
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              23ade1e4-3822-4bc9-83fd-3504ad9b5efe  bridge    virbr0
[root@c752 ~]#

bond0は作成されましたが、物理インターフェースがbond0にアサインされていない状態です。
この状態だと、仮想マシントラフィックを外部のスイッチへ流すことができません。

(4)ens37をBond0にアサイ

投入コマンド
nmcli connection add type bond-slave autoconnect yes ifname ens37 master bond0
nmcli con show

出力例
[root@c752 ~]# nmcli connection add type bond-slave autoconnect yes ifname ens37 master bond0
nmcli con show
Connection 'bond-slave-ens37' (7ca51b00-89fe-4e30-98d0-6588a747b5f1) successfully added.
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              23ade1e4-3822-4bc9-83fd-3504ad9b5efe  bridge    virbr0
[root@c752 ~]#

nmcli con showの出力にてbond-slave-ens37がアサインされたことが確認できます。

(5)ens38をBond0にアサイ

投入コマンド
nmcli connection add type bond-slave autoconnect yes ifname ens38 master bond0
nmcli con show

出力例
[root@c752 ~]# nmcli connection add type bond-slave autoconnect yes ifname ens38 master bond0
nmcli con show
Connection 'bond-slave-ens38' (dc260d63-0dae-4d63-ba90-66fbb57a4735) successfully added.
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond-slave-ens38    dc260d63-0dae-4d63-ba90-66fbb57a4735  ethernet  ens38
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              23ade1e4-3822-4bc9-83fd-3504ad9b5efe  bridge    virbr0
[root@c752 ~]#

nmcli con showの出力にてbond-slave-ens38がアサインされたことが確認できます。

4.Bonding+Bridge

BondingインターフェースにBridgeインターフェースをアサインします。
(6)Bridgeインターフェースbr0の作成
(7)Bond0をbr0にアサイ

(6)Bridgeインターフェースbr0の作成

投入コマンド
nmcli connection add type bridge autoconnect yes con-name br0 ifname br0
nmcli connection modify br0 bridge.stp no
nmcli connection modify br0 ipv4.method disabled ipv6.method ignore
nmcli connection up br0
nmcli con show
brctl show

出力例
[root@c752 ~]# nmcli connection add type bridge autoconnect yes con-name br0 ifname br0
Connection 'br0' (7531e688-83cd-4b97-b596-3b3b55ea2cbf) successfully added.
[root@c752 ~]# nmcli connection modify br0 bridge.stp no
[root@c752 ~]# nmcli connection modify br0 ipv4.method disabled ipv6.method ignore
[root@c752 ~]# nmcli connection up br0
Connection successfully activated (master waiting for slaves) (D-Bus active path: /org/freedesktop/NetworkManager/ActiveConnection/19)
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond-slave-ens38    dc260d63-0dae-4d63-ba90-66fbb57a4735  ethernet  ens38
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br0                 7531e688-83cd-4b97-b596-3b3b55ea2cbf  bridge    br0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              23ade1e4-3822-4bc9-83fd-3504ad9b5efe  bridge    virbr0
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br0             8000.000000000000       no
br1             8000.000c299755f7       no              ens36
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

br0は作成されましたが、bond0がbr0にアサインされていない状態です。
この状態だと、仮想マシントラフィックを外部のスイッチへ流すことができません。

(7)Bond0をbr0にアサイ

投入コマンド
nmcli connection modify bond0 connection.master br0 connection.slave-type bridge
nmcli con show
brctl show

出力例
[root@c752 ~]# nmcli connection modify bond0 connection.master br0 connection.slave-type bridge
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond-slave-ens38    dc260d63-0dae-4d63-ba90-66fbb57a4735  ethernet  ens38
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br0                 7531e688-83cd-4b97-b596-3b3b55ea2cbf  bridge    br0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              23ade1e4-3822-4bc9-83fd-3504ad9b5efe  bridge    virbr0
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br0             8000.000000000000       no
br1             8000.000c299755f7       no              ens36
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

nmcli con showの出力に変化はありません。
また、環境により、brctl showの出力にbond0が表示されない場合があります。
このような場合は、ホストOSを一旦rebootしてください。*3

reboot後の出力

[root@c752 ~]# nmcli con show
brctl show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond-slave-ens38    dc260d63-0dae-4d63-ba90-66fbb57a4735  ethernet  ens38
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br0                 7531e688-83cd-4b97-b596-3b3b55ea2cbf  bridge    br0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              0208dbe6-9eb8-4370-bd8b-227165f695db  bridge    virbr0
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br0             8000.000c29975501       no              bond0
br1             8000.000c299755f7       no              ens36
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

brctl showの出力にbond0が表示されました。

5.Bonding+VLAN+Bridge

BondingインターフェースにVLAN+Bridgeインターフェースをアサインします。
Bondingは物理が冗長化されており、複数のBridgeをアサインさせることが可能です。
その場合は、VLAN+Bridgeをセットで追加していく構成となります。
(8)Bridgeインターフェースbr301の作成
(9)VLANインターフェースbond0.301の作成+bond0.301をbond0にアサイ
(10)bond0.301をbr301にアサイ

(8)Bridgeインターフェースbr301の作成

投入コマンド
nmcli connection add type bridge autoconnect yes con-name br301 ifname br301
nmcli connection modify br301 bridge.stp no
nmcli connection modify br301 ipv4.method disabled ipv6.method ignore
nmcli connection up br301
nmcli con show
brctl show

出力例
[root@c752 ~]# nmcli connection add type bridge autoconnect yes con-name br301 ifname br301
Connection 'br301' (040c6db1-4e47-4aaa-beec-014bc14f82a6) successfully added.
[root@c752 ~]# nmcli connection modify br301 bridge.stp no
[root@c752 ~]# nmcli connection modify br301 ipv4.method disabled ipv6.method ignore
[root@c752 ~]# nmcli connection up br301
Connection successfully activated (master waiting for slaves) (D-Bus active path: /org/freedesktop/NetworkManager/ActiveConnection/11)
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond-slave-ens38    dc260d63-0dae-4d63-ba90-66fbb57a4735  ethernet  ens38
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br0                 7531e688-83cd-4b97-b596-3b3b55ea2cbf  bridge    br0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
br301               040c6db1-4e47-4aaa-beec-014bc14f82a6  bridge    br301
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              0208dbe6-9eb8-4370-bd8b-227165f695db  bridge    virbr0
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br0             8000.000c29975501       no              bond0
br1             8000.000c299755f7       no              ens36
br301           8000.000000000000       no
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

br0やbr1と同様です。
br301は作成されましたが、アップリンクとなるbond0.301がアサインされていない状態です。
この状態だと、仮想マシントラフィックを外部のスイッチへ流すことができません。

(9)VLANインターフェースbond0.301の作成+bond0.301をbond0にアサイ

投入コマンド
nmcli connection add type vlan autoconnect yes con-name bond0.301 ifname bond0.301 dev bond0 id 301
nmcli con show
brctl show

出力例
[root@c752 ~]# nmcli connection add type vlan autoconnect yes con-name bond0.301 ifname bond0.301 dev bond0 id 301
Connection 'bond0.301' (749d10a2-4900-42b5-964a-2ea146a2e7a6) successfully added.
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond-slave-ens38    dc260d63-0dae-4d63-ba90-66fbb57a4735  ethernet  ens38
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
br0                 7531e688-83cd-4b97-b596-3b3b55ea2cbf  bridge    br0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
br301               040c6db1-4e47-4aaa-beec-014bc14f82a6  bridge    br301
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              0208dbe6-9eb8-4370-bd8b-227165f695db  bridge    virbr0
bond0.301           749d10a2-4900-42b5-964a-2ea146a2e7a6  vlan      --
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br0             8000.000c29975501       no              bond0
br1             8000.000c299755f7       no              ens36
br301           8000.000000000000       no
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

nmcli con showの出力にてbond0.301が追加されたことが確認できます。
しかし、現段階ではbond0.301をUpさせていないため、DEVICEが「ーー」となっています。
また、「dev bond0」を指定することにより、bond0.301をbond0にアサインしています。
さらに、「id 301」を指定することにより、VLAN番号を指定しています。*4

(10)bond0.301をbr301にアサイ

投入コマンド
nmcli connection modify bond0.301 connection.master br301 connection.slave-type bridge
nmcli connection up bond0.301
nmcli con show
brctl show

出力例
[root@c752 ~]# nmcli connection modify bond0.301 connection.master br301 connection.slave-type bridge
[root@c752 ~]# nmcli connection up bond0.301
Connection successfully activated (D-Bus active path: /org/freedesktop/NetworkManager/ActiveConnection/13)
[root@c752 ~]# nmcli con show
NAME                UUID                                  TYPE      DEVICE
bond-slave-ens37    7ca51b00-89fe-4e30-98d0-6588a747b5f1  ethernet  ens37
bond-slave-ens38    dc260d63-0dae-4d63-ba90-66fbb57a4735  ethernet  ens38
bond0               25a6c049-251e-464a-87fc-6f25112c712e  bond      bond0
bond0.301           749d10a2-4900-42b5-964a-2ea146a2e7a6  vlan      bond0.301
br0                 7531e688-83cd-4b97-b596-3b3b55ea2cbf  bridge    br0
br1                 431ecf74-7476-4009-b13c-d6bb9b286697  bridge    br1
br301               040c6db1-4e47-4aaa-beec-014bc14f82a6  bridge    br301
bridge-slave-ens36  211c573e-7133-40c3-bba9-c3c19e751417  ethernet  ens36
ens33               004afe6f-a987-4467-a6e7-8d5d04ec3a33  ethernet  ens33
virbr0              0208dbe6-9eb8-4370-bd8b-227165f695db  bridge    virbr0
[root@c752 ~]# brctl show
bridge name     bridge id               STP enabled     interfaces
br0             8000.000c29975501       no              bond0
br1             8000.000c299755f7       no              ens36
br301           8000.000c29975501       no              bond0.301
virbr0          8000.525400701951       yes             virbr0-nic
[root@c752 ~]#

nmcli con showの出力のDEVICEにbond0.301が表示され、brctl showの出力にはbond0.301が表示されました。

6.補足1:brctlコマンドについて

先にも書きましたが、「Bridge」や「Bridgeインターフェース」は、仮想スイッチです。
このため、構成図上にもPort1やPort2と記載していますが、これらの確認方法を解説します。
結論から先に書くと、以下2つのオプションコマンドにより確認可能です。

brctl showstp br0
brctl showmacs br0

まずは構成図に記載した状態&Guest1~3を全て起動した状態にて、brctl showで確認してみます。

[root@c752 vm]# brctl show
bridge name     bridge id               STP enabled     interfaces
br0             8000.000c29975501       no              bond0
                                                        vnet1
                                                        vnet2
br1             8000.000c299755f7       no              ens36
                                                        vnet0
br301           8000.000c29975501       no              bond0.301
                                                        vnet3
virbr0          8000.525400701951       yes             virbr0-nic

ここではbr0にフォーカスします。
b0には、bond0,vnet1,vnet2の3つのインターフェースがアサインされています。
bond0は先に記載した通り、nmcliコマンドでb0にアサインしました。
vnet1やvnet2は、仮想マシンを起動させた際、起動順に動的にアサインされます。

では、これら3つのインターフェースがbr0の何番ポート*5に接続されているのでしょうか?

[root@c752 vm]# brctl showstp br0
br0
 bridge id              8000.000c29975501
 designated root        8000.000c29975501
 root port                 0                    path cost                  0
 max age                  20.00                 bridge max age            20.00
 hello time                2.00                 bridge hello time          2.00
 forward delay            15.00                 bridge forward delay      15.00
 ageing time             300.00
 hello timer               0.00                 tcn timer                  0.00
 topology change timer     0.00                 gc timer                 151.70
 flags


bond0 (1)
 port id                8001                    state                forwarding
 designated root        8000.000c29975501       path cost                100
 designated bridge      8000.000c29975501       message age timer          0.00
 designated port        8001                    forward delay timer        0.00
 designated cost           0                    hold timer                 0.00
 flags

vnet1 (2)
 port id                8002                    state                forwarding
 designated root        8000.000c29975501       path cost                100
 designated bridge      8000.000c29975501       message age timer          0.00
 designated port        8002                    forward delay timer        0.00
 designated cost           0                    hold timer                 0.00
 flags

vnet2 (3)
 port id                8003                    state                forwarding
 designated root        8000.000c29975501       path cost                100
 designated bridge      8000.000c29975501       message age timer          0.00
 designated port        8003                    forward delay timer        0.00
 designated cost           0                    hold timer                 0.00
 flags

上記コマンドにより、
 Port1=bond0
 Port2=vnet1
 Port3=vnet2
であることが確認できました。

次に各PortのMACアドレスarpにより学習したMACアドレスはどのように判別すればよいでしょうか?

[root@c752 vm]# brctl showmacs br0
port no mac addr                is local?       ageing timer
  1     00:50:56:c0:00:01       no                 6.96
  1     00:0c:29:97:55:01       yes                0.00
  1     00:0c:29:97:55:01       yes                0.00
  2     52:54:00:5d:46:f7       no               158.94
  2     fe:54:00:5d:46:f7       yes                0.00
  2     fe:54:00:5d:46:f7       yes                0.00
  3     52:54:00:1f:56:30       no               142.25
  3     fe:54:00:1f:56:30       yes                0.00
  3     fe:54:00:1f:56:30       yes                0.00

上記コマンドより、まず前提として

「port no」      :brctl showstp br0により確認したポート番号
「is local?=yes」:br0内ポートのMACアドレス*6
「is local?=no」 :arpにより学習したMACアドレス*7

となります。

次に
「is local?=yes」のMACアドレス

port no mac addr
  1     00:0c:29:97:55:01  bond0のMACアドレス
  2     fe:54:00:5d:46:f7  vnet1のMACアドレス
  3     fe:54:00:1f:56:30  vnet2のMACアドレス 

となります。

最後に
「is local?=no」のMACアドレス

port no mac addr
  1     00:50:56:c0:00:01  スイッチのPo1のMACアドレス
  2     52:54:00:5d:46:f7  Guest2のeth0のMACアドレス
  3     52:54:00:1f:56:30  Guest3のeth0のMACアドレス 

となります。

7.補足2:スイッチ側のサンプルConfig

Ciscoになってしまいますが、物理スイッチ側のサンプルConfigを乗せておきます。

ens36対向ポート(G0/0)の場合:その1

interface GigabitEthernet0/0
 switchport access vlan 100
 switchport mode access

最もオーソドックなパターンです。


ens36対向ポート(G0/0)の場合:その2

interface GigabitEthernet0/0
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110
 switchport mode trunk

Guest側でVLAN Tagを付ける場合です。
Guest側にCSR1000vとかNexus9000vなどを構築した場合、仮想ルータやスイッチ側でVLAN Tagを付けられるため、対向ポートではTrunkにします。
ちなみに、br0上ではスイッチングハブなどのようにTagを剥がされる心配はありません。


bond0対向ポート(Po1&G0/1&G0/2)の場合

interface Port-channel1
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110,301
 switchport mode trunk
 spanning-tree portfast trunk
!
interface GigabitEthernet0/1
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110,301
 switchport mode trunk
 channel-group 1 mode on
!
interface GigabitEthernet0/2
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110,301
 switchport mode trunk
 channel-group 1 mode on

図に記載した構成の場合、(9)でVLANインターフェースを作成しているため、301のTrunkは必須となります。
一方、br0は特にVLANインターフェースを経由していないため、VLAN Tagを付けるか否かは、GuestOS側に依存します。
GuestOS側でVLAN Tagを付けない場合は、 switchport trunk native vlan 100などとしてください。

あと、脱線してしまいますが、bonding modeについて少し触れておきます。
Static LAGの場合

nmcli connection add type bond con-name bond0 ifname bond0 mode balance-xor

の場合

interface GigabitEthernet0/1
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110,301
 switchport mode trunk
 channel-group 1 mode on
!
interface GigabitEthernet0/2
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110,301
 switchport mode trunk
 channel-group 1 mode on

LACPの場合

nmcli connection add type bond con-name bond0 ifname bond0 mode 802.3ad

の場合

interface GigabitEthernet0/1
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110,301
 switchport mode trunk
 channel-group 1 mode active
!
interface GigabitEthernet0/2
 switchport trunk encapsulation dot1q
 switchport trunk allowed vlan 100,110,301
 switchport mode trunk
 channel-group 1 mode active

8.補足3:GuestOS側のネットワーク設定

GuestOS側で今回作成したBridgeをアサインする場合、いくつか方法はありますが、Virt-Manager上では以下のように指定します。
f:id:metonymical:20181027132842p:plain

以上です。

9.最後に

この手の内容を記載したサイトは他にもたくさんあります。
しかし、どのコマンドを打ったときに、どの部分が作られているのかを順を追って解説したサイトは少ないように感じたので、私なりにまとめてみました。
また、過去記事ではCentOS6系の内容を記載しましたが、nmcliコマンドではなかったため新規記事として作成しました。

前回(2018/10/21に)記載したLXC/LXDのコンテナ環境構築において、ネットワーク周りの内容を記載するにあたり、前提となる知識が必要だったため、今回はLinuxのネットワーク周りについて、少し深堀りした内容にしました。

あと、SR-IOVを動かした際の構成については、次のステップとして検証したいなと思っています。

また「brctlコマンドについて」は今回の内容から少し脱線している認識があります。しかしながら、「brctlコマンドについて」の内容を理解していないと、トラブルシュートが難しくなると考えています。

何かのトラブルが発生した際、例えば、br0上のどのポートからどのMACアドレスが見えているのか?とか、br0上のどのポートをPcapすればよいのか?といったが瞬時に把握できないと、相当しんどいと思うので。

*1:ESXiでは、vSwitchと呼ばれています

*2:私としては、bridge-slaveというよりも、外部スイッチへのアップリンクポートという風に捉えています。

*3:nmcli con reloadやsystemctl reload NetworkManagerを行ってもbond0が表示されないため、rebootした方が手っ取り早いです。ちなみに、この段階でrebootするのではなく、(10)まで設定した後、最後にrebootしても問題ありません。

*4:VLAN番号を指定というよりも、私としては、bond0.301を通過するEtherフレームにVLAN301のTagを付与しているという風に捉えています。

*5:老婆心ながら、ここでいう「ポート」とは、スイッチポートの番号(G1/0/1とか)のことです。L4(TCPUDP)のポート番号ではありません。

*6:yesのMACアドレスが2つづつ表示されてる理由は私自身もあまりよくわかっていません。すいません。。。

*7:つまり、br0の各ポートの先に存在するMACアドレスとなります。このため、ageing timerが稼働しています。

CentOS7でLXC/LXDのコンテナ環境構築

CentOS7上でLXC/LXDのコンテナ環境を構築しました。
LXC/LXDはUbuntuメインですが、CentOSにおいてもsnapを使用することにより遜色なく使えたため、記事として残しておきます。

Windows版VMWareWorkstation12上でCentOS7.5を稼働させて構築しましたが、同様の手順でベアメタルサーバ上にも構築できます。

1.環境

1-1.VMWare
筐体                             : 自作PC
CPU                           : Intel(R) Core(TM) i7-2600 CPU @ 3.40GHz
VMWare              : VMware(R) Workstation 12 Pro 12.5.9 build-7535481  
OS                               : CentOS7.5(1804)
Kernel                           : 3.10.0-862.el7.x86_64
Installed Environment Groups     : Minimal Install

WinおよびVMWare環境は以下の画像で確認してもらった方が良いかもしれません。
Win環境
f:id:metonymical:20180529200243j:plain
VMWare環境
f:id:metonymical:20181021182810j:plain
50GBのOS用とは別に100GBのHDDを追加しています。
これを母体(KVMで言うホストOS)として、LXC/LXD環境を構築していきます。

1-3.全体の流れ

事前準備
Kernelのアップグレード
snapd&LXDのインストール
コンテナのインストール

2.事前準備

2-1.セキュリティ設定の無効化

firewalldとSELinuxを無効化します。

sed -i -e "s/SELINUX=enforcing/SELINUX=disabled/g" /etc/selinux/config
systemctl stop firewalld
systemctl disable firewalld

また、ここでは触れませんが、chronyなどで時刻同期を行ってください。

3.Kernelのアップグレード

Linux Containers
上記公式サイトのRequirementを読む限り、Kernel3.13以降でないとダメなようです。実際、CentOS7のKernel3.10系のままで進めると、LXDのインストール時に確実に止まってしまいます。このため、少々しんどいですが、Kernelのアップグレードを実施します。

3-1.リポジトリの登録
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm

GPG-KeyとELRepoの登録を実施。

# yum list installed | grep kernel
kernel.x86_64                         3.10.0-862.el7                   @anaconda
kernel-tools.x86_64                   3.10.0-862.el7                   @anaconda
kernel-tools-libs.x86_64              3.10.0-862.el7                   @anaconda

現在インストールされているKernelのバージョンを確認

3-2.Kernelのアップグレード
yum --enablerepo=elrepo-kernel install kernel-ml

最新Kernelのインストール*1

# awk -F\' '$1=="menuentry " {print i++ " : " $2}' /etc/grub2.cfg
0 : CentOS Linux (4.18.12-1.el7.elrepo.x86_64) 7 (Core)
1 : CentOS Linux (3.10.0-862.el7.x86_64) 7 (Core)
2 : CentOS Linux (0-rescue-626b869879714a9cbe128e5b6f85dd89) 7 (Core)

# grub2-set-default 0
# grub2-mkconfig -o /boot/grub2/grub.cfg
Generating grub configuration file ...
Found linux image: /boot/vmlinuz-4.18.12-1.el7.elrepo.x86_64
Found initrd image: /boot/initramfs-4.18.12-1.el7.elrepo.x86_64.img
Found linux image: /boot/vmlinuz-3.10.0-862.el7.x86_64
Found initrd image: /boot/initramfs-3.10.0-862.el7.x86_64.img
Found linux image: /boot/vmlinuz-0-rescue-626b869879714a9cbe128e5b6f85dd89
Found initrd image: /boot/initramfs-0-rescue-626b869879714a9cbe128e5b6f85dd89.img
done
# reboot

menuentryを確認
初期起動Kernelに4.18.12-1.el7.elrepo.x86_64を選択
grub.cfgへの反映
再起動*2

4.snapd&LXDのインストール

4-1.snapdのインストール
yum -y install epel-release && yum -y install yum-plugin-copr
yum -y copr enable ngompa/snapcore-el7 && yum -y install snapd
systemctl enable --now snapd.socket

epelとyum-plugin-coprのインストール
coprの有効化とsnapdのインストール
snapdサービスの自動起動設定

4-2.grubbyの設定
grubby --args="user_namespace.enable=1" --update-kernel="$(grubby --default-kernel)"
grubby --args="namespace.unpriv_enable=1" --update-kernel="$(grubby --default-kernel)"
sh -c 'echo "user.max_user_namespaces=3883" > /etc/sysctl.d/99-userns.conf'
reboot

詳細は省きますが、上記はいずれもnamespaceに関連したカーネルに渡す引数を設定しています。

4-3.LXDのインストール
snap search lxd

# snap search lxd
Name             Version        Developer       Notes  Summary
lxd-demo-server  0+git.f3532e3  stgraber        -      Online software demo sessions using LXD
lxd              3.6            canonical       -      System container manager and API
satellite        0.1.2          alanzanattadev  -      Advanced scalable Open source intelligence platform

上記コマンドにより、snap上でlxdが参照できています。

ln -s /var/lib/snapd/snap /snap
snap install lxd

# snap install lxd
Ensure prerequisites for "lxd" are available                            
Ensure prerequisites for "lxd" are available                            
~省略~
Download snap "core" (5662) from channel "stable"                       
Download snap "core" (5662) from channel "stable"      3% 23.2MB/s 3.87s
~省略~
Download snap "core" (5662) from channel "stable"    100% 11.2MB/s 0.0ns
Download snap "lxd" (9239) from channel "stable"                        
Download snap "lxd" (9239) from channel "stable"       2% 15.0MB/s 4.57s
~省略~
Download snap "lxd" (9239) from channel "stable"     100% 10.4MB/s 0.0ns

snapのシンボリックリンクを張る
lxdのインストール

lxdをインストールすると上記画面のように出力されます。最初はsnapdの”core”がインストールされた後、lxdのインストールが開始されます。

また、たびたび以下のエラーが出力され、lxdサービススタートに失敗してインストールが中断する場合があります。

snap install lxd

# snap install lxd
2018-10-20T23:31:34+09:00 INFO Waiting for restart...
error: cannot perform the following tasks:
- Copy snap "lxd" data (remove /var/snap/lxd/common/ns/shmounts: device or resource busy)
- Start snap "lxd" (9239) services ([start snap.lxd.daemon.unix.socket] failed with exit status 1: Job for snap.lxd.daemon.unix.socket failed. See "systemctl status snap.lxd.daemon.unix.socket" and "journalctl -xe" for details.)

その際は、気にせず以下のコマンドを2~3回、少し時間をおきながら繰り返してみてください。

snap install lxd

以下のコマンドによりlxdがインストールされていればOKです。

snap list

# snap list
Name  Version    Rev   Developer  Notes
core  16-2.35.4  5662  canonical  core
lxd   3.6        9239  canonical  -

5.コンテナのインストール

5-1.コンテナ格納用ストレージの準備

追加の100GBストレージをfdiskしておきます。
これにより、/dev/sdb1が作成されます。このパーティションはlxd初期設定時に設定します。

fdisk /dev/sdb
n
t
w

fdisk実施
パーティションを作成
パーティションシステムIDの設定
パーティション保存

5-2.lxd初期設定

以下のコマンドにより、初期設定が開始されます。

lxd init

# lxd init
Would you like to use LXD clustering? (yes/no) [default=no]: 
Do you want to configure a new storage pool? (yes/no) [default=yes]: 
Name of the new storage pool [default=default]: 
Name of the storage backend to use (btrfs, ceph, dir, lvm) [default=btrfs]: 
Create a new BTRFS pool? (yes/no) [default=yes]: 
Would you like to use an existing block device? (yes/no) [default=no]: yes
Path to the existing block device: /dev/sdb1
Would you like to connect to a MAAS server? (yes/no) [default=no]: 
Would you like to create a new local network bridge? (yes/no) [default=yes]: 
What should the new bridge be called? [default=lxdbr0]: 
What IPv4 address should be used? (CIDR subnet notation, “auto” or “none”) [default=auto]: 
What IPv6 address should be used? (CIDR subnet notation, “auto” or “none”) [default=auto]: 
Would you like LXD to be available over the network? (yes/no) [default=no]: 
Would you like stale cached images to be updated automatically? (yes/no) [default=yes] 
Would you like a YAML "lxd init" preseed to be printed? (yes/no) [default=no]: 

基本的にはEnterで進めてOKですが、前項で作成したパーティションをコンテナ格納用ストレージとして使用する場合は、上記赤文字のように指定してください。

5-3.コンテナイメージファイルの確認
lxc image list images:

# lxc image list images:
If this is your first time running LXD on this machine, you should also run: lxd init
To start your first container, try: lxc launch ubuntu:18.04
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
|             ALIAS             | FINGERPRINT  | PUBLIC |               DESCRIPTION                |  ARCH   |   SIZE   |          UPLOAD DATE          |
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
| alpine/3.4 (3 more)           | cc8b58012122 | yes    | Alpine 3.4 amd64 (20180627_17:50)        | x86_64  | 2.04MB   | Jun 27, 2018 at 12:00am (UTC) |
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
| alpine/3.4/armhf (1 more)     | 7813a1299900 | yes    | Alpine 3.4 armhf (20180627_17:50)        | armv7l  | 1.63MB   | Jun 27, 2018 at 12:00am (UTC) |
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
| alpine/3.4/i386 (1 more)      | 612c3ece0803 | yes    | Alpine 3.4 i386 (20180627_17:50)         | i686    | 1.88MB   | Jun 27, 2018 at 12:00am (UTC) |
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
| alpine/3.5 (3 more)           | 0381c3c01c04 | yes    | Alpine 3.5 amd64 (20181004_13:00)        | x86_64  | 3.05MB   | Oct 4, 2018 at 12:00am (UTC)  |
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
| alpine/3.5/arm64 (1 more)     | ec3eb4f0dd1e | yes    | Alpine 3.5 arm64 (20181004_13:28)        | aarch64 | 2.96MB   | Oct 4, 2018 at 12:00am (UTC)  |
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
~省略~
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+
|                               | ff280c2bb726 | yes    | Ubuntu-Core 16 i386 (20180925_19:01)     | i686    | 211.07MB | Sep 25, 2018 at 12:00am (UTC) |
+-------------------------------+--------------+--------+------------------------------------------+---------+----------+-------------------------------+

上記コマンドにより、Linux Containersにアップロードされているコンテナイメージを参照することができます。
膨大な数がありますので、ここではgrepしてcentosに絞って参照してみます。

lxc image list images: | grep -i centos

# lxc image list images: | grep -i centos
| centos/6 (3 more)             | fa9b42139279 | yes    | Centos 6 amd64 (20181004_02:16)          | x86_64  | 75.55MB  | Oct 4, 2018 at 12:00am (UTC)  |
| centos/6/i386 (1 more)        | fbcfebb4cd8e | yes    | Centos 6 i386 (20181004_02:16)           | i686    | 75.79MB  | Oct 4, 2018 at 12:00am (UTC)  |
| centos/7 (3 more)             | 15089a354969 | yes    | Centos 7 amd64 (20181004_02:16)          | x86_64  | 83.47MB  | Oct 4, 2018 at 12:00am (UTC)  |
|                               | 029f614a0679 | yes    | Centos 7 amd64 (20181002_02:16)          | x86_64  | 83.47MB  | Oct 2, 2018 at 12:00am (UTC)  |
|                               | 19dcb4a810a0 | yes    | Centos 7 amd64 (20181003_02:16)          | x86_64  | 83.47MB  | Oct 3, 2018 at 12:00am (UTC)  |
|                               | 99deb61e666e | yes    | Centos 6 i386 (20181003_02:16)           | i686    | 75.79MB  | Oct 3, 2018 at 12:00am (UTC)  |
|                               | d4afdb0e3995 | yes    | Centos 6 amd64 (20181003_02:16)          | x86_64  | 75.55MB  | Oct 3, 2018 at 12:00am (UTC)  |
|                               | f47e537c7032 | yes    | Centos 6 amd64 (20181002_02:16)          | x86_64  | 75.55MB  | Oct 2, 2018 at 12:00am (UTC)  |
|                               | fc3ce1c88403 | yes    | Centos 6 i386 (20181002_02:16)           | i686    | 75.79MB  | Oct 2, 2018 at 12:00am (UTC)  |
5-4.コンテナのインストール
lxc launch images:centos/7/amd64 lxc751

# lxc launch images:centos/7/amd64 lxc751
Creating lxc751
Retrieving image: metadata: 100% (3.20GB/s)                                            
Retrieving image: rootfs: 1% (490.01kB/s)                                            
Retrieving image: rootfs: 2% (687.27kB/s)                                            
~省略~
Retrieving image: rootfs: 100% (3.14MB/s)                                            
Starting lxc751

上記コマンドによりcentos7のコンテナインストールが完了します。
公開サーバの「images:centos/7/amd64」からイメージをDLします。
初回はDLするのに2~3分程度かかりますが、2回目以降はローカルに保存されたコンテナイメージから展開されるため早いです。
また上記の例ではコンテナに「lxc751」という名前付与しています。

起動したコンテナは以下のように確認できます。

lxc list 

# lxc list 
+--------+---------+-----------------------+--------------------------------------------+------------+-----------+
|  NAME  |  STATE  |         IPV4          |                    IPV6                    |    TYPE    | SNAPSHOTS |
+--------+---------+-----------------------+--------------------------------------------+------------+-----------+
| lxc751 | RUNNING | 10.164.132.246 (eth0) | fd42:45:88ee:25a6:216:3eff:fe60:6a5 (eth0) | PERSISTENT |           |
+--------+---------+-----------------------+--------------------------------------------+------------+-----------+
5-5.コンテナのbashへ移動
lxc exec lxc751 bash

# lxc exec lxc751 bash
[root@lxc751 ~]# 
[root@lxc751 ~]# ip add show
1: lo:  mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host 
       valid_lft forever preferred_lft forever
5: eth0@if6:  mtu 1500 qdisc noqueue state UP group default qlen 1000
    link/ether 00:16:3e:60:06:a5 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 10.164.132.246/24 brd 10.164.132.255 scope global dynamic eth0
       valid_lft 3269sec preferred_lft 3269sec
    inet6 fd42:45:88ee:25a6:216:3eff:fe60:6a5/64 scope global mngtmpaddr dynamic 
       valid_lft 3328sec preferred_lft 3328sec
    inet6 fe80::216:3eff:fe60:6a5/64 scope link 
       valid_lft forever preferred_lft forever

上記コマンドにより、ホストOS上からコンテナのbashへ移動できます。
IPアドレスが先に参照したlxc listで起動中のコンテナと同様であることが確認できます。

以上です。

6.最後に

以下のサイトを参考にさせて頂きました。
Home - LXDドキュメント翻訳プロジェクト
How to Set Up and Use LXD on CentOS Linux 7.x Server - nixCraft
LXCで学ぶコンテナ入門 -軽量仮想化環境を実現する技術:連載|gihyo.jp … 技術評論社

gihyo.jpの記事は大変よくまとまっており、LXC/LXDのアーキテクチャもさることながら、コンテナ技術そのものやNamespace機能に関する理解が深まりますので、ぜひご一読ください。

先にも書きましたが、LXC/LXDはcanonicalが推し進めていることもありUbuntuがメインとなります。ただ、CentOS7に触れる記事がとても少なかったので、残しておきたいなと思いました。

今回はLXC/LXDのインストールとコンテナのインストールまででしたが、次回はコンテナのネットワーク周りについて書きたいと思います。私は本職がNWエンジニアなので、ここが一番の肝になってくるため、Linuxのネットワーク周りについても触れたいと思っています。

lxc networkコマンドで作成したブリッジの場合、私の使い方にはあまりマッチしなかったため、nmcliコマンドでブリッジを作成した場合についても併せて書きたいと思います。

*1:2018/10/21現在、リポジトリの参照先サーバによって、Kernel4.18.12やKernel4.18.14、Kernel4.18.15などがインストールされますが、いずれも支障はありません。

*2:過去記事で書いたNVMe-oF Target構築の際、SPDKをビルドする必要があったため、kernel-tools-libs kernel-toolsなどもアップグレードしましたが、LXC/LXDではビルドが不要なため、このまま再起動してしまいます。

CentOS7でBIG-IP VEのセットアップ

CentOS7でF5 BIG-IP VEのセットアップを実施したため、その手順を記載しておきます。

BIG-IP VEはqcow2ファイルからイメージを読み込むため、n9kvライクなインストール方法となります。

以下の公式Docに沿って記載したいと思います。
AskF5 | Manual: BIG-IP Virtual Edition 13.1.0 and Linux KVM: Setup


また、足回りとしては、virtioとSR-IOVの両方で構成可能です。
しかし、インストール後(正確にはトライアルライセンスのアクティベーション後)には変更できないため、最初に構成を決めてから足回り数を決定してください。

1.環境

筐体                             : ProLiant DL360e Gen8
System ROM                       : P73 01/22/2018
NIC                              : Intel X540-AT2
OS                               : CentOS7.5(1804)
Kernel                           : 3.10.0-862.el7.x86_64
Installed Environment Groups     : Server with GUI
Add-Ons for Selected Environment : Virtualization Client, Virtualization Hypervisor, Virtualization Tools 

2.BIG-IP VEのインストール

virt-managerによるGUIでのインストール方法をご紹介します。
IPMIなどが無ければ、tigervncなどを起動させておきましょう。*1

まずはqcow2ファイルを/var/lib/libvirt/images/直下にコピー

cp BIGIP-14.0.0.2-0.0.2.qcow2 /var/lib/libvirt/images/
2-1.virt-managerによるインストール

File>New Virtual Machineを選択
f:id:metonymical:20180428192118j:plain

Import existing disk imageを選択して、Forwardをクリック
f:id:metonymical:20181017125053j:plain

Browse...をクリック
f:id:metonymical:20181017125115j:plain

前項でコピーしたBIGIP-14.0.0.2-0.0.2.qcow2を選択して、Choose Volumeをクリック*2
f:id:metonymical:20181017125135j:plain

OS typteはLinux、VersionはRHEL6.9を選択して、Forwardをクリック
f:id:metonymical:20181017125225j:plain

下図の通りであることを確認して、Forwardをクリック
メモリは最低2GBで起動します。
CPUsは最低1で起動します
f:id:metonymical:20181017125320j:plain

Nameに任意の名前を入力
Customize configuration before installにチェック(必須)
Network selectionは任意のインターフェースを選択(mgt用なので後で変更可)
f:id:metonymical:20181017125354j:plain

Device modelにvirtioを選択(必須)
Applyをクリック
HAを構成する場合、NICは最低でもあと3つ必要(できれば4つ必要)です。このため、AddHardwareをクリックして上記画面と同様にNICを追加していきましょう。
f:id:metonymical:20181017125419j:plain

SR-IOVのVFを追加する場合
画面左下のAdd Hardwareをクリック
PCI Host Deviceを選択
任意のVirtualFunctionを選択*3
Finishをクリック
f:id:metonymical:20181017125502j:plain

Begin Installationをクリックすると、自動的にインストールが進みます。
f:id:metonymical:20181019121711j:plain

インストールが完了すると、ログイン画面となります。
login名:root
Passwd:default
f:id:metonymical:20181017130202j:plain
ログインすると、パスワード変更を促されます。
(current)UNIX password:default
New BIG-IP password:任意のパスワード1
Retype new BIG-IP password:任意のパスワード1
f:id:metonymical:20181017130239j:plain
すると、プロンプトが表示されます。
f:id:metonymical:20181017130259j:plain
プロンプトが表示されたら、以下のコマンドによりBIG-IPのMgmtインターフェースのIPを確認します。このとき、同一LAN内でDHCPサーバを起動しておけば自動的にIPアドレスを取得してくれます。

tmsh
show sys ip-address

以下出力のうち、cm deviceがIP(この例では、192.168.11.14)となります。
f:id:metonymical:20181017130403j:plain

2-2.Web画面での初期アカウント設定

ホストOSまたは同一LAN内からブラウザを開き、BIG-IPにアクセスします。*4

https://BIG-IPのIPアドレス/

以下のログイン画面が表示されますので、ユーザ名とパスワードを入力。
Username:admin
Password:任意のパスワード1
f:id:metonymical:20181017130514j:plain
パスワード変更を促されます。*5
Current Password:任意のパスワード1
New Password:任意のパスワード2
Confirm:任意のパスワード2
f:id:metonymical:20181017130547j:plain
改めて、ログイン画面が表示されます。
Username:admin
Password:任意のパスワード2
f:id:metonymical:20181017130637j:plain
ログイン後の画面は以下の通りです。
この画面より初期設定ウィザードに従い、トライアルライセンスのアクティベーションなどを行っていきます。
f:id:metonymical:20181017130708j:plain

3.BIG-IP VEの足回りに関する留意事項

3-1.MACアドレスについて

VirtIOの場合、NIC追加時に表示された*6MACアドレスがそのまま継承されます。また、SR-IOVの場合は、VFに対して任意に設定したMACアドレスがそのまま継承されます。このため、VFにMACアドレスを事前設定しておいてください。Defaultではオール0(ゼロ)となってしまうので。

3-2.インターフェース数について

最低限必要とされる数は以下のようです。
Management×1
Internal×1
External×1
HA×2
上記のうち、Managementはインターネット接続可能&DNSのLookUpが可能な状態にしておかなければなりません。なぜならば、アクティベーションで必須となるからです。

以上です。

4.最後に

インストール自体は至ってシンプルなのですが、パスワード周りを整理しておかないと後々になってログインできなくなるため、任意のパスワード1&2という風に記載を分けました。また、今回はインストールのみでしたが、今度はHA構成の設定についても別途記事を書ければなと思っています。

*1:VNCサーバのインストール方法について、ここではあえて触れません、あしからず。

*2:ここではBIGIP-14.0.0.2-0.0.2.qcow2をさらにコピーして、bigip02.qcow2を選択しています。BIGIP-14.0.0.2-0.0.2.qcow2をマスターイメージとするためです。

*3:SR-IOVの設定は事前に行っておいてください。 metonymical.hatenablog.com

*4:httpsであることに注意してください。httpでアクセスしてもhttpsにリダイレクトとかしてくれません。

*5:任意のパスワード1よりも任意のパスワード2の方がパスワードの複雑性要件が厳しくなっているため、それなりの強度のパスワードを準備しておいてください。

*6:qemuが自動付与したMACアドレス

PPPoE Client LAN型(固定Prefix)設定で全アドレス使用

PPPoEのLAN型固定Prefixで/29などをISPから払い出された際、ネットワークアドレスやブロードキャストアドレスも含む、全てのGlobalIPを使い切る方法となります。

1.構成

f:id:metonymical:20180728192124j:plain

今回の例では、ISPから25.0.0.16/29のLAN型固定Prefixを払い出された想定でConfigを作成しています。

ルータを2台構成としています。

  1. PPPoE終端+StaticNATをするルータ=RT13
  2. 本来GlobalIPを割り当てたいルータ=RT03

回線はフレッツ光ネクストを使用しており、複数のISPとLAN型固定Prefixの契約して試行しましたが、いずれも成功しています。

四の五の説明するより、Configを見てもらった方が早いと思います。

2.RT13のConfig

!
hostname RT13
!
interface GigabitEthernet0
 switchport access vlan 10
 no ip address
!
interface GigabitEthernet8
 no ip address
 duplex auto
 speed auto
 pppoe enable group global
 pppoe-client dial-pool-number 1
!
interface Vlan10
 ip address 192.168.10.1 255.255.255.0
 ip nat inside
 ip virtual-reassembly in
 ip tcp adjust-mss 1414
!
interface Dialer1
 mtu 1492
 ip unnumbered Vlan10
 ip mtu 1454
 ip nat outside
 ip virtual-reassembly in
 encapsulation ppp
 dialer pool 1
 dialer-group 1
 ppp authentication chap callin
 ppp chap hostname ユーザ名
 ppp chap password パスワード
 ppp pap refuse
 ppp ipcp route default
 no cdp enable
!
ip nat inside source static 192.168.10.16 25.0.0.16
!
dialer-list 1 protocol ip permit
!
access-list 1 permit any
!
end
!

PPPoE終端の設定はおなじみですが、異なる点は1対1のStaticNATをしている点です。

3.RT03のConfig

!
hostname RT03
!
interface GigabitEthernet0
 switchport access vlan 20
 no ip address
!
interface GigabitEthernet8
 ip address 192.168.10.16 255.255.255.0
 ip nat outside
 ip virtual-reassembly
 duplex auto
 speed auto
!
interface Vlan20
 ip address 192.168.20.1 255.255.255.0
 ip nat inside
 ip virtual-reassembly
!
!
ip route 0.0.0.0 0.0.0.0 192.168.10.1
!
ip nat pool GIP 192.168.10.16 192.168.10.16 netmask 255.255.255.0
ip nat inside source list 1 pool GIP overload
!
access-list 1 permit 192.168.20.0 0.0.0.255
!
end

RT03では、G8をWAN側インターフェースとしていますが、GlobalIPではなく、RT13のStaticNATで設定したPrivateIPをインターフェースに設定し、そのIP(=192.168.10.16)でoverloadさせてしまいます。

4.RT13のRoutingテーブルとNATテーブル

RT13#show ip a route
Codes: L - local, C - connected, S - static, R - RIP, M - mobile, B - BGP
       D - EIGRP, EX - EIGRP external, O - OSPF, IA - OSPF inter area 
       N1 - OSPF NSSA external type 1, N2 - OSPF NSSA external type 2
       E1 - OSPF external type 1, E2 - OSPF external type 2
       i - IS-IS, su - IS-IS summary, L1 - IS-IS level-1, L2 - IS-IS level-2
       ia - IS-IS inter area, * - candidate default, U - per-user static route
       o - ODR, P - periodic downloaded static route, H - NHRP, l - LISP
       a - application route
       + - replicated route, % - next hop override, p - overrides from PfR

Gateway of last resort is 1.1.1.1 to network 0.0.0.0

S*    0.0.0.0/0 [1/0] via 1.1.1.1
      1.1.0.0/32 is subnetted, 1 subnets
C        1.1.1.1 is directly connected, Dialer1
      192.168.10.0/24 is variably subnetted, 2 subnets, 2 masks
C        192.168.10.0/24 is directly connected, Vlan10
L        192.168.10.1/32 is directly connected, Vlan10

RT13#show ip nat translations 
Pro Inside global   Inside local        Outside local    Outside global
tcp 25.0.0.16:2598  192.168.10.16:2598  23.219.39.17:80  23.219.39.17:80
tcp 25.0.0.16:2599  192.168.10.16:2599  77.234.41.34:80  77.234.41.34:80
tcp 25.0.0.16:2600  192.168.10.16:2600  77.234.42.50:80  77.234.42.50:80

DefaultRouteのNexthopが1.1.1.1となっていますが、ppp ipcp route defaultの設定により、ISPとのPPPoEセッション時にネゴっているため、PPPoEを張るたびに変化します。
ちなみに、

ip route 0.0.0.0 0.0.0.0 Dialer1

とした場合、
CEFが使用されない(Fastスイッチングになってしまう)らしいので、ppp ipcp route defaultを使用しています。

5.RT03のRoutingテーブルとNATテーブル

RT03#show ip route
Codes: C - connected, S - static, R - RIP, M - mobile, B - BGP
       D - EIGRP, EX - EIGRP external, O - OSPF, IA - OSPF inter area 
       N1 - OSPF NSSA external type 1, N2 - OSPF NSSA external type 2
       E1 - OSPF external type 1, E2 - OSPF external type 2
       i - IS-IS, su - IS-IS summary, L1 - IS-IS level-1, L2 - IS-IS level-2
       ia - IS-IS inter area, * - candidate default, U - per-user static route
       o - ODR, P - periodic downloaded static route

Gateway of last resort is 192.168.10.1 to network 0.0.0.0

S*   0.0.0.0/0 [1/0] via 192.168.10.1
     192.168.10.0/24 is subnetted, 1 subnets
C       192.168.10.0 is directly connected, GigabitEthernet8
C    192.168.20.0/24 is directly connected, Vlan20

RT03#show ip nat translations 
Pro Inside global       Inside local        Outside local    Outside global
tcp 192.168.10.16:2598  192.168.20.10:2598  23.219.39.17:80  23.219.39.17:80
tcp 192.168.10.16:2599  192.168.20.10:2599  77.234.41.34:80  77.234.41.34:80
tcp 192.168.10.16:2600  192.168.20.10:2600  77.234.42.50:80  77.234.42.50:80

RT13がGlobalIPにNAT変換してくれるので、RT03は192.168.10.16をGlobalIPと見立ててPATしているだけです。

6.補足

Vlan10に複数のルータやサーバを追加していきたい場合、RT13で以下のように設定してください。

 ip nat inside source static 192.168.10.17 25.0.0.17
 ip nat inside source static 192.168.10.18 25.0.0.18
 ・・・
 ip nat inside source static 192.168.10.23 25.0.0.23 ←ブロードキャストアドレスも可

ISP側ルータのRoutingテーブル上、25.0.0.16/29のNexthopがPPPoEクライアント側に向いているため、25.0.0.16(ネットワークアドレス)や25.0.0.23(ブロードキャストアドレス)を使用したとしても、25.0.0.16/29の範囲に入っていれば、当然RT13側に戻してくれます。

以上です。

7.最後に

以下のサイトを参考にさせて頂きました。
技術的な解説が詳細に記載されており、最初拝読させて頂いたときは完全に目から鱗でした。
milestone-of-se.nesuke.com

今までは、RT03に相当する機器でDefaultRouteのNexthopが必要という理由だけで、盲目的にRT13のVLAN10に相当するインターフェースでGlobalIPを付与しておりました。しかし、上記サイトを読んだ結果、GlobalIPを浪費してしまっていたんだな、と猛省しました。。。

ちなみに以前、本Blogで紹介した
metonymical.hatenablog.com
の構成で、
試しにIPSecやTunnnelインターフェース上でBGPピアを張ってみましたが、正常に疎通確認が取れました。
また、RT13がGlobalIPを持っていないため、ちょっとセキュア(?)になっている点がとても気に入っており、まずはラボで利用してみて商用稼働できるかを見極めていきたいなと考えています。