2025-07-30-08-01 JANOG56 参加レポート
キーワードをこのレポートにメモったので、今後見直して反芻していきたい。
Day1
不参加。
Day2
AI/ML基盤における800GbEスイッチ導入とその挑戦
既存が 400G スイッチで、800G スイッチを追加導入
400G で増設 or 800G 導入
- 800G で決定
- 400G が余るのは避けたいため、有効活用したい
- 混在構成で行けないか ?
400G / 800G 混在の課題
OS / ASIC が別
負荷分散のメソッドをどうするか
- ADaptive Routing / Dynamic Load Balancing
なるべく Spine を通したくない
- NCCL_CROSS_NIC = 0 で NIC を使用すると同じ Ring で同じ NIC ポートを使用
性能劣化発生 !
Spine - Leaf に想定よりも多くのトラフィックが
- NVIDIA DGX H100 と Dell XE9680 と 2 種類の GPU サーバを採用
NIC の見え方 (例:enp64s0) がサーバの種類で異なる
物理系の話
800G 64 ポートスイッチを 400G 128 ポートスイッチとして使用
MPO ケーブルとトランシーバのプルタブが干渉、MPO 抜栓時にトランシーバも抜けてしまった
ポート番号が分かりづらい
- 上段は若番が左側に、下段は若番が右側に
1U MPO-12 32 ポートは高密度すぎる
- SN-MT コネクタで小型化
- ポート密度が 4 倍に
- ラック間ケーブル本数を半分に
- クリーナが別なのがつらみ
マルチベンダー Lossless
Dell SN4700 と Juniper QFX5240 を使用
- QFX5240 の Broadcom ASIC では Adaptive Routing (AR) 使用不可、Dynamic Load Balacing (DLB) を使用する
DLB の inactiveity-interval
長すぎる場合は負荷分散が弱く、短すぎると Reorder で順番が入れ替わってしまう
- 常に最良の結果を出せる値は存在しない
- 自動化される機能があれば採用したい
筆者注 : この機能は Juniper
監視基盤
QFX5420 / Junos : gNMIc でテレメトリーデータを取得 @ 2 秒間隔
SN4700 / Cumulus Linux : OpenTelemetry で取得 @ 2 秒間隔
- gNMIc は 15 秒間隔で採用できなかった
Q&A
GPU 間トラフィックの NVLINK でどこを通るのか、どうやって調べたのか ?
- NCCL のデバッグログを人の目で見て、気合で解析
検証機と予算はどのように確保している ?
- ベンダーさんから借用 or 予備機で検証環境を作る
少量の Loss があったほうがかえってパフォーマンスが高い場合もあるそうだが、テスト手法についてどのような展望を持っているか ?
- 今後議論していきたいところです
経路ハイジャックに一撃、RPKI ROA
資料
IPv4 枯渇
2010 年頃に枯渇、APNIC では 103. から始まるアドレスを配布
/23 までならまだ申請で入手可能
2023/10 に返却されたアドレスの再利用を開始
連絡が取れず回収した PI アドレスもあり
未使用 IP アドレスが勝手に使用されてしまう話
JANOG49 で発表あり
実際に使用されてしまった例あり
RPKI
経路ハイジャックで、/21 や /23 で他組織のアドレスを広報していた組織あり
- IRR の RADB に Customer Prefix として登録されてしまっており、フィルタをくぐり抜けていた
RPKI Origin Authorization (ROA) や Route Origin Validation (ROV) で検証する
- IRR Explorler や BGP.tools で ROA や IRR の登録状況を見ることができる
IP アドレスを持っている組織に確認し、AS0 ROA を発行し、インターネット上で広報されない、という動作を行った
- 悪意ある組織が瞬時に使用できなくなった
- 結構たくさんの AS で RPKI/ROA を導入していた
- 経路が残るところもあった
- ROV されていない広告 Path を抜けている
- 顧客から受信しちゃってる上流
- Invalid と直接ピアしている組織
ROA が間違っていると通信が止まってしまうため、変更は要注意
ENOG で JPNIC がガイドラインを発表済み
APNIC では、2020 年に未割り当て IP に AS0 の ROA を作成
- JPNIC も検討中