障害内容 → 部品交換

障害内容(2025/12/23)

  1. nvme1n1p2(root)が“進行性”に壊れている
    EXT4-fs (nvme1n1p2): error count since last fsck: 2 → 25 → 48 → 77 → 106 → 149
    1. fsck していないのに エラーカウントが増え続けている
    2. 同じ inode / block を何度も壊す
    3. 👉 メディア上の同一物理領域が不安定
  2. ext4 の「チェックサム破壊」+「inode out of bounds」
    Directory block failed checksum
    inode out of bounds
    bad entry in directory
    1. これはソフトウェアバグではほぼ起きない
    2. メモリ化けだけでもここまで繰り返さない
    3. 👉 ストレージ層でのビット化けを強く示唆
  3. dpkg / apport / unattended-upgr が巻き添えで死んでいる
    comm dpkg
    comm apport
    comm unattended-upgr
    1. ランダムではなく「書き込みが多い領域」から壊れる
    2. /var/lib/dpkg が最初に死ぬのは典型

交換前のディスクレイアウト(実メディアのみ)

[KGB2] munakata:~$ df -h
Filesystem Size Used Avail Use% Mounted on 
/dev/nvme1n1p2 457G 49G 385G 12% / 
/dev/nvme1n1p1 1.1G 6.2M 1.1G 1% /boot/efi 
/dev/nvme0n1p1 3.6T 1.7T 1.8T 49% /dtv_recipe 
/dev/md0 7.3T 2.9T 4.0T 43% /raid_vol 
/dev/sdc1 15T 8.3T 5.5T 61% /dtv_h264B 
/dev/sdd1 13T 5.6T 6.5T 47% /dtv_h264A 
/dev/sde1 13T 8.1T 4.0T 68% /dtv_h264C

交換部品(nvme1n)

リカバリー準備

ファイルバックアップ → / 以外のHDDをすべて切断

リカバリー(環境)

OS re-install

RAID0

その他 HDD/SSD リカバリー → ディスク認識

sshd 有効化

samba 有効化

サーバー証明書(Let's Encrypt)

リカバリー(アプリ)

Pukiwiki

mirakurun (TVチューナーサーバー)

EPGStation(TV録画アプリ)

APCUPS(自動シャットタウン)

リカバリー(運用系)


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS