障害内容 → 部品交換

障害内容(2025/12/23)

  1. nvme1n1p2(root)が“進行性”に壊れている
    EXT4-fs (nvme1n1p2): error count since last fsck: 2 → 25 → 48 → 77 → 106 → 149
    1. fsck していないのに エラーカウントが増え続けている
    2. 同じ inode / block を何度も壊す
    3. 👉 メディア上の同一物理領域が不安定
  2. ext4 の「チェックサム破壊」+「inode out of bounds」
    Directory block failed checksum
    inode out of bounds
    bad entry in directory
    1. これはソフトウェアバグではほぼ起きない
    2. メモリ化けだけでもここまで繰り返さない
    3. 👉 ストレージ層でのビット化けを強く示唆
  3. dpkg / apport / unattended-upgr が巻き添えで死んでいる
    comm dpkg
    comm apport
    comm unattended-upgr
    1. ランダムではなく「書き込みが多い領域」から壊れる
    2. /var/lib/dpkg が最初に死ぬのは典型

交換前のディスクレイアウト(実メディアのみ)

[KGB2] munakata:~$ df -h
Filesystem Size Used Avail Use% Mounted on 
/dev/nvme1n1p2 457G 49G 385G 12% / 
/dev/nvme1n1p1 1.1G 6.2M 1.1G 1% /boot/efi 
/dev/nvme0n1p1 3.6T 1.7T 1.8T 49% /dtv_recipe 
/dev/md0 7.3T 2.9T 4.0T 43% /raid_vol 
/dev/sdc1 15T 8.3T 5.5T 61% /dtv_h264B 
/dev/sdd1 13T 5.6T 6.5T 47% /dtv_h264A 
/dev/sde1 13T 8.1T 4.0T 68% /dtv_h264C

交換部品(nvme1n)

リカバリー準備

ファイルバックアップ → / 以外のHDDをすべて切断

リカバリー(環境)

OS re-install

RAID0

その他 HDD/SSD リカバリー → ディスク認識

sshd 有効化

ネットワークインターフェースの調整

samba 有効化

APCUPS(自動シャットタウン)

タイムゾーン設定、タイムソース設定

ロケール(日本語)の設定

Ubuntu pro (Live Patch,..) 登録

raid1 の自動再チェックのインターバル修正

### Editing /etc/systemd/system/mdcheck_start.timer.d/override.conf
### Anything between here and the comment below will become the contents of the drop-in file

[Timer]
OnCalendar=
OnCalendar=semiannually

### Edits below this comment will be discarded


### /usr/lib/systemd/system/mdcheck_start.timer
# #  This file is part of mdadm.
# #
# #  mdadm is free software; you can redistribute it and/or modify it
# #  under the terms of the GNU General Public License as published by
# #  the Free Software Foundation; either version 2 of the License, or
# #  (at your option) any later version.
#
# [Unit]
# Description=MD array scrubbing
#
# [Timer]
# OnCalendar=Sun *-*-1..7 1:00:00
# RandomizedDelaySec=24h
# Persistent=true
#
# [Install]
# WantedBy=mdmonitor.service
# Also=mdcheck_continue.timer

リカバリー(アプリ)

Apache2

Pukiwiki

元々動作していた環境(=設定)をそのまま復元するだけで動作と期待したが、pukiwiki 1.5.4 は php8.1 対応だが、インストールした時点の Ubuntu 24.04 の
php が 8.3 にバージョンアップされた影響で今回大幅な設定変更が必要
だった。

[KGB2] munakata:~/Downloads$ php -v
PHP 8.3.6 (cli) (built: Jul 14 2025 18:30:55) (NTS)
Copyright (c) The PHP Group
Zend Engine v4.3.6, Copyright (c) Zend Technologies
    with Zend OPcache v8.3.6, Copyright (c), by Zend Technologies

mirakurun (TVチューナーサーバー)/ EPGStation(TV録画アプリ)

リカバリー(運用系)


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS