以下案例均源自原文「回家發現沒電話、沒網路，致電中華電信得知當晚施工，隔日恢復」的情境，延伸出多個可落地的實戰解決方案，用於提升家庭/SOHO 對突發中斷的應對能力、建立備援、監控與運維流程。每個案例都包含問題、根因、解法與可實作範本。

Case #1: 突發性網路中斷的快速鑑別與ISP通報核實

Problem Statement（問題陳述）

業務場景：週末返家準備處理工作與通話，卻發現同時無市話、無網路。第一時間不確定是否為欠費、室內設備問題或外部施工，導致決策延誤。為避免長時間等待，需要一套快速鑑別流程（本地/ISP）與對外溝通話術，並能迅速確認ISP維護通報或建立客服工單，縮短定位時間，降低中斷成本與焦慮。技術挑戰：在缺乏既有監控的前提下，快速區分LAN/WAN/ISP層級故障並進行正確溝通與記錄。影響範圍：所有上網與語音需求；遠端辦公、視訊會議、雲端服務受阻。複雜度評級：低

Root Cause Analysis（根因分析）

直接原因：

ISP 當晚施工維護，造成線路中斷。
網路與市話同線依賴，單點故障影響兩項服務。
使用者未事先掌握維護排程，資訊落差導致誤判。深層原因：
- 架構層面：缺乏備援管道，無法在主線故障時維持最低連通。
- 技術層面：無健康檢查與故障告警；無標準化診斷工具。
- 流程層面：無斷網Runbook、聯絡清單、紀錄模板與溝通腳本。

Solution Design（解決方案設計）

解決策略：建立「五步快速鑑別」流程與腳本工具：本地電源/連線→CPE燈號→網關/PPPoE狀態→對外探測→ISP狀態核實；同步制定Runbook與客服工單模板，確保定位<10分鐘、回報一致、決策明確（等待/切換備援）。

實施步驟：

制定診斷清單與溝通腳本
- 實作細節：列出檢查順序與常見結論；撰寫客服描述模板。
- 所需資源：文檔工具、共享筆記。
- 預估時間：2小時
實作鑑別腳本
- 實作細節：整合ping、traceroute、PPPoE狀態查詢、ISP狀態頁抓取。
- 所需資源：bash、curl、traceroute
- 預估時間：2小時
建立聯絡清單與工單模板
- 實作細節：紀錄ISP帳號、電路號、客服電話、合約資訊與SLA。
- 所需資源：表單/文件
- 預估時間：1小時

關鍵程式碼/設定：

#!/usr/bin/env bash
# quick-triage.sh — 快速鑑別LAN/ISP
set -e
log() { echo "[$(date '+%F %T')] $*"; }
GW=$(ip route | awk '/default/ {print $3; exit}')
log "1) 檢查本地連線與預設閘道: $GW"
ping -c2 "$GW" >/dev/null && log "OK: LAN與CPE通" || log "FAIL: LAN/CPE可能有問題"
log "2) 對外探測"
for t in 1.1.1.1 8.8.8.8; do
  if ping -c2 $t >/dev/null; then log "OK: 可連 $t"; else log "FAIL: 無法連 $t"; fi
done
log "3) DNS解析測試"
getent hosts www.google.com || log "DNS解析失敗"
log "4) ISP狀態頁"
curl -m 5 -s https://isp.example.com/status || log "無法取得狀態頁"
log "結論：若LAN OK但外網全斷，極可能為ISP側；請依Runbook聯絡客服並記錄工單編號。"

實際案例：原文：週末返家同時無市話與網路，致電中華電信確認當晚施工，隔日恢復。實作環境：Linux/macOS 終端機、家用路由器。實測數據：改善前：定位時間常超過30-60分鐘改善後：5-10分鐘鎖定ISP側並完成通報改善幅度：時間下降80%+

Learning Points（學習要點）核心知識點：

分層診斷：裝置→LAN→CPE→WAN→ISP
常見探測工具與解讀（ping/trace/DNS）
標準化Runbook的重要性技能要求：
必備技能：基礎網路命令、紀錄與溝通
進階技能：腳本自動化、狀態頁爬取延伸思考：
可否將腳本整合到路由器排程？
如何把診斷輸出推送到LINE/Slack？
是否要加入視覺化儀表板？

Practice Exercise（練習題）

基礎練習：撰寫只含ping/trace的triage腳本（30分鐘）
進階練習：加入ISP狀態頁解析與結論輸出（2小時）
專案練習：做成可執行的桌面小工具（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：涵蓋LAN/WAN/ISP檢查、輸出結論
程式碼品質（30%）：結構清晰、錯誤處理、日誌
效能優化（20%）：檢測耗時控制、並行探測
創新性（10%）：與通知/工單系統整合

Case #2: 家用/SOHO 雙WAN容錯：PPPoE主線 + 4G備援（OpenWrt mwan3）

Problem Statement（問題陳述）

業務場景：主線（如xDSL/光纖）因施工中斷，所有工作停擺。為維持最低可用性，需在家庭/小型辦公室部署具備自動切換的雙WAN架構，當主線失效時自動切至4G/5G行動網路，並在主線恢復後無縫回切，確保關鍵服務不中斷或中斷時間最小化。技術挑戰：正確健康檢查、切換時避免連線中斷過久、DNS與NAT狀態一致性處理。影響範圍：全網路連線穩定性、會議、VPN、雲協作。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

ISP維護導致主WAN斷線。
無備援連線，單點失效。
無自動切換機制，手動切換慢且易出錯。深層原因：
- 架構層面：單ISP、單實體路徑。
- 技術層面：缺乏策略路由與健康檢測。
- 流程層面：無定期演練與故障回切流程。

Solution Design（解決方案設計）

解決策略：在OpenWrt上以mwan3建立雙WAN（PPPoE主＋LTE備援），透過多目標探測判斷鏈路健康，失敗時快速路由切換，DNS使用本地快取減少切換影響，並在主線穩定後自動回切。

實施步驟：

準備第二WAN
- 實作細節：USB LTE dongle/5G CPE，APN設定，打開NAT。
- 所需資源：OpenWrt路由器、SIM卡
- 預估時間：1-2小時
配置mwan3健康檢測與策略
- 實作細節：多目標ping、故障與恢復門檻、權重。
- 所需資源：mwan3套件
- 預估時間：1小時
測試故障與回切
- 實作細節：拔除主線、觀察路由表與延遲；恢復後回切。
- 所需資源：終端機
- 預估時間：1小時

關鍵程式碼/設定：

# /etc/config/network（節錄）
config interface 'wan'
  option proto 'pppoe'
  option username 'user@isp'
  option password 'pass'
  option ifname 'eth0.2'

config interface 'wanb'
  option proto 'dhcp'   # 連到4G/5G CPE LAN
  option ifname 'eth0.3'

# /etc/config/mwan3（節錄）
config interface 'wan'
  option enabled '1'
  option track_ip '1.1.1.1 8.8.8.8'
  option reliability '1'
  option timeout '2'
  option interval '5'
  option down '3'
  option up '3'

config interface 'wanb'
  option enabled '1'
  option track_ip '1.0.0.1 8.8.4.4'
  option reliability '1'
  option timeout '2'
  option interval '5'
  option down '3'
  option up '3'

config member 'wan_m1'
  option interface 'wan'
  option metric '10'
  option weight '3'

config member 'wanb_m1'
  option interface 'wanb'
  option metric '20'
  option weight '1'

config policy 'failover'
  list use_member 'wan_m1'
  list use_member 'wanb_m1'

config rule 'default_rule'
  option dest_ip '0.0.0.0/0'
  option use_policy 'failover'

實際案例：原文情境延伸至雙WAN容錯，避免再次因施工停擺。實作環境：OpenWrt 22.x、mwan3、4G/5G CPE或USB dongle。實測數據：改善前：主線斷線即時中斷改善後：自動切換3-10秒；可用性>99.9%（視備援品質）改善幅度：MTTR顯著下降，停機由小時降至秒級

Learning Points（學習要點）核心知識點：

多WAN健康檢測、故障閾值
路由優先級與回切策略
DNS/NAT在切換中的影響技能要求：
必備技能：OpenWrt基本操作、網路配置
進階技能：mwan3調優、底層路由診斷延伸思考：
是否要針對關鍵應用做策略路由？
如何節省LTE流量費用？
是否要加入BFD或更嚴謹探測？

Practice Exercise（練習題）

基礎練習：建立雙WAN並完成手動切換（30分鐘）
進階練習：配置mwan3自動切換與回切（2小時）
專案練習：撰寫自動化測試與報表（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：自動切換/回切穩定
程式碼品質（30%）：配置清晰、註解完整
效能優化（20%）：切換時間與丟包控制
創新性（10%）：動態權重/多目標探測優化

Case #3: 針對關鍵業務的策略路由（PBR），優先走備援鏈路

Problem Statement（問題陳述）

業務場景：備援LTE費率高且頻寬有限，不希望全量流量切至LTE。希望僅將關鍵業務（公司VPN、視訊會議、工作SaaS）優先導向備援，其餘延後或限制，兼顧可用性與成本。技術挑戰：基於應用/網段/標記做策略路由與QoS，確保關鍵流量優先權與可靠性。影響範圍：全網體驗與費用控制。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

備援鏈路費用高、頻寬小。
全量切換會造成壅塞與高費用。
無流量分級與PBR配置。深層原因：
- 架構層面：缺乏流量分類與策略管控。
- 技術層面：未使用nftables標記、路由表分流。
- 流程層面：未定義關鍵業務清單與優先級。

Solution Design（解決方案設計）

解決策略：以nftables對特定網段/埠號/域名IP做fwmark標記，使用ip rule將已標記流量導向LTE路由表；搭配限速/封包隊列，避免非關鍵流量佔用。

實施步驟：

定義關鍵流量清單
- 實作細節：公司VPN子網、Zoom/Teams IP範圍、SaaS域名解析預先同步。
- 所需資源：清單管理、DNS解析產出IP集
- 預估時間：1小時
配置nftables標記與路由表
- 實作細節：fwmark、ip rule、table優先級。
- 所需資源：nft、iproute2
- 預估時間：2小時
測試與調優
- 實作細節：關停主線，驗證關鍵應用連通與其他流量受限。
- 所需資源：測試帳號、流量產生器
- 預估時間：1小時

關鍵程式碼/設定：

# 建立路由表100走LTE閘道
ip route add default via 192.168.8.1 dev eth1 table 100
ip rule add fwmark 0x100 table 100 priority 100

# nftables: 標記關鍵流量
nft add table inet pbr
nft add chain inet pbr prerouting { type filter hook prerouting priority -300 \; }
nft add set inet pbr zoom_ips { type ipv4_addr\; flags interval\; }
# 將Zoom/Teams/SaaS IP放入集合（可由腳本定期更新）
nft add rule inet pbr prerouting ip daddr @zoom_ips meta mark set 0x100

# 例：公司VPN子網走LTE
nft add rule inet pbr prerouting ip daddr 203.0.113.0/24 meta mark set 0x100

實際案例：原文情境延伸，確保施工期間仍可開會與連VPN。實作環境：Linux/OpenWrt具nftables能力。實測數據：改善前：全量走LTE、壅塞且成本高改善後：僅關鍵流量走LTE，費用下降50-80% 改善幅度：成本/體驗雙提升

Learning Points（學習要點）核心知識點：

nftables標記與策略路由
應用/IP集管理與更新
備援流量成本優化技能要求：
必備技能：Linux網路、基本nftables
進階技能：動態IP集同步、策略調優延伸思考：
是否加入DoH域名到IP集的動態解析？
結合QoS提升語音/視訊體驗？
自動化更新SaaS IP範圍？

Practice Exercise（練習題）

基礎練習：為單一網段設標記並導至表100（30分鐘）
進階練習：建立IP集合並自動更新（2小時）
專案練習：完整PBR + QoS方案（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：正確分流關鍵流量
程式碼品質（30%）：規則清晰、集合管理
效能優化（20%）：延遲/抖動控制
創新性（10%）：動態解析與自動化

Case #4: WAN健康檢測與異常告警（Prometheus + Blackbox + Alertmanager）

Problem Statement（問題陳述）

業務場景：過去只能被動發現斷網，需主動監控多個目標（DNS、HTTP、ICMP）並快速告警到手機/群組，縮短MTTD/MTTR，並保留可視化歷史以與ISP交涉或申請補償。技術挑戰：設計有效探測、避免誤報、串接多種通知通道。影響範圍：可觀測性、事故響應速度。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

無主動監控，發現延誤。
單一探測易誤判（例如DNS故障誤當網斷）。
無告警路徑與值班規則。深層原因：
- 架構層面：缺乏可觀測性系統。
- 技術層面：無多探測點/多協定監測。
- 流程層面：無通知與升級機制。

Solution Design（解決方案設計）

解決策略：部署Prometheus + Blackbox Exporter監測ICMP/DNS/HTTP多目標；設告警規則與抑制條件；Alertmanager推送LINE/Slack/SMS；Grafana視覺化，形成完整監控告警鏈。

實施步驟：

部署黑盒探測
- 實作細節：配置多協定探測；多外部目標。
- 所需資源：Docker/VM
- 預估時間：2小時
告警規則與抑制
- 實作細節：連續失敗N次才告警；維護窗抑制。
- 所需資源：Prometheus rule、Alertmanager
- 預估時間：1小時
通知整合
- 實作細節：LINE Notify/Slack Webhook/Twilio SMS。
- 所需資源：API Token
- 預估時間：1小時

關鍵程式碼/設定：

# prometheus.yml（節錄）
scrape_configs:
- job_name: 'blackbox'
  metrics_path: /probe
  params:
    module: [icmp, http_2xx]
  static_configs:
    - targets: ['1.1.1.1', '8.8.8.8', 'https://www.google.com']
  relabel_configs:
    - source_labels: [__address__]
      target_label: __param_target
    - target_label: __address__
      replacement: blackbox-exporter:9115

# 規則（節錄）
groups:
- name: wan.rules
  rules:
  - alert: InternetDown
    expr: probe_success{job="blackbox"} == 0
    for: 2m
    labels: {severity: critical}
    annotations: {summary: 'WAN 可能中斷', desc: '目標多項失敗'}

# Alertmanager（節錄）
receivers:
- name: 'line'
  webhook_configs:
  - url: 'https://notify-api.line.me/api/notify?token=YOUR_TOKEN'

實際案例：原文情境若有此監控，可在施工開始即收到告警。實作環境：Prometheus 2.x、Blackbox Exporter、Grafana。實測數據：改善前：發現時間（MTTD）>30分鐘改善後：<2分鐘；誤報率<1%（經抑制）改善幅度：MTTD下降90%+

Learning Points（學習要點）核心知識點：

黑盒探測策略（ICMP/DNS/HTTP）
告警抑制與維護窗
通知與升級策略技能要求：
必備技能：Prometheus基礎
進階技能：告警策略設計與調優延伸思考：
是否在不同網路位置部署多探測點？
如何與工單/IM系統聯動？
如何自動識別ISP區域性故障？

Practice Exercise（練習題）

基礎練習：配置一個ICMP探測並在失敗時告警（30分鐘）
進階練習：加入HTTP/DNS探測與抑制規則（2小時）
專案練習：Grafana儀表板與報表（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：探測+告警+抑制
程式碼品質（30%）：配置可維護
效能優化（20%）：誤報控制
創新性（10%）：多通道通知整合

Case #5: 斷網期間的使用者告知頁與DNS導流（Captive Portal）

Problem Statement（問題陳述）

業務場景：當外網中斷，家人/同事頻繁詢問；需要一個本地告知頁，自動將內網使用者導向顯示「ISP維護中、預計恢復時間、建議行動」的資訊，降低重複溝通與焦慮，並提供臨時指引（如切換行動數據）。技術挑戰：在外網斷線時，對LAN內DNS/HTTP流量進行本地導流，兼顧使用者體驗與隱私。影響範圍：全LAN使用者的溝通效率複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

外網不可達但LAN可用。
使用者無法得知狀態與預估恢復時間。
重複詢問造成成本。深層原因：
- 架構層面：缺乏本地通告機制。
- 技術層面：無DNS/HTTP導流配置。
- 流程層面：未建立公告模板與更新流程。

Solution Design（解決方案設計）

解決策略：搭建本地Nginx告知頁，使用dnsmasq將常見域名解析至本地Portal，或在HTTP層做DNAT導流；維護窗內啟用，恢復後自動還原；盡量避免攔截HTTPS以免體驗不佳。

實施步驟：

建置告知頁與啟停腳本
- 實作細節：Nginx靜態頁、維護訊息變數化。
- 所需資源：Nginx、Shell
- 預估時間：1小時
DNS/HTTP導流
- 實作細節：dnsmasq新增特定域名A記錄至Portal IP；iptables對80端口DNAT。
- 所需資源：dnsmasq、iptables
- 預估時間：1小時
維護窗自動化
- 實作細節：透過Flag檔或健康檢測觸發開關。
- 所需資源：cron/systemd
- 預估時間：1小時

關鍵程式碼/設定：

# /etc/dnsmasq.d/portal.conf（示例）
address=/example.com/192.168.1.10
address=/google.com/192.168.1.10
# 僅在維護窗啟用

# HTTP流量DNAT到Portal（避免HTTPS）
iptables -t nat -A PREROUTING -i br-lan -p tcp --dport 80 -j DNAT --to-destination 192.168.1.10:80

# Nginx維護頁 index.html 顯示：維護中、預計恢復、聯絡窗口、替代方案

實際案例：原文若有此機制，家人/同事可即時看到「今晚施工，明早恢復」訊息。實作環境：家用Linux/路由器（OpenWrt可行）。實測數據：改善前：重複詢問多、資訊不透明改善後：詢問量下降70%+，資訊一致改善幅度：溝通成本大幅降低

Learning Points（學習要點）核心知識點：

局域導流與DNS控制
維護頁資訊設計
啟停自動化技能要求：
必備技能：dnsmasq/iptables/Nginx
進階技能：自動化切換延伸思考：
可否識別HTTPS並提示？
是否針對特定子網/裝置例外？
合規與隱私考量？

Practice Exercise（練習題）

基礎練習：建立本地維護頁（30分鐘）
進階練習：實作DNS/HTTP導流與一鍵開關（2小時）
專案練習：整合監控自動啟停（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：導流與告知頁可用
程式碼品質（30%）：配置清晰、有回退
效能優化（20%）：最小侵入、避免誤導
創新性（10%）：動態訊息與多語支援

Case #6: ISP維護公告抓取與多渠道通知（爬蟲 + LINE/Slack + Calendar）

Problem Statement（問題陳述）

業務場景：事後才得知維護訊息，造成不必要等待。希望自動抓取ISP維護公告，推送到LINE/Slack，並自動寫入日曆，提早規劃避峰或啟用備援。技術挑戰：處理變動的公告格式、避免重複通知、日曆事件同步。影響範圍：維護期生產力與心智負擔。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

未主動訂閱或抓取公告。
ISP公告格式不一、時效性差。
無統一通知與排程。深層原因：
- 架構層面：缺乏公告聚合與事件管控。
- 技術層面：缺少爬蟲與去重機制。
- 流程層面：無維護窗管理流程。

Solution Design（解決方案設計）

解決策略：使用Python爬蟲抓取公告頁，做hash去重與關鍵字抽取，生成ICS事件或透過Google Calendar API寫入，並推送LINE/Slack通知，形成「公告→日曆→提醒」閉環。

實施步驟：

建立爬蟲與去重
- 實作細節：BeautifulSoup解析、hash存檔、時間正則解析。
- 所需資源：Python、SQLite/JSON
- 預估時間：2小時
通知與日曆
- 實作細節：LINE Notify/Slack Webhook、ICS或Calendar API。
- 所需資源：API Token/服務帳戶
- 預估時間：2小時
定時與監控
- 實作細節：cron排程、失敗告警。
- 所需資源：cron/systemd
- 預估時間：1小時

關鍵程式碼/設定：

# isp_notice_watcher.py
import requests, hashlib, re, json, datetime
from bs4 import BeautifulSoup

URL = "https://isp.example.com/maintenance"
DB = "seen.json"
LINE_TOKEN = "YOUR_TOKEN"

def load_seen():
    try: return set(json.load(open(DB)))
    except: return set()

def save_seen(s):
    json.dump(list(s), open(DB, "w"))

def push_line(msg):
    requests.post("https://notify-api.line.me/api/notify",
        headers={"Authorization": f"Bearer {LINE_TOKEN}"},
        data={"message": msg})

html = requests.get(URL, timeout=10).text
soup = BeautifulSoup(html, "html.parser")
seen = load_seen()

for item in soup.select(".notice-item"):
    text = item.get_text(" ", strip=True)
    h = hashlib.sha256(text.encode()).hexdigest()
    if h in seen: continue
    # 解析時間（示例）
    m = re.search(r"(\d{4}/\d{1,2}/\d{1,2}).*(\d{1,2}:\d{2}).*(\d{1,2}:\d{2})", text)
    push_line(f"[ISP維護] {text}")
    seen.add(h)

save_seen(seen)

實際案例：原文若有此通知，能提前安排次日再處理或啟用備援。實作環境：Python 3.10+、LINE/Slack。實測數據：改善前：臨時得知、無法規劃改善後：至少提前數小時通知，臨時中斷衝擊下降50%+ 改善幅度：可預先調整工作與備援策略

Learning Points（學習要點）核心知識點：

爬蟲與去重
通知API整合
日曆事件自動化技能要求：
必備技能：Python基礎
進階技能：時間解析、API認證延伸思考：
是否改為RSS/官方API？
多ISP整合與優先級排序？
自動建立維護窗抑制告警？

Practice Exercise（練習題）

基礎練習：抓取公告並推播（30分鐘）
進階練習：加入去重與時間解析（2小時）
專案練習：寫入Google Calendar並與告警對齊（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：抓取+去重+通知
程式碼品質（30%）：健壯性、異常處理
效能優化（20%）：排程與重試
創新性（10%）：多渠道與日曆整合

Case #7: 市話中斷的語音備援：雲端SIP中繼與自動轉接

Problem Statement（問題陳述）

業務場景：市話與網路同時中斷，外部客戶無法聯繫。需要雲端號碼（DID）作為門號，當本地PBX/市話不可達時，自動轉接到手機或同事，確保聯絡不中斷。技術挑戰：偵測不可達、設定轉接邏輯、避免循環與費用失控。影響範圍：對外溝通、客服、商機。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

同線依賴導致市話與網路同時失效。
無雲端備援號碼與轉接策略。
無自動偵測與切換。深層原因：
- 架構層面：語音服務單點。
- 技術層面：未部署SIP雲端路徑。
- 流程層面：無緊急轉接SOP。

Solution Design（解決方案設計）

解決策略：申請雲端DID（如Twilio），平時SIP轉本地PBX；若本地SIP註冊掉線或探測失敗，使用雲端邏輯自動轉接到指定手機，或按時段/順序佇列轉接。

實施步驟：

申請DID並設定SIP中繼
- 實作細節：供應商控制台設定SIP URI與健康檢查。
- 所需資源：Twilio/其他供應商
- 預估時間：1小時
設計轉接邏輯
- 實作細節：TwiML/Studio flow：SIP失敗→Dial手機。
- 所需資源：供應商工作流
- 預估時間：1小時
測試斷線與費率
- 實作細節：模擬PBX下線、觀察轉接與資費。
- 所需資源：測試號碼
- 預估時間：1小時

關鍵程式碼/設定：

<!-- TwiML 轉接邏輯示例 -->
<Response>
  <!-- 嘗試SIP至本地PBX -->
  <Dial timeout="8">
    <Sip>sip:pbx@your.public.ip</Sip>
  </Dial>
  <!-- 失敗則轉接到手機 -->
  <Dial callerId="+1234567890">+0987654321</Dial>
  <Say>目前系統維護，已為您轉接值班人員。</Say>
</Response>

實際案例：原文情境中，外部電話仍可轉接至手機，不錯失聯繫。實作環境：Twilio/Asterisk或其他雲端語音供應商。實測數據：改善前：外界無法撥入改善後：98%通話仍可接聽（視行動網品質）改善幅度：對外可達性大幅提升

Learning Points（學習要點）核心知識點：

DID、SIP中繼、健康檢查
轉接策略與費率管理
災難備援通聯設計技能要求：
必備技能：VoIP基本概念
進階技能：雲端語音工作流設計延伸思考：
加入IVR自助分流？
錄音與法規遵循？
多人輪巡與值班表整合？

Practice Exercise（練習題）

基礎練習：建立DID並撥入到PBX（30分鐘）
進階練習：失敗轉接手機（2小時）
專案練習：IVR + 值班輪巡（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：失敗檢測與轉接
程式碼品質（30%）：流程清晰、備援分支完整
效能優化（20%）：接通率與響應時間
創新性（10%）：值班、語音應答設計

Case #8: 離線可工作的開發/協作環境（Git鏡像 + 套件代理）

Problem Statement（問題陳述）

業務場景：外網中斷時，開發/文檔/編譯全面停擺。希望建置在LAN可用的Git代管與套件代理（npm/pip等），確保大部分工作可在離線狀態持續進行，等恢復後再同步。技術挑戰：鏡像與快取策略、權限管理、同步衝突。影響範圍：研發、文檔、CI流程。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

所有開發資源依賴外網。
無本地代管與套件快取。
中斷時完全停工。深層原因：
- 架構層面：缺乏本地服務。
- 技術層面：無鏡像、無代理。
- 流程層面：無離線工作策略。

Solution Design（解決方案設計）

解決策略：部署Gitea（Git代管）、Verdaccio（npm私有/快取）、devpi（PyPI代理），建立夜間同步任務與權限管理，讓常用依賴留存在本地。

實施步驟：

部署服務
- 實作細節：Docker Compose快速啟動Gitea/Verdaccio/devpi。
- 所需資源：一台內網主機
- 預估時間：2小時
配置鏡像與快取
- 實作細節：設定上游倉庫、權限、備份。
- 所需資源：配置檔
- 預估時間：1小時
客戶端配置
- 實作細節：npm/pip指向本地代理，git remote新增鏡像。
- 所需資源：開發者工作站
- 預估時間：1小時

關鍵程式碼/設定：

# docker-compose.yml（節錄）
services:
  gitea:
    image: gitea/gitea:1.21
    ports: ["3000:3000","222:22"]
    volumes: ["./gitea:/data"]
  verdaccio:
    image: verdaccio/verdaccio
    ports: ["4873:4873"]
    volumes: ["./verdaccio:/verdaccio/storage"]
  devpi:
    image: muccg/devpi
    ports: ["3141:3141"]
    volumes: ["./devpi:/data"]

# npm設定 .npmrc
registry=http://gitea.lan:4873

# pip設定 pip.conf
[global]
index-url = http://gitea.lan:3141/root/pypi/+simple/

實際案例：原文情境下，仍可提交代碼、編譯常用依賴。實作環境：Docker、Gitea、Verdaccio、devpi。實測數據：改善前：外網斷=停工改善後：常用專案可持續開發，編譯成功率>80%（取決於快取命中）改善幅度：生產力顯著提升

Learning Points（學習要點）核心知識點：

私有代管與套件代理
鏡像同步與快取策略
權限與備份技能要求：
必備技能：Docker/基本運維
進階技能：同步腳本、權限策略延伸思考：
與CI/CD整合、離線測試？
大型二進位依賴的快取（如maven、apt）？
災備與容災演練？

Practice Exercise（練習題）

基礎練習：啟動三服務並成功安裝套件（30分鐘）
進階練習：設定夜間同步（2小時）
專案練習：全團隊切換代理與回退機制（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：Git/套件可用
程式碼品質（30%）：配置可維護
效能優化（20%）：快取命中率
創新性（10%）：多語言代理整合

Case #9: 自動切換到手機熱點的桌面端腳本（Linux/Mac）

Problem Statement（問題陳述）

業務場景：家中路由雖有備援，但個人筆電在外或直連AP時仍可能無法上網。希望當偵測到無外網時，自動切換到已配對的手機熱點，恢復連線進行關鍵工作。技術挑戰：偵測外網可達性、快速切換Wi-Fi、避免來回抖動。影響範圍：個人工作連續性。複雜度評級：低

Root Cause Analysis（根因分析）

直接原因：

舊AP或公共Wi-Fi無外網。
人工切換延誤。
無自動偵測腳本。深層原因：
- 架構層面：終端未納管。
- 技術層面：缺乏連通檢測與自動切換。
- 流程層面：無使用指引。

Solution Design（解決方案設計）

解決策略：利用NetworkManager（Linux）dispatcher或macOS的networksetup定期檢測對外探測，若失敗則切到指定SSID（手機熱點），成功後持續監控，主網恢復再回切。

實施步驟：

準備目標SSID
- 實作細節：手機熱點固定SSID/密碼。
- 所需資源：手機、系統網路工具
- 預估時間：10分鐘
撰寫檢測與切換腳本
- 實作細節：探測1.1.1.1/8.8.8.8；nmcli/networksetup切換。
- 所需資源：bash
- 預估時間：40分鐘
安裝為服務
- 實作細節：cron或systemd timer，macOS LaunchAgent。
- 所需資源：系統服務
- 預估時間：30分鐘

關鍵程式碼/設定：

# Linux: /etc/NetworkManager/dispatcher.d/99-hotspot-fallback
#!/bin/bash
TARGET_SSID="PhoneHotspot"
check() { ping -c1 -W1 1.1.1.1 >/dev/null; }
if ! check; then
  nmcli dev wifi connect "$TARGET_SSID" || true
fi

實際案例：原文情境下，個人裝置可自行恢復連線處理急件。實作環境：Linux（NetworkManager）、macOS（networksetup）。實測數據：改善前：切換耗時2-5分鐘改善後：30秒內自動連上改善幅度：響應時間下降75%+

Learning Points（學習要點）核心知識點：

外網健康檢測
系統網路自動化
抖動控制（回切策略）技能要求：
必備技能：系統腳本
進階技能：systemd/LaunchAgent管理延伸思考：
加入流量上限提示？
僅針對特定應用才切換？
安全性（自動連網風險）？

Practice Exercise（練習題）

基礎練習：nmcli連接指定SSID（30分鐘）
進階練習：自動檢測並切換（2小時）
專案練習：回切與流量提示整合（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：自動切換與回切
程式碼品質（30%）：錯誤處理
效能優化（20%）：切換速度
創新性（10%）：使用者提示與安全策略

Case #10: LTE備援的費率控制與頻寬整形（SQM/TC）

Problem Statement（問題陳述）

業務場景：備援LTE啟用時，若全量流量通過，容易瞬間耗盡額度或飆費。需在備援狀態下自動限速與流量分類，確保關鍵業務順暢、娛樂流量受控。技術挑戰：自動偵測備援狀態、動態套用限速與QoS、避免超額。影響範圍：成本與使用者體驗。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

LTE頻寬/流量有限。
無QoS與限速策略。
無啟停自動化。深層原因：
- 架構層面：缺少使用分級。
- 技術層面：未使用tc/sqm。
- 流程層面：無流量監控與告警。

Solution Design（解決方案設計）

解決策略：使用sqm-scripts（cake）或tc htb為WANB介面設定上/下行限速與分類；當mwan3切至備援時觸發腳本套用策略；同時累積使用量、超額則加嚴。

實施步驟：

安裝SQM/TC
- 實作細節：OpenWrt安裝sqm-scripts，辨識WANB介面。
- 所需資源：OpenWrt
- 預估時間：30分鐘
設定類別與限速
- 實作細節：針對VoIP/會議優先；串流/下載限速。
- 所需資源：tc/sqm配置
- 預估時間：1小時
自動啟停
- 實作細節：mwan3熱插事件觸發限速腳本。
- 所需資源：Shell
- 預估時間：1小時

關鍵程式碼/設定：

# OpenWrt SQM（/etc/config/sqm）
config queue 'wanb'
  option interface 'eth0.3'
  option qdisc 'cake'
  option download '20000'  # kbps
  option upload '5000'
  option linklayer 'ethernet'
  option enabled '1'

# 切換觸發（/etc/mwan3.user）
case "$ACTION" in
  "connected") tc qdisc replace dev eth0.3 root cake bandwidth 20mbit ;;
  "disconnected") tc qdisc del dev eth0.3 root || true ;;
esac

實際案例：原文情境備援期間避免流量暴衝。實作環境：OpenWrt、sqm-scripts、tc。實測數據：改善前：備援時流量不可控、飆費風險改善後：流量受控、關鍵業務優先，費用下降40-70% 改善幅度：成本/體驗平衡

Learning Points（學習要點）核心知識點：

QoS/SQM/TC基礎
事件觸發自動化
流量分類策略技能要求：
必備技能：OpenWrt/TC配置
進階技能：分類與優先調校延伸思考：
加入用量告警/停用？
根據時段/配額動態調整？
應用識別與加權？

Practice Exercise（練習題）

基礎練習：為介面套用cake限速（30分鐘）
進階練習：事件觸發切換限速（2小時）
專案練習：分類多隊列與用量告警（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：限速與優先權生效
程式碼品質（30%）：配置清楚
效能優化（20%）：抖動/延遲改善
創新性（10%）：動態調整與告警

Case #11: 邊界路由器高可用（VRRP/keepalived）

Problem Statement（問題陳述）

業務場景：即便有雙WAN，若唯一路由器故障，整網仍停擺。需要兩台路由器以VRRP提供虛擬IP，任何一台故障時另一台接手，與雙WAN配合實現端到端高可用。技術挑戰：VRRP心跳、狀態同步、健康檢查與漂移。影響範圍：網路核心可用性。複雜度評級：高

Root Cause Analysis（根因分析）

直接原因：

邊界設備單點故障。
無虛擬IP與接管機制。
無健康檢查導致錯位。深層原因：
- 架構層面：未考量設備HA。
- 技術層面：未部署VRRP/Keepalived。
- 流程層面：無切換演練。

Solution Design（解決方案設計）

解決策略：兩台路由器部署keepalived設定相同VRRP群組，LAN側提供虛擬閘道VIP；結合track_script檢查WAN健康以動態調整優先級，確保健康節點主用。

實施步驟：

準備兩台路由器
- 實作細節：相同子網、不同實IP。
- 所需資源：兩台Linux路由器/OpenWrt
- 預估時間：1小時
配置VRRP
- 實作細節：keepalived vrrp_instance、priority、虛擬IP。
- 所需資源：keepalived
- 預估時間：1小時
健康檢查與測試
- 實作細節：track_script檢查WAN，主故障時備接手。
- 所需資源：腳本
- 預估時間：1小時

關鍵程式碼/設定：

# /etc/keepalived/keepalived.conf（主）
vrrp_script chk_wan {
  script "ping -c2 1.1.1.1 >/dev/null"
  interval 3
  fall 2
  rise 2
}
vrrp_instance VI_1 {
  state MASTER
  interface br-lan
  virtual_router_id 51
  priority 120
  advert_int 1
  authentication { auth_type PASS auth_pass 42 }
  virtual_ipaddress { 192.168.1.1/24 }
  track_script { chk_wan }
}
# 備機：state BACKUP, priority 100

實際案例：原文延伸，避免因單一路由器當機再度全網中斷。實作環境：keepalived 2.x、Linux/OpenWrt。實測數據：改善前：設備故障=全網停擺改善後：接管<3秒；可用性提升至99.99%（視架構）改善幅度：設備SPOF消除

Learning Points（學習要點）核心知識點：

VRRP原理與優先級
健康檢查與權重調整
漂移與腦裂預防技能要求：
必備技能：路由/HA基礎
進階技能：Keepalived調優延伸思考：
狀態/會話同步？
與mwan3/PBR協同？
L2/L3環境限制？

Practice Exercise（練習題）

基礎練習：配置兩台VRRP虛擬閘道（30分鐘）
進階練習：加入track_script（2小時）
專案練習：結合雙WAN/PBR完整HA（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：切換可靠
程式碼品質（30%）：配置合理
效能優化（20%）：切換時間
創新性（10%）：多因素健康檢查

Case #12: 韌體級DNS快取與彈性解析（Unbound + Stubby/DoH）

Problem Statement（問題陳述）

業務場景：網路不穩時常見DNS解析延滯或失敗，影響切換與使用體驗。需要本地DNS快取與冗餘上游解析，提升彈性與性能，搭配雙WAN時更顯重要。技術挑戰：上游故障判斷、超時與重試策略、安全（DoT/DoH）。影響範圍：全網解析性能與成功率。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

單一上游DNS故障導致解析失敗。
無本地快取，切換後解析慢。
無TLS保護可能遭受干擾。深層原因：
- 架構層面：解析層無冗餘。
- 技術層面：未部署Unbound/Stubby。
- 流程層面：無健康檢測與回退。

Solution Design（解決方案設計）

解決策略：部署Unbound作本地遞歸快取，配合Stubby/DoH上游，設定多上游、超時與重試；切換WAN時依然快速解析先前快取與新查詢。

實施步驟：

安裝與基本配置
- 實作細節：Unbound作LAN DNS、Stubby為DoT上游。
- 所需資源：Unbound、Stubby
- 預估時間：1小時
上游冗餘與超時
- 實作細節：多上游（Cloudflare/Google/Quad9）、timeout調整。
- 所需資源：配置檔
- 預估時間：30分鐘
驗證與調優
- 實作細節：測試解析時間、失敗時回退。
- 所需資源：dig/kresd
- 預估時間：30分鐘

關鍵程式碼/設定：

# unbound.conf（節錄）
server:
  cache-max-ttl: 86400
  prefetch: yes
forward-zone:
  name: "."
  forward-tls-upstream: yes
  forward-addr: 1.1.1.1@853        # Cloudflare DoT
  forward-addr: 9.9.9.9@853        # Quad9 DoT
  forward-addr: 8.8.8.8@853        # Google DoT

實際案例：原文延伸，雙WAN切換下解析依舊順暢。實作環境：Unbound 1.17+、Stubby或直接DoT。實測數據：改善前：解析失敗/緩慢，切換時延遲大改善後：解析成功率>99.9%，平均解析時延下降30-60% 改善幅度：體驗顯著提升

Learning Points（學習要點）核心知識點：

遞歸快取與TTL
DoT/DoH安全解析
多上游與故障回退技能要求：
必備技能：DNS基礎
進階技能：解析性能調優延伸思考：
與mwan3/Policy同步？
分流不同域名到特定上游？
DNSSEC驗證？

Practice Exercise（練習題）

基礎練習：搭建本地DNS快取（30分鐘）
進階練習：多上游DoT與超時調校（2小時）
專案練習：域名分流策略（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：快取與冗餘生效
程式碼品質（30%）：配置清晰
效能優化（20%）：解析時延
創新性（10%）：分域優化

Case #13: 斷網事件Runbook與SLA/停機補償管理

Problem Statement（問題陳述）

業務場景：遇到中斷時，缺乏標準流程造成溝通混亂與權益損失。需要Runbook明確「誰做什麼、何時做」，並記錄停機證據以申請補償或優化合約。技術挑戰：一致性執行、證據保存、SLA條款理解。影響範圍：事件管理、成本回收。複雜度評級：低

Root Cause Analysis（根因分析）

直接原因：

無標準化處置與記錄。
沒有工單與證據鏈。
未善用SLA與補償。深層原因：
- 架構層面：治理缺位。
- 技術層面：缺乏工具整合。
- 流程層面：無SLA管理。

Solution Design（解決方案設計）

解決策略：制定Runbook與模板，包含鑑別→通報→公告→工單→恢復→復盤；使用表單/工單系統與監控證據，定期審視SLA、統計停機與申請補償。

實施步驟：

Runbook與模板
- 實作細節：Markdown模板、責任分工、聯絡表。
- 所需資源：Docs/Confluence
- 預估時間：2小時
證據與工單
- 實作細節：監控截圖、日誌、客服回覆與工單編號。
- 所需資源：表單/工單系統
- 預估時間：1小時
復盤與SLA
- 實作細節：月度統計、議約與優化。
- 所需資源：報表工具
- 預估時間：1小時

關鍵程式碼/設定：

# Incident Template
- 開始時間/恢復時間：
- 影響範圍：
- 初步鑑別結果：
- ISP工單編號/通話紀錄：
- 措施（備援/公告/限速等）：
- 復盤與行動項目：

實際案例：原文若有Runbook，將明確「確認施工→公告→次日驗證恢復→記錄一次中斷」。實作環境：文檔/表單/工單系統。實測數據：改善前：無紀錄、補償難改善後：每次中斷均留痕，補償成功率大幅提升改善幅度：成本回收顯著

Learning Points（學習要點）核心知識點：

事件管理SOP
證據鏈與SLA
復盤改善技能要求：
必備技能：文檔化與溝通
進階技能：SLA解讀與談判延伸思考：
自動從監控生成報告？
將公告與Portal聯動？
KPI如何設計？

Practice Exercise（練習題）

基礎練習：填寫一次模擬事件模板（30分鐘）
進階練習：串接監控截圖到工單（2小時）
專案練習：月度SLA報告儀表板（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：SOP覆蓋完整
程式碼品質（30%）：模板清晰
效能優化（20%）：執行效率
創新性（10%）：自動化程度

Case #14: CPE/ONT/路由器的不斷電設計（UPS估算與監控）

Problem Statement（問題陳述）

業務場景：雖然此次為施工，但多數中斷也可能因停電。為避免設備重啟或短暫斷電導致更長恢復時間，需為CPE/ONT/路由器提供UPS，確保短時停電不中斷或可平順關機。技術挑戰：負載估算、續航時間計算、電池健康監控。影響範圍：網路穩定性、設備壽命。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

停電導致設備掉電。
無UPS保護。
電池老化未監測。深層原因：
- 架構層面：電力冗餘缺失。
- 技術層面：無NUT/監控。
- 流程層面：未定期檢測與更換。

Solution Design（解決方案設計）

解決策略：估算總負載功率與所需續航，選型UPS；部署NUT監控UPS狀態，低電量時有序關機；定期自檢與更換計畫。

實施步驟：

負載盤點與估算
- 實作細節：合計瓦數、效率與預估時長。
- 所需資源：功率資料
- 預估時間：30分鐘
UPS選型與部署
- 實作細節：線互動/在線式、插座規劃。
- 所需資源：UPS設備
- 預估時間：1小時
監控與自動關機
- 實作細節：NUT設定、告警與關機。
- 所需資源：NUT、腳本
- 預估時間：1小時

關鍵程式碼/設定：

# runtime_estimator.py
load_w = 18  # 路由+ONT總負載
battery_wh = 150  # UPS電池容量
efficiency = 0.85
runtime_h = (battery_wh * efficiency) / load_w
print(f"估算續航: {runtime_h:.1f} 小時")

實際案例：原文延伸，避免短時停電造成二次中斷。實作環境：UPS + NUT（Network UPS Tools）。實測數據：改善前：短停電導致設備反覆重啟改善後：可撐1-3小時，或安全關機改善幅度：可靠性提升

Learning Points（學習要點）核心知識點：

UPS類型與選型
續航估算與效率
NUT監控與自動化技能要求：
必備技能：設備盤點
進階技能：監控與自動關機延伸思考：
PoE交換器的UPS供電？
太陽能/行動電源備援？
電池健康週期管理？

Practice Exercise（練習題）

基礎練習：計算續航需求（30分鐘）
進階練習：部署NUT並發送告警（2小時）
專案練習：整網設備上UPS（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：續航與監控可用
程式碼品質（30%）：工具與腳本清晰
效能優化（20%）：告警與行動準確
創新性（10%）：能源多樣化

Case #15: 實體路徑多樣化與多家業者設計（光纖+DSL/5G）

Problem Statement（問題陳述）

業務場景：同一業者施工或區域交換機異常會影響所有該業者線路。需要透過不同媒介/不同業者的實體路徑多樣化，降低同源故障風險，提升整體可用性。技術挑戰：確認路徑獨立性、成本與複雜度、路由策略協同。影響範圍：外部連線可靠性。複雜度評級：高

Root Cause Analysis（根因分析）

直接原因：

同業者維護造成全面中斷。
單一實體路徑。
無多家與多媒介組合。深層原因：
- 架構層面：未做路徑多樣性設計。
- 技術層面：未驗證路由/機房匯聚差異。
- 流程層面：未進行供應商風險管理。

Solution Design（解決方案設計）

解決策略：選擇不同業者、不同介質（光纖+DSL或5G固定無線），確認建築入口與上行匯聚不同；設計策略路由或BGP（企業）達成真正冗餘。

實施步驟：

路徑盤點與詢證
- 實作細節：與業者確認入線路徑與匯聚點；要求證明文件。
- 所需資源：供應商窗口
- 預估時間：1-2週（溝通）
建置第二線路
- 實作細節：施工、驗收與延遲/抖動測試。
- 所需資源：工程施作
- 預估時間：1-4週
路由協同
- 實作細節：mwan3/PBR或BGP，對等策略。
- 所需資源：路由設備
- 預估時間：1-2天

關鍵程式碼/設定：

# 文檔要點
- 業者A: 光纖 FTTH, 入口：北側弱電間，匯聚：機房X
- 業者B: DSL/5G FWA, 入口：南側窗面/另一弱電間，匯聚：機房Y
- SLA 與維護窗口錯開

實際案例：原文延伸，下一次同業者施工時仍有他線可用。實作環境：多ISP、多媒介。實測數據：改善前：業者單點施工=全面停擺改善後：同業者故障時仍有他線，SLA接近四個九改善幅度：可用性顯著上升

Learning Points（學習要點）核心知識點：

路徑多樣性與供應商管理
策略路由/BGP冗餘
成本/風險平衡技能要求：
必備技能：網路規劃
進階技能：對等與路由協商延伸思考：
多雲/多POP延伸？
千兆以上環境的BGP設計？
災備演練與報告？

Practice Exercise（練習題）

基礎練習：制定多業者比較矩陣（30分鐘）
進階練習：模擬雙線策略路由（2小時）
專案練習：小型雙ISP冗餘落地（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：真路徑獨立
程式碼品質（30%）：文檔與策略清晰
效能優化（20%）：延遲/抖動/切換
創新性（10%）：多介質混合

Case #16: 斷網鑑別腳本進階版：快速判斷ISP/LAN/PPPoE/實體層

Problem Statement（問題陳述）

業務場景：僅用簡單ping不足以定位複合故障（PPPoE掉線、DSL未同步、CPE掛死）。需要一支進階腳本記錄關鍵狀態（接口、ARP、PPPoE、DNS）並輸出結論與建議，便於與ISP對話。技術挑戰：跨層診斷與結果彙整、日誌保存。影響範圍：定位速度與溝通效率。複雜度評級：中

Root Cause Analysis（根因分析）

直接原因：

故障多樣，難以一次判斷。
缺乏系統化資訊蒐集。
與ISP溝通缺少證據。深層原因：
- 架構層面：診斷缺流程化工具。
- 技術層面：未覆蓋PPPoE/ARP/實體層。
- 流程層面：無日誌保存。

Solution Design（解決方案設計）

解決策略：腳本自動收集接口狀態、ARP、PPPoE會話、路由表、DNS解析、對外探測，輸出JSON報告與建議；可定期執行，形成歷史紀錄。

實施步驟：

指標定義
- 實作細節：要收集的命令與檢查點。
- 所需資源：Shell/JSON工具
- 預估時間：30分鐘
腳本撰寫
- 實作細節：並行探測、錯誤處理、JSON化。
- 所需資源：bash/jq
- 預估時間：2小時
報告與存檔
- 實作細節：帶時間戳存檔以便比對。
- 所需資源：檔案系統
- 預估時間：30分鐘

關鍵程式碼/設定：

#!/usr/bin/env bash
# deep-triage.sh
OUT="report-$(date +%F-%H%M%S).json"
jq -n --arg ifs "$(ip -j addr)" \
      --arg routes "$(ip -j route)" \
      --arg arp "$(ip -j neigh)" \
      --arg ppp "$(ip -j link show pppoe-wan 2>/dev/null || true)" \
      --arg dns "$(cat /etc/resolv.conf)" \
      --arg ping1 "$(ping -c1 -w1 1.1.1.1 | tr '\n' ' ')" \
      --arg ping2 "$(ping -c1 -w1 8.8.8.8 | tr '\n' ' ')" \
      '{ifs:$ifs, routes:$routes, arp:$arp, ppp:$ppp, dns:$dns, ping:{c1:$ping1,c2:$ping2}}' > "$OUT"
echo "Saved $OUT"

實際案例：原文延伸，用於與客服明確描述「PPPoE連不上/DSL未同步」等情況。實作環境：Linux、jq。實測數據：改善前：描述模糊、來回溝通多改善後：一次提供完整資訊，溝通時間縮短50%+ 改善幅度：MTTR縮短

Learning Points（學習要點）核心知識點：

網路多層診斷點
JSON化報表
證據導向的溝通技能要求：
必備技能：Linux網路命令
進階技能：資料結構化與並行延伸思考：
自動判讀與建議結論？
上傳到工單系統？
匿名化敏感資訊？

Practice Exercise（練習題）

基礎練習：輸出接口/路由JSON（30分鐘）
進階練習：加入PPPoE與DNS檢查（2小時）
專案練習：結論判讀與上傳（8小時）

Assessment Criteria（評估標準）

功能完整性（40%）：資料齊全
程式碼品質（30%）：結構與錯誤處理
效能優化（20%）：執行時間
創新性（10%）：自動判讀與整合

案例分類

按難度分類
- 入門級：#1, #9, #13
- 中級：#2, #3, #4, #5, #6, #8, #10, #12, #16
- 高級：#11, #14, #15
按技術領域分類
- 架構設計類：#2, #11, #15
- 效能優化類：#10, #12
- 整合開發類：#6, #8
- 除錯診斷類：#1, #3, #4, #9, #16
- 安全防護類：#12（DoT/DoH）、#14（電力韌性）
按學習目標分類
- 概念理解型：#1, #13, #14, #15
- 技能練習型：#2, #3, #5, #9, #10, #12, #16
- 問題解決型：#4, #6, #7, #8, #11
- 創新應用型：#3, #5, #6, #11, #15

案例關聯圖（學習路徑建議）

建議先學：#1（快速鑑別）→ #13（Runbook與SLA）
基礎連續性：#9（終端自動切換）→ #5（使用者告知）→ #6（維護公告通知）
核心韌性：#2（雙WAN）→ #3（策略路由）→ #10（費率控制）→ #12（DNS彈性）→ #4（監控告警）
進階高可用：#11（路由器HA）→ #14（UPS）→ #15（實體路徑多樣化）
生產力保障：#8（離線開發）→ #7（語音備援）
依賴關係：
- #3 依賴 #2 的多WAN基礎
- #10 依賴 #2/#3 的備援狀態識別
- #11 可結合 #2/#4 強化HA與監控
- #5 可與 #4/#6 聯動（維護窗自動顯示）
完整學習路徑： 1) #1 → 2) #13 → 3) #9 → 4) #5 → 5) #6 → 6) #2 → 7) #12 → 8) #4 → 9) #3 → 10) #10 → 11) #8 → 12) #7 → 13) #11 → 14) #14 → 15) #15 → 16) #16

以上16個案例以原文「當晚施工致無電話無網路」為起點，系統化地涵蓋了鑑別、備援、告知、監控、HA、成本控制與流程治理，具備完整的教學實作價值。

沒網路...

Case #1: 突發性網路中斷的快速鑑別與ISP通報核實

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #2: 家用/SOHO 雙WAN容錯：PPPoE主線 + 4G備援（OpenWrt mwan3）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #3: 針對關鍵業務的策略路由（PBR），優先走備援鏈路

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #4: WAN健康檢測與異常告警（Prometheus + Blackbox + Alertmanager）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #5: 斷網期間的使用者告知頁與DNS導流（Captive Portal）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #6: ISP維護公告抓取與多渠道通知（爬蟲 + LINE/Slack + Calendar）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #7: 市話中斷的語音備援：雲端SIP中繼與自動轉接

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #8: 離線可工作的開發/協作環境（Git鏡像 + 套件代理）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #9: 自動切換到手機熱點的桌面端腳本（Linux/Mac）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #10: LTE備援的費率控制與頻寬整形（SQM/TC）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #11: 邊界路由器高可用（VRRP/keepalived）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #12: 韌體級DNS快取與彈性解析（Unbound + Stubby/DoH）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #13: 斷網事件Runbook與SLA/停機補償管理

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #14: CPE/ONT/路由器的不斷電設計（UPS估算與監控）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #15: 實體路徑多樣化與多家業者設計（光纖+DSL/5G）

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

Case #16: 斷網鑑別腳本進階版：快速判斷ISP/LAN/PPPoE/實體層

Problem Statement（問題陳述）

Root Cause Analysis（根因分析）

Solution Design（解決方案設計）

案例分類

案例關聯圖（學習路徑建議）

Facebook Pages

AI Synthesis Contents

Edit Post (Pull Request)

Post Directory