「到底哪個數字才是對的?」

1,385 個 Agent Skills 都無法解決的 #1 痛點 — 互動式模擬體驗

基於真實數據 掃描 1,995 個 Skills 366 條 Reddit 痛點

你是一位資深資料工程師。今天是週一早上。
你的 pipeline 昨夜跑完了。全部綠燈。所有測試通過。
然後 CFO 的助理發了一則訊息...

09:15 AM — Slack 通知

Sarah Chen(CFO 辦公室)9:15 AM
嗨,Looker 上的週營收報告顯示上週是 $2.3M,但財務部從 Stripe Dashboard 直接拉出來是 $2.7M。差了 $400K。CFO 在問到底哪個數字是對的。能不能趕快查一下?她下午兩點有董事會。

你的第一反應 — 檢查 pipeline:

$ airflow dags list-runs --dag-id revenue_daily --state success
dag_run_id | execution_date | state
manual__2025-06-15 | 2025-06-15T04:00 | success
manual__2025-06-14 | 2025-06-14T04:00 | success
manual__2025-06-13 | 2025-06-13T04:00 | success
$ dbt test --select fct_daily_revenue
Running 7 tests...
Pass: not_null_fct_daily_revenue_date PASS
Pass: unique_fct_daily_revenue_date PASS
Pass: accepted_values_currency PASS
Pass: positive_total_revenue PASS
All 7 tests passed ✓

一切都是綠燈。所有測試都通過了。但數字差了 $400K。

09:30 AM — 開始調查

手動寫 SQL

逐維度比對 warehouse 彙總值與 Stripe 數字

查看 Observability 工具

看 Monte Carlo / Elementary 有沒有異常警報

現實:每次都要 5 小時

09:15
CFO 問「到底哪個數字是對的?」— 你不知道
09:30
檢查 pipeline:全部綠燈,所有測試通過
10:00
開始手寫 SQL 比對彙總值
10:30
數字差了 $400K — 但為什麼?
11:00
按日期、幣別、支付方式逐維度下鑽...
12:00
找到了:EUR/GBP 是差異來源
13:00
根因:Stripe API v2025-04-16 把 `amount` 從展示幣別改成結算幣別。Schema 沒變。測試通過。語義變了。
13:30
修復 stg_payments,重跑 pipeline,驗證
14:00
回覆 CFO — 問題提出 5 小時後

最慘的是

這會再次發生。下個季度,另一個 API 會在不改欄位名稱的情況下改變欄位的意義。你不會知道,直到有人問為什麼數字對不上。

我們掃描了 1,995 個 Agent Skills

來自 SkillsMP、Claude Marketplace、GitHub 等 6 個來源。然後按真實使用者痛點重新分類。

1,995
掃描的 Skills 總數
1,385
通過品質篩選
74%
行銷包裝
26%
真正解決痛點

完全沒有 Skill 在解決的痛點

Reddit 上的真實聲音

r/dataengineering
「月底結帳——為什麼這麼痛苦?我建 pipeline、做轉換、建報表層...但數字永遠對不上。」
r/devops
「我們的 observability 帳單現在比 AWS 帳單還貴。每年花 $7.5M 在監控工具上...還是搞不清楚哪個數字是對的。」
r/LocalLLaMA
「RAG pipeline——檢索品質差,頁碼都是錯的。你怎麼相信這個輸出?」

供給 vs 需求:真實的圖像

舊分類按「工具在做什麼」分。痛點分類按「使用者在痛什麼」分。

舊分類(供給導向)

「這個工具屬於什麼類別?」

devops-cicd206 skills
testing-qa165 skills
development-tools149 skills
ai-ml113 skills
security110 skills

看起來很健康,每個類別都有很多 skill。

痛點分類(需求導向)

「使用者在痛什麼?」

manual-toil15 skills
tools-dont-connect7 skills
cant-find-root-cause2 skills
passed-but-wrong2 skills
nobody-trusts-the-data0 skills
costs-too-much0 skills
too-much-noise0 skills
breaks-when-things-change0 skills

4 個重大痛點覆蓋率為零。

各舊類別的誠實拆解

每個類別有多少比例的 skill 真正在解決痛點?

凌晨 4:30 應該長這樣

不是 5 小時的恐慌,而是在任何人注意到之前,你就收到一個清晨警報。

Data Trust Bot 4:30 AM
RECONCILIATION ALERT

Source: Stripe API (balance transactions)
Warehouse: fct_daily_revenue
Period: 2025-06-09 to 2025-06-15

Source total: $2,700,000
Warehouse total: $2,300,000
Delta: -$400,000 (-14.8%)

Auto drill-down:
  USD: ✅ match ($1,900,000)
  EUR: ❌ -$180,000 (warehouse lower)
  GBP: ❌ -$120,000 (warehouse lower)

Root cause detected:
Stripe API version changed from 2024-12-18 → 2025-04-16.
Field payment_intent.amount now returns settlement currency (USD) instead of presentment currency.
Your stg_payments model applies FX conversion at line 23 — this double-converts.

Suggested fix: Remove CASE WHEN currency != 'usd' block in stg_payments.

沒有工具(現狀)

發現方式CFO 發現的
找到根因時間5 小時
業務影響董事會延遲
信任影響資料團隊信譽 ↓

有 Data Trust Chain

發現方式凌晨 4:30 自動警報
找到根因時間5 分鐘
業務影響問之前就修好了
信任影響資料團隊是英雄

核心發現

Skill 市場的真相

74%
的 skill 是文件包裝器、SaaS 行銷或美化版模板
0
個 skill 解決「沒人相信數據」
0
個 skill 解決「工具太貴」
0
個 skill 解決「警報噪音太多」

規律

大多數 skill 解決的是事情出錯之前的問題:怎麼建 pipeline、怎麼設定監控、怎麼部署到 Kubernetes。

幾乎沒有 skill 解決事情出錯之後的問題:為什麼數字對不上、那 $400K 去哪了、哪個警報才重要。

Skill 市場為「設定」而最佳化,不是為「求生」而最佳化。

研究方法