跳到主要內容

2025年9月11日

建立對 Agentic AI 的信任: 大規模管理、緩解偏見和負責任的 AI

請分享此文章

簡介: Trust 是新的 AI 貨幣

AI 的採用已從試驗階段轉向在企業範圍內部署。然而, 到 2025 年, 將優勝者與落後者區分開來的決定性因素不是速度, 而是信任。

Agentic AI 具有自主、目標驅動的特性, 有能力從根本上重塑各行各業。但沒有責任的自主會產生風險。主管必須回答: 我們該如何確保這些系統準確、公平、安全並符合我們的價值觀?

這就是治理、偏見和負責任的 AI 框架發揮作用的地方。Uber AI 解決方案可協助企業負責任地擴展 Agentic AI。

Agentic AI 信任的挑戰

主管們深知, 提速且缺乏保障措施會導致風險暴露。信任架構必須從第一天起就設計好。

隨著系統變得越來越自主, 風險也會成倍增加:

偏見放大: 未經檢查的訓練資料會造成歧視性結果。
幻覺: LLM 會產生看似合理但不准確的結果。
不透明的理由: 企業無法在不了解的情況下採取行動。
安全性和隱私: 敏感資料必須保持隔離且符合法規。

Agentic AI 的治理和品質

企業已在運用嚴格的品質架構來確保信任:

標註者間協議 (IAA): 多位評分員之間達成共識, 以確認服務品質。
Cohen 的 Kappa 和 Fleiss 的 Kappa: 評估考評人員註記可靠性的統計指標。
黃金資料集: 精選用於基準化的實際案例。
服務等級協議 (SLA) 遵循情況: 營運合約中將準確度和周轉時間納入考量。

這些品質指標會產生可觀察且可重複的信任訊號, 讓企業可以信賴。

Agentic AI 中的偏見緩和方法

偏見不只是技術瑕疵;這會帶來聲譽和法規風險

有效的緩解策略包括:

紅隊測試和對抗式測試: 針對帶有偏見或有害的提示對 AI 進行壓力測試。
共識標籤: 安排不同地區、性別和背景的評分人員, 減少系統性偏見。
意見回饋循環: 人機參與稽核可持續提升系統公平性。
偏見控制台: 即時查看模型決策和人口統計影響。

範例: Uber 的內部安全模型會識別出職業駕駛註冊時有偏見的拒絕模式。透過重新標記資料並引入基於共識的評估, 我們可以減少偏見並恢復公平性。

負責任的 AI 架構: 從原則到實踐

負責任的 AI 需要將抽象的價值轉化為具體的實踐:

公平性: 多樣的資料來源和考評人員。
責任制: 稽核追踪、可說明性控制台、服務等級協議 (SLA) 監控。
透明度: 記錄模型沿襲、資料集來源和決策路徑。
安全: 在極端情況下進行測試、偏見註入和檢舉。
隱私權: 安全資料隔離與法規遵循認證。

當企業將這些原則付諸實施時, Agentic AI 就會從有風險的自主轉向值得信賴的自主。

Uber 人工智能解決方案: 大規模的值得信賴的自主性

Uber 花了近十年的時間, 在自身營運的自主權和信任之間取得平衡:從即時詐騙偵測到 AV 感知系統。現在, Uber AI 解決方案將這份營運手冊帶給企業。

我們提供以下協助:

品質標準為 98% 以上, 而業界為 95%。
全球臨時工和專家團隊: 全球有超過 880 萬費用所得者提供多樣化的評估池。
u標籤平台: 自動預先標記、一致性建模、黃金資料集驗證。
u任務編排: 透過即時監控控制台, 確保跨工作流程的可追溯性。
uTest 評估: 安全驗證中的審核、偏好資料收集和並排比較。

為在 2025 年建立信任, 企業必須採取的行動

審核您的 AI 供應鏈, 確保資料集、註解和評估管道經過偏見檢查。
採用重要的指標, 不只是準確度, 還包括評分者間的一致性、服務等級協議 (SLA) 遵守情況和公平性指標。
嵌入 HITL 監督機制, 人機交互模型可確保最重要的安全領域。
與值得信賴的供應商合作, 拓展負責任的 AI 需要經驗、全球影響力和領域專業知識。

結論: 將信任視為競爭優勢

在 2025 年, 企業不能再把信任當作事後的想法。這必須是採用 Agentic AI 的基礎。

透過嵌入治理、偏見緩和和負責任的 AI 做法, 領導者可以部署功能強大且符合道德、公平和安全的系統。

Uber AI 解決方案協助企業在全球範圍內將這種信任付諸實踐, 提供負責任的自主權。因為在 Agentic AI 時代, 信任是不可缺少的, 這是前進的唯一道路。