現在許多大型企業正透過AI代理建構「知識機器人」,將公司的海量資料庫利用生;NVIDIA宣布針對AI代理提供具安全保障的三項NIM微服務,為NVIDIA NeMo Guardrails軟體工具提供安全性、準確性與可擴擴性。包括Amdocs、Cerence AI、Lowe’s等大型企業皆導入NVIDIA NeMo Guardrails作為內部服務AI功能的防護機制。
具備三項新NIM微服務的NVIDIA NeMo Guardrails,以及用於檢測AI可靠與越獄保護力的NVIDIA Garak工具包已開放開發者與企業使用,開發者限在可透過NVIDIA NeMo Guardrails在客戶服務的AI代理程式設置AI防護措施。
NVIDIA NeMo Guardrails為NVIDIA NeMo平台的一部分,旨在管理、設定與保護AI,作為開發者在基於大型語言的應用程式整合與管理AI護欄,確保開發者可透過NIM微服務建構更安全、可信任的AI代理;這些代理可因應特定情境的指導方針提供不越線的安全與適當的回應,同時可避免使用者嘗試突破圍欄限制的濫用行為。
NVIDIA NeMo Guardrails包含的其中一項NIM微服務使用Aegis內容安全資料集進行訓練,Aegis是在同類型中品質最好、並具有豐富人工註解數據的重要取得來源,同時Aegis由NVIDIA持有與管理,並在Hugging Face提供公開存取,並包含超過35,000個人工註解的資料樣本。
NVIDIA NeMo Guardrails的目的是為AI代理維持在正確的使用方式,並迅速提高基於NIM微服務的企業AI能夠提升流程效率、進而提升生產力;NVIDIA NeMo Guardrails能為客戶解決問題的速度提升40%,同時可確保以NVIDIA NeMo Guardrails建構的AI功能與AI代理使用安全的模型,避免進行不適當甚至有害的行為。
NVIDIA為NVIDIA NeMo Guardrails導入三項全新的NIM微服務,可協助AI代理兼顧大規模執行並保持可控:內容安全NIM微服務、主題控制NIM微服務與越獄檢測NIM微服務;內容安全NIM可確保AI不會產生偏見或不適當的內容,並可符合道德標準;主題控制NIM則可將對話控制在限制的範圍領域,避免回答超出預期功能與不相干的內容;越獄檢測NIM則是當用戶嘗試挑戰服務的範圍時,避免用戶越獄成功誤導人工智慧回答不相關內容。
NVIDIA NeMo Guardrails透過三個輕量、專業的NIM微服務作為防護圍欄,可確保開發者建構的AI出現漏洞,進而保護與控制複雜的AI代理工作流程;同時透過如NVIDIA NeMo Guardrails當中的小型語言模型可提供更低的延遲,使這些AI模型在性能受限或分散式運算環境也能順暢執行,使得這些AI代理能用在如醫療保健、汽車、製造業與醫院、倉庫管理。
也由於透過NVIDIA NeMo Guardrails與三項NIM微服務建構的語言模型,能夠避免傳遞非預期或不適當的內容給用戶,無論適用於企業內部或是零售業的消費者服務,皆可確保其「知識機器人」能夠提供正確、不離題、不具歧視性的答案。
NVIDIA NeMo Guardrails是NVIDIA提供語言模型防護的軟體,此次添加三項NIM微服務增強對內容合適性、主題範圍與用戶越獄防護的功能
此外,NVIDIA NeMo Guardrails也同樣具備來自NVIDIA AI的完整生態系,並秉持NVIDIA在軟體服務與工具的開放性;NVIDIA NeMo Guardrails支援與ActiveFence的ActiveScore整合,可過濾對話式AI應用程式當中的不適當內容,與提供可視化、分析與監控;另外Fiddler AI Observability平台也能與NVIDIA NeMo Guardrails整合並增強AI護欄功能;端對端AI開發平台Weights & Biases也著手透過NVIDIA NeMo Guardrails與NIM微服務增強既有的NIM微服務。
開發者可透過NVIDIA研究團隊用於大型語言模型LLM與應用程式漏洞檢測的NVIDIA Garak開源工具,透過Garak產生涉及不適當或不正確的測試案例,可辨識系統的資料外洩漏洞、提示標籤、程式碼幻覺與越獄情境等問題,協助客戶進一步增強其AI服務的可靠性與安全性。