- 新推出的 Granite 3.0 8B 和 2B 模型,在寬松的 Apache 2.0 許可證下發佈,在許多學術和企業基準測試中表現出強大的性能,能夠超越或匹敵類似規模的模型。
- 新推出的 Granite Guardian 3.0 模型提供了 IBM 最全面的護欄功能,以推進安全且值得信賴的人工智能。
- 新推出的 Granite 3.0 專家混合模型(Mixture-of-Experts models)可實現極其高效的推理和低延遲,適用於基於 CPU 的部署和邊緣計算。
- 全新的 Granite 時間序列模型在零樣本/少樣本預測中實現了最先進的性能,超越了大10倍的模型。
- IBM 推出了下一代基於 Granite 的 watsonx Code Assistant,適用於通用編碼;在 watsonx.ai 中首次推出用於構建和部署 AI 應用程序和智能體(Agents)的新工具。
- 宣佈 Granite 將成為 Consulting Advantage 的默認模型,這是一個由 AI 驅動的交付平台,IBM 的 160,000 名顧問使用該平台,可以更快地為客戶提供新解決方案。
香港2024年10月22日 /美通社/ — 在美國時間10月21日舉行的IBM(紐約證券交易所代碼:IBM)年度TechXchange大會上,IBM宣佈推出其迄今為止最先進的AI模型家族——Granite 3.0。IBM的第三代Granite旗艦語言模型在許多學術和行業基準測試中均能超越或匹敵同類領先模型提供商的模型,展示出強大的性能、透明性和安全性。
與公司對開源 AI 的承諾一致,Granite 模型在寬松的 Apache 2.0 許可證下發佈,它們憑借在性能、靈活性和自主性方面的獨特組合能夠為企業客戶和整個社區提供服務。
IBM的Granite 3.0家族系列包括:
- 通用/語言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- 護欄與安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- 專家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base
新款 Granite 3.0 8B 和 2B 語言模型被設計為企業級AI的”主力”模型,能夠在檢索增強生成(RAG)、分類、摘要、實體提取和工具使用等任務中提供強大的性能。這些緊湊的多功能模型旨在根據企業數據進行微調,並在各種業務環境或工作流程中無縫集成。
許多大型語言模型(LLM)是基於公開可用的數據進行訓練的,絕大多數企業數據仍然未被利用。通過將小型 Granite 模型與企業數據相結合,特別是使用 IBM 和 RedHat 在五月推出的革命性對齊技術 InstructLab, IBM 相信企業可以實現與大型模型相媲美的特定任務性能,而成本只是其中的一小部分(基於在幾個早期概念驗證中觀察到的成本比大型前沿模型低 3 到 23 倍的範圍[i] )。
Granite 3.0 版本的發佈重申了 IBM 對建立 AI 產品透明度、安全性和信任的承諾。Granite 3.0 技術報告和負責任使用指南提供了用於訓練這些模型的數據集描述,詳細說明瞭所應用的過濾、清洗和處理步驟,並全面展示了模型在主要學術和企業基準測試中的性能結果。
至關重要的是,IBM 為 watsonx.ai 上的所有 Granite 模型提供知識產權賠償,旨在增強企業客戶將企業數據融入模型的信心。
提高標準:Granite 3.0 基準測試
Granite 3.0 語言模型在原始性能上也展示出良好的結果。
在 Hugging Face 的 OpenLLM 排行榜定義的標準學術基準測試中,Granite 3.0 8B Instruct 模型的整體性能平均領先於 Meta 和 Mistral 中類似大小的開源模型的最先進性能。在 IBM 的先進 AttaQ 安全基準測試中,Granite 3.0 8B Instruct 模型在所有測量的安全維度上均領先於 Meta 和 Mistral 的模型[ii] 。
在檢索增強生成(RAG)、工具使用和網絡安全領域的核心企業任務中,Granite 3.0 8B Instruct 模型的平均表現優於Mistral 和 Meta 中類似規模的開源模型 [iii]。
Granite 3.0 模型是在超過 12 萬億個標記上進行訓練的,這些數據來自 12 種不同的自然語言和 116 種不同的編程語言,採用了一種新穎的兩階段訓練方法,利用了數千個旨在優化數據質量、數據選擇和訓練參數的實驗結果。到今年年底,預計 3.0 8B 和 2B 語言模型將支持擴展的 128K 上下文窗口和多模態文檔理解能力。
IBM 展示了性能和推理成本的完美平衡,提供了其 Granite 專家混合(MoE)機構模型,Granite 3.0 1B-A400M 和 Granite 3.0 3B-A800M,這些較小且輕量級的模型可用於低延遲應用程序以及基於 CPU 的部署。
IBM 還宣佈了其預訓練 Granite 時間序列模型的更新版本,早期版本於今年早些時候發佈。這些新模型在 3 倍的數據上進行訓練,在所有三個主要時間序列基準測試中表現出色,超越了來自 Google、Alibaba 等公司 10 倍更大模型的性能。更新後的模型還提供了更大的建模靈活性,支持外部變量和滾動預測[iv] 。
Granite Guardian 3.0:開啓負責任AI的新時代
作為此次發佈的一部分,IBM 還推出了一個新的 Granite Guardian 模型系列,允許應用程序開發人員通過檢查用戶提示和 LLM 響應來實施安全護欄,以發現各種風險。Granite Guardian 3.0、8B 和 2B 型號提供了當今市場上最全面的風險和危害檢測功能。
除了社會偏見、仇恨、毒性、褻瀆、暴力、越獄等危害維度外,這些模型還提供了一系列獨特的檢索增強生成(RAG)特定檢查,如基於事實性、上下文相關性和答案相關性。在針對 19 項安全性和 RAG 基準的廣泛測試中,Granite Guardian 3.0 8B 模型在危害檢測方面的整體準確性平均高於 Meta 的所有三代 Llama Guard 模型。它在幻覺檢測方面的整體性能也與專門的幻覺檢測模型 WeCheck 和 MiniCheck 相當 [v]。
雖然 Granite Guardian 模型派生自相應的 Granite 語言模型,但它們可以與任何開放或專有的 AI 模型一起使用,以實施安全保護措施。
Granite 3.0 模型的可用性
整個 Granite 3.0 模型套件和更新的時間序列模型都可以在 HuggingFace 上根據寬松的 Apache 2.0 許可證下載。新的 Granite 3.0 8B 和 2B 語言模型的指令(instruct)變體以及 Granite Guardian 3.0 8B 和 2B 模型現已在 IBM 的 watsonx 平台上提供商業用途。部分 Granite 3.0 模型也將作為 NVIDIA NIM 微服務提供,並通過 Google Cloud 的 Vertex AI Model Garden與 HuggingFace 的集成提供。
為給開發人員提供多種選擇和易用性,並支持本地和邊緣部署,一套精選的 Granite 3.0 模型也可在 Ollama 和 Replicate 上獲得。最新一代 Granite 模型擴展了 IBM 強大的開源 LLM 目錄。IBM 與 AWS、Docker、Domo、Qualcomm Technologies, Inc.(通過其 Qualcomm® AI Hub)、Salesforce、SAP 等生態系統合作夥伴合作,將多種 Granite 模型集成到這些合作夥伴的產品中,或在他們的平台上提供 Granite 模型,為全球企業提供更大的選擇空間。
從助理(Assistants)到智能體(Agents):實現企業級AI 的未來
IBM 正在通過一系列技術推進企業級AI的發展,從模型和助理 (Assistants),到為公司獨特的數據和用例調優和部署 AI 所需的工具。IBM 還在為未來能夠自我導向、反思並在動態商業環境中執行複雜任務的 AI 智能體(AI agents)鋪平道路。
IBM 不斷發展其 AI 助理(Assitants)技術組合,從幫助公司通過低代碼工具和自動化構建自己的助理的watsonx Orchestrate,到用於特定任務和領域(如客戶服務、人力資源、銷售和營銷)的各種預構建助理。全球各地的組織已經使用 watsonx Assistant 幫助他們構建 AI 助理,用於回答客戶或員工的日常問題、實現大型機和傳統 IT 應用程序現代化、幫助學生探索潛在的職業路徑,或為購房者提供數字抵押貸款支持等任務。
IBM 還公佈了即將發佈的下一代 watsonx Code Assistant,該版本由 Granite 代碼模型提供支持,能夠為 C、C++、Go、Java 和 Python 等語言提供通用編碼輔助,並為企業級 Java 應用程序 提供高級應用程序現代化功能。Granite 的代碼功能現在也可以通過 Visual Studio Code 擴展程序 IBM Granite.Code訪問。
IBM 還計劃發佈新工具來幫助開發人員,利用watsonx.ai 更高效地構建、定制和部署 AI,包括代理框架、與現有環境的集成以及用於常見用例(如 RAG 和智能體)的低代碼自動化[vi] 。
IBM 專注於開發具有更高自主性、複雜推理能力和多步驟問題解決能力的 AI 智能體(AI Agents)技術。Granite 3.0 8B 模型的初始版本支持關鍵的智能體功能,如高級推理和用於實現工具使用工作流程的高度結構化聊天模板和提示風格。IBM 還計劃在 IBM watsonx Orchestrate 中引入新的 AI 智能體聊天功能,利用智能體功能協調 AI 助理、技能和自動化,幫助用戶提高整體的團隊生產力[vii] 。IBM 計劃在 2025 年繼續在其產品組合中構建智能體功能,包括為特定領域和用例預構建的智能體。
擴展的 AI 驅動的交付平台,以 AI 增強 IBM 顧問的能力
IBM 還宣佈大幅擴展其 AI 驅動的交付平台 IBM Consulting Advantage。該多模型平台包含 AI 智能體、應用程序和方法(如可重用的框架),賦能 16 萬名 IBM 顧問,以更低的成本、更好更快地為客戶提供價值。
作為擴展的一部分,Granite 3.0 語言模型將成為 Consulting Advantage 的默認模型。借助 Granite 的性能和效率, IBM Consulting 將能夠幫助最大限度地提高 IBM 客戶的生成式 AI 項目的投資回報。
擴展的另一個關鍵部分是引入 IBM Consulting Advantage for Cloud Transformation and Management 和 IBM Consulting Advantage for Business Operations。每一項都包括特定領域的 AI 智能體、應用程序和融合了 IBM 最佳實踐的方法,使 IBM 顧問能夠幫助客戶加速雲和 AI 轉型任務(如代碼現代化和質量工程),或跨領域(如財務、人力資源和採購)實施轉型和運營。
瞭解有關 Granite 和 IBM 的 AI for Business 戰略的更多信息,請訪問https://www.ibm.com/granite
關於 IBM
IBM 是全球領先的混合雲與人工智能、以及企業服務提供商,為全球175個國家和地區的客戶服務,幫助企業把握其數據洞察、簡化業務流程、降本增效,獲得行業競爭優勢。 IBM 混合雲平台和紅帽OpenShift 為全球超過4,000家政府和企業機構的關鍵性基礎設施提供有力支撐,例如來自金融服務、電訊和醫療健康等行業的客戶,幫助他們快速、高效、安全地實現數碼轉型。 IBM 在人工智能、量子運算、特定行業的雲解決方案以及企業服務等方面的突破性創新,使其可以為客戶提供開放和靈活的選擇。 IBM 對信任、透明、責任、包容和服務的歷久彌新的承諾,是我們業務發展的基石。查詢更多資料,請瀏覽:www.ibm.com/
傳媒查詢:
郭韜 gguotao@cn.ibm.com
[i] 成本計算基於 IBM watsonx 的開放模型和 openAI 的 GPT4 模型(假設 80% 輸入,20% 輸出)的每 100 萬個代幣的 API 成本定價,用於客戶概念驗證。
[ii] IBM Research technical paper: Granite 3.0 Language Models
[iii] IBM Research technical paper: Granite 3.0 Language Models
[iv] The Tiny Time Mixer: Fast Pre-Trained Models for Enhanced Zero/Few Shot Forecasting on Multivariate Time Series
[v] Evaluation results published in Granite Guardian GitHub Report
[vi] Planned availability for Q4 2024
[vii] Planned availability for Q4 2024