叻過大學研究生 xAI 正式發布 Grok 4 極速登頂最強 AI

Author:

Published:

- 廣告 -

7月9日,全球首富馬斯克(Elon Musk)旗下 xAI 公司正式發布了新一代大型語言模型——Grok 4,號稱「全球最聰明的 AI」,目標超越尚未推出的 OpenAI GPT-5 與 Google Gemini 等競爭對手,甚至宣稱其智慧水平已超越絕大多數大學研究生。

此次發布的 Grok 4 包含兩個主要版本:通用型的 Grok 4 與多代理版本的 Grok 4 Heavy。Grok 4 專為日常用戶設計,擅長自然語言處理、數學推理及科學問題解答,適合寫作、研究與翻譯等多場景應用;而 Grok 4 Heavy 可生成多個代理同時處理問題並進行答案比較,大幅提升複雜任務的表現。

新發表的 Grok 4 藉強大算力,推理能力被大大提升近 10 倍。
新發表的 Grok 4 藉強大算力,推理能力被大大提升近 10 倍。

Grok 4 在 xAI 的 Colossus 超級電腦上訓練,配備約 25 萬顆 NVIDIA H100 GPU,運算資源是前代 Grok 3 的 10 倍,訓練量更是 Grok 2 的 100 倍。如此龐大的計算規模助力其達到頂級表現,尤其在推理和強化學習方面投入大量資源,使 Grok 4 能夠深入理解問題本質,自我糾錯並給出邏輯清晰的答案。此外,Grok 4 支援多形態輸入(文字、圖片,未來將支援影片),並整合即時資料檢索功能,能夠即時回應最新資訊。

- 廣告 -

在表現方面,Grok 4 使用工具時,在 HLE 測試中取得 38.6% 的成績,Grok 4 Heavy 更達44.4%,領先 OpenAI 的 o3 版本(24.9%)及 Google Gemini 2.5 Pro(26.9%)。若允許Grok 4 花更多時間思考並使用更多外部工具,HLE 分數甚至可提升至 50.7%。在大型模型性能評測平台 Artificial Analysis 上,Grok 4 以 73 分成為目前最強 AI 模型,領先 OpenAI o3 與 Google Gemini 2.5 Pro 的 70 分,以及 DeepSeek R1、Anthropic Claude 4 Opus 等競爭者。

HLE 測試中,Grok 4 及 Grok 4 Heavy 憑藉強大運算表現取得極佳成績。
HLE 測試中,Grok 4 及 Grok 4 Heavy 憑藉強大運算表現取得極佳成績。

強大的 Grok 4 背後意味著高昂成本,xAI 同步推出年費高達 3,000 美元(約港幣 $23,400)的 SuperGrok Heavy 訂閱計畫,使用者可優先體驗 Grok 4 Heavy 預覽版、8 月發布的 AI 編碼模型、9 月的多代理功能,以及 10 月的影片生成模型。API 定價參考 Grok 3,每百萬輸入 token 約 3 美元,輸出 token 約 15 美元。

未來幾個月,Grok 4 還會按步就班推出更多更強功能。
未來幾個月,Grok 4 還會按步就班推出更多更強功能。

強如 Grok 4 的 AI,除了文字回應和計算外還有甚麼用途?xAI 就展示了更多元化的應用場景,例如 Grok 4 Heavy 能夠瀏覽賠率網站來計算自己的賠率,並預測世界大賽結果。而在商業模擬 Vending Bench 測試中,Grok 4 已懂得做生意,無論是管理庫存、聯繫供應商、設定價格等都能勝任。

未來 Grok 的影片理解能力更會派上用場,不僅能懂玩遊戲,評估遊戲好玩與否,並可整合遊戲引擎,日後將會有靠 AI 生成的遊戲面世。此外,Grok 也許能於不久將來生成出可供人類觀看的電視節目和電影等,令人期待。

- 廣告 -
- 廣告 -

Related Articles

- 廣告 -

Recent Articles

- 廣告 -

最新影片

- 廣告 -