小米跨界加入 AI 大模型・ Xiaomi MiMo 跑贏 GPT-4o?

近期多家科技巨頭都發表自家本的人工智能模型,最近連一向專注於手機、智能家電及電動車業務的小米,也發表他們的 開源大模型 Xiaomi MiMo,而且更強調 MiMo 在部分應用上,效能可超越一些知名的語言模型。

Xiaomi MiMo 是小米開源首個推理 (Reasoning) 大模型,據知 Xiaomi MiMo 實際上參數量只有 70 億個,相較其他知名模型用上數千億,甚至萬億級參數量相比,MiMo 不過是小模型而已。不過 Xiaomi 官方指 MiMo 部分效能可以超越其他更大的語言模型,而目前 Xiaomi MiMo 共有 4 個版本,分別為:預訓練模型 MiMo-7B-Base、 監督微調模型 MiMo-7B-SFT,以及 2 個強化學習模型 MiMo-7B-RL 及 MiMo-7B-RL-Zero。

小米在發佈中亦分享其強化學習模型 MiMo-7B-RL,在包括 AIME-24、AIME-25 及  LiveCodeBench v5 三項測試成績,分別是針對數學推理和程式碼競賽。在相關測試中,MiMo-7B-RL 都能領先包括 OpenAI o1-mini 、GPT-4o-0513,與及 Qwen 的 QwQ-32B-Preview。

不過有分析指,小米在宣傳上一直在強調 MiMo 在數學和程式碼的推理及運算能力,或可以理解為 MiMo 暫時只能用在這二個領域上較有發揮,其他像 ChatGPT 或 Grok 那樣的自然對答,資料整理、或是圖片/ 影片生成方面,可能就不要有太大期望。小米已將相關的技術報告,放在 GitHub 網站上,而對於 MiMo-7B 四款開源模型有興趣的朋友,可前往 Hugging Face 下載。

ZCOPE》最新影片

您會感興趣的內容

相關文章