首頁 新聞 商湯廣東話日日新語言模型 每 100 萬字詞收 30 港元冀主導香港市場

商湯廣東話日日新語言模型 每 100 萬字詞收 30 港元冀主導香港市場

商湯 日日新5.0. 粵語 廣東話

商湯大型語言模型「日日新 5.0」推出廣東話版本,繼承讀懂中國文化特色,還加入香港語境和文化內容。由廣東話日日新支援的對話機械人「商量 5.0」粵語版,將在 7 月正式推出,每 100 萬字詞(Token)收費 30 港元。商湯香港業務總經理馮愈表示,期望廣東話日日新主導香港 LLM 市場。

商湯科技董事長和行政總裁徐立表示,今年正值商湯成立 10 周年,由在科學園內的兩張辦公桌開始將 AI 技術帶入商業市場。AI 技術的突破其實在 2018 年發生,神經網絡加入 Transformer 模型,但要到 2023 年在主流大眾興起,因結合聊天應用,更創新的技術要配合用途才可走入市場。

徐立表示,今年是商湯成立 10 周年,在科學園內由兩張辦公桌開始創業。

6B 香港數據訓練理解本地語境

商湯上月在中國上海發表日日新 5.0,用 OpenAI 的 GPT-4 Turbo 作比較,指外國 LLM 不能理解中國的文化,在香港發表廣東話版再次比較。商湯科技聯合創辦人林達華稱,日日新 5.0 在 SuperCLUE 和 OpenCompass 的評分均優於 GTP-4 Turbo,而後者的客觀評分更勝過最新的 GPT-4o。

日日新 5.0 廣東話版加入香港的數據作訓練,約 6B 字詞數據,主要來自網站、大詞典。馮愈稱,能夠理解香港文化的俗語,從經典用語到潮語,以至廣東話粗口,唯日日新回應時有限制無法生成粗鄙內容。

林達華將商量 5.0 廣東話版與 GPT-4 Turbo 比較,直指對手不理解香港的用語。

林達華的示範以香港人常用的中英夾雜查問:「call 白車打咩 number?」,結果 GTP-4 Turbo 無法理解何謂白車,誤以為是的士。而商量 5.0 廣東話版則回應叫救護車打緊急服務熱線。另外又問香港用字「磅水」,GTP-4 Turbo 又被考起。示範多模態大型模型廣東話版辨認香港的文件,如圖像、PDF、Word、PPT 等交件內容,未能擷取內裡的資料回答問題。林達華表示,日日新 5.0 廣東話版具備本地的文化知識,亦有語言能力和推理能力。

商量可理解「白車」的本地語意。
比較兩者能否講出「磅水」。
示範多模態功能:分析圖片,辨認出維多利亞港,又能詳細形容天氣情況。
示範分析麥當奴的餐牌,直接叫介紹較便宜的套餐,都能理解。

為支援日日新 5.0 的香港用戶,商湯將建本地 AI 雲端區域,並連結全中國的 AIDC。商湯科技聯合創辦人陳宇恆表示,將在 6 月開設香港的 AI 雲端,支援本港企業客戶的運算需求,能減低 90% 時延,亦符合數據法規要求。馮愈補充,惟目前未決定該雲端部署模式,正在考慮幾個方案,如部署在公共雲、自建 AIDC 等。

陳宇恆稱,商湯連接香港、上海、深圳、福建的運算平台,又將在香港建 AI 雲端區域,支援本港用戶。

低價推出目標主導本地市場

廣東話版商量 5.0 將以 API 形式向本地企業提供,每 100 萬字詞收費 30 港元,輸入和輸出分別計算。馮愈稱,目前是大型模型最低價,亦是首個支援粵語俚語的模型,期望能夠主導香港 LLM 市場。該公司同時跟香港電訊、德勤中國,以及吉利旗集團下的長興吉數簽訂合作備忘錄,為本港企業提供系統整合服務,如顧問、開發 AI 應用程式等。

馮愈表示,目前跟多間本港企業接洽,亦與 3 間合作夥伴簽訂備忘錄提供整合服務。

商湯上月推出的行業一體機,亦在香港設廣東話版,包括金融、醫療、程式碼、政務等。馮愈表示,讓企業在私有雲內提供大型語言模型支援,能夠保障數據和私隱安全,幾乎所有正在洽談的本地金融公司都打算以此方式部署。

他又稱,目前已跟多間本地企業洽談,有醫療和政府部門,他們的基本要求識別文件,讓同事通過簡單文字搜尋快速找回所需文件,另外亦有建立客戶服務、虛擬助理等。

7.1 推出公眾版永久免費

至於向消費者提供的商量 5.0 廣東話版,流動應用程式和網站將在 7 月 1 日推出,並強調永久免費。馮愈表示,讓本港用戶有廣東話的對話機械人,毋須 VPN 連線直接使用。根據現場示範,商量 5.0 廣東話版在生成文字時有繁簡中文夾雜問題,而廣東話語音亦未夠流暢。他指出,模型仍有不足,因此一個月後開放給公眾使用,期間會改善技術。他又稱,廣東話版屬日日新 5.0 的小語種,今次的版本針對香港作訓練,而其他地區的廣東話,如澳門、廣州、東南亞,則按市場情況考慮推出。

廣東話的商量將在 7 月 1 日推出流動程式和網頁版。

最新影片

Exit mobile version