在人工智能狂潮下,Google 由 Mobile First 轉型 AI First,今年 Google I/O 開發者大會,主題演講將有關 Android 的內容獨立抽出,上星期已在 The Android Show I/O Edition 為大家介紹,現場演講就全力集中人工智能應用,強調打造更聰明、更代理化 (Agentic) 和更個人化人工智能。
據 Google CEO Sundar Pichai 表示 Google 正處於轉換 AI 平台的新階段。在這個階段,Google 數十年來的研究成果正向全世界的人們、企業和社群實現。今年 I/O 展示 Google 正在各個層面引入 Gemini 人工智能,全面向 Android 和 iOS 手機開放 Gemini Live;AI 模式將在 Google 搜尋全面啟用,替用戶收集網上資料編成摘要;網上購物引入代理化功能,替大家格價下單;向 Gemini Live 和 Search Live 下放部分通用人工智能能力如視像理解和記憶;持續增強影片、圖像和音樂生成模型,並向製片人推出新的人工智能製片工具。不過對大部分香港人來說,Google 在人工智能的創新似乎未必有感。
延伸閱讀
Google 搜尋 AI 模式本周正式推出
去年 Google 在搜尋中引入 Gemini 人工智能生成式 AI 資訊摘要(AI Overview),現在已經在超過 200 個國家及地區推出,支援超過 40 種語言。Sundar Pichai 在今年 I/O 大會就宣布將會向美國用戶全面推出 Google 搜尋「AI 模式」。
用戶只要在搜尋時選擇 AI 模式,提供更深入的對話和多模態查詢,並在同一個介面提供摘要、連結、地圖等多種類型資料,讓用戶輕易掌握多更資訊。
AI 模式和 AI 資訊摘要會採用特製版本的 Gemini 2.5 模型提供功能強大的 AI 搜尋能力,用戶不需要在不同網頁中逐一搜索就能得到有用資訊。Google 搜尋 AI 模式會理解用戶詢問的語境,抽出內容的各項細節,利用網上、Google 知識圖譜、真實世界、商家、天氣和財經等各方面資料,生成有用的搜尋結果和後續查詢。
AI 模式同時會加入深度搜尋功能,在運動和財經研究的 Search Labs,提供複雜的分析和可視化功能,能生成多種類型圖表幫助分析。
至於中文支援方面,雖然現時有向台灣用戶提供 AI 資訊摘要,但就沒有提供給中港澳門用戶。
思考更深入 Gemini 2.5 Pro Deep Think
Google 今年 3 月推出 Gemini 2.5 Pro 模型實驗版,被譽為 Google 最聰明的 AI 模型,4 月再推出有快速思考的 Gemini 2.5 Flash 模型,在 LM Arena 等級評測中取得 1,423 分的佳績。在 Google I/O 中 Google DeepMind CEO Demis Hassabis 就宣布將在 6 月初將推出 Gemini 2.5 Pro Deep Think,給多點時間 Gemini 進行思考以取得更精準的回應。
從 Google 提供的圖表可以看到 Gemini 2.5 Deep Think 在數學和編程測試都有優異的表現,在多模態測試中亦優於對手 OpenAI 的 o3 和 o4 模型。
AI 回應更貼個人需要 Personal Context
現時個人使用的 AI 功能,主要都是提供泛用的資料和用戶過去搜尋過的資料,不過要真正做到貼心協助,AI 就需要了解更多用戶的個人數據。Google 在 I/O 就宣布推出 Personal context(個人語境),用戶可決定讓Gemini 連結自己的 Google 應用程式提供更乎合用戶需要的幫助。首先支援的將會是 Gmail,更多 Google 會在不久陸續加入。
Personal context 可提供「個人化智慧回覆」,以用戶的過往電郵、文件、行事曆等為材料來撰寫自動電郵回覆,或提供為個人訂制的行程建議。這功能將於今年夏季向 Google Labs 訂戶提供。
通用 AI 助理進化 行動智能+Gemini
開發大型語言模型最終的目標是要開發通用型 AI 助理,能幫助人類處理各種事務。去年 Google 發表 Project Astra 的示範影片,展示早期通用型 AI 助理的記憶力、多模態和分析能力。今年他們就宣布打造 AGI 通用人工智能的下一步是打造能理解和模擬物理世界的 World Models。他們將部分 Project Astra 研發出來的 AI 功能例如影像理解能力、屏幕分享和記憶等,下放至 Gemini Live 和 Search Live,讓一般用戶也開始體驗得到。
在今年 I/O 中 Project Astra 再有進化,結合行動智能和 Gemini。Google 播出一段修理單車的影片,片中 Gemini 除了能跟人自然語音交談外,還會手替用戶從網上搜尋說明書並會自動翻到有關內容的頁面;根據電郵中的訂單紀錄找出需要的螺絲,並透過鏡頭在工具箱找出它,並能替用戶打語音電話代用戶查詢庫存和下訂。而即使使用期間有人亂入打斷了,Gemini 仍然記得內容,能接續未完的回覆。
Project Starline 會議進化 Google Beam AI 拼砌立體影像
新冠疫情令視像會議成為辦公室日常,Google 就在 2022 年發表 Project Starline,讓身處異地的人能以等身大小,立體地呈現在眼前,無論舉手投足和眼視接觸都像真人在現場。去年 Google 宣布與 HP 合作,計劃在 2025 年推出 Project Starline 視像會議產品。
在今年 Google I/O,Sundar Pichai 就宣布該產品名為 Google Beam,它的屏幕周圍配備了 6 個鏡頭,利用 AI 將影像整合成立體畫面。HP 將會在數星期內公布更多有關細節。
其他 Google I/O 重點
- 宣布即日向 Google Meet 訂戶提供即時語音翻譯,首先支援的語言將是英語與西班牙語互譯。幾個星期內會加入更多語言。
- 將在 Google Chrome、搜尋和 Gemini 應用程式注入 AI 代理功能,提供給 Gemini 訂戶,並且支援由 Anthropic 提倡的 MCP(模型上下文協議),讓開發者可以更用易開發出代理化應用。
- Gemini Live 加入 Search Live 功能,Gemini 能夠透過鏡頭一邊觀看用戶所見的事物,一邊回應用戶的查詢,同時提供網上有用資料的連結。
- 針對有重度 AI 需求的用家,即日在美國推出 Google AI Ultra 訂閱計劃,月費 $249.99 美元(約港幣 $1,955)。未來數月這月費計劃將擴展至 70 個國家及地區。
- 展示 Gemini 在 Samsung 即將發表的 Android XR 智能眼鏡和頭戴裝置的應用。