特區政府近年開放更多數據,下一步開始研究使用數據,例如利用人工智能的機械學習分析數據,改善政府服務。特區政府資訊科技總監辦公室( OGCIO )協助各部門運用人工智能技術,除了提供雲端平台,還擔任顧問角色,建議如何有效使用人工智能技術。最新成果有聯同運輸署開發交通數據分析系統,實時顯示路面情況,又預測 15 分鐘至 90 分鐘的交通變化。環保署則開發機械學習模型,從聲響識別非法改裝車輛。
開放數據下載量破 200 億次
OGCIO 數據分析總系統經理趙善衡稱,近年各部門加快發展的開放數據,同時受惠 2020 年 9 月推出的政府雲端平台和大數據分析平台,減省採購程序,有助縮短各服務開發時間起碼 3 個月。目前政府雲端平台支援逾 360 項數碼政府服務,以及超過 15 項大數據分析。
資料一線通上現有 4,970 個開放數據集,共 58TB 容量。今年 1 月至 7 月下載量超過 200 億次,平均每日約 1 億,亦已接近去年的 217 億次。去年新增較熱門的數據集有專營巴士實時到站數據、港鐵部分路線到站數據,以及專線綠 Van 的實時到站數據。
趙善衡指出,近年各部門開始有更多人員具備處理數據能力,將日常營運的問題用人工智能方式解決。 OGCIO 則擔當顧問提供意見,協助選用合適的模型和演算法處理。
預測路面交通狀況
交通數據分析系統由運輸署與 OGCIO 共同開發,結合多個數據來源用人工智能分析,目的為提升交通管理效率,又在《香港出行易》程式內提供最多 90 分鐘後的路線搜尋規劃行程。今年 4 月又經 API 開放搜尋路線功能,至 6 月已有逾 7,000 次請求。
運輸署技術服務科智慧出行部運輸資訊組高級工程師陳錫鎮介紹,交通數據分析系統結合的數據來源包括交通探測器、公共交通工具的預計到站時間、路面交通事故,以及實時和預測天氣。交通探測器原本安裝在智能燈柱上,透過藍牙裝置偵測車速,曾引起私隱疑慮已移除,現在安裝在主要幹道的一般燈柱上,收集交通數據,大約覆蓋本港兩成路面。
公共交通工具的預計到站時間,由兩間專利巴士公司在資料一線通開放的數據,以及專線小巴實時到站資訊系統的數據結合而成。陳錫鎮表示,由於巴士和小巴車速有差異,還開發人工智能模型準確估算實際的車速。這些數據令系統可分析七成道路,再配合天文台提供的天氣,尤其預測落雨情況,加上運輸署的交通意外報告,處理所有數據作綜合分析。
交通數據分析系統採用機神經網絡模型,將道路種類、天氣警告、突發事件類別視作為「分類變數」,而行車速度、雨量水平等則為「數量變數」,配合地理數據、時間、突發資訊等,計算出全港大部分道路的交通情況,包括實時至未來 90 分鐘的變化。
陳錫鎮指出,交通數據分析系統在運輸內部設有儀表板,地圖上用顏色標示交通流量,可仔細至個別道路的車速,包括現時車速、過往平均車速,以及估算車速。如當路面發生事故,系統能即時反映,讓運輸署按情況即時協調各交通工具。
而交通數據分析系統的預測數據已經加入至《香港出行易》,讓用戶搜尋點到點的交通路線,其中出發時間可選 15 分鐘後至 90 分鐘後,正是利用系統估算的預測數據。
業界亦可在資料一線通經 API 搜尋路線,同樣用上實時和預測的交通數據。陳錫鎮稱,開放至今數個月已有逾 7,000 次請求,業界的潛在用途眾多,例如物流公司用作規劃司機送貨路線。
AI 分析死氣喉聲音識別改裝車
特區政府使用人工智能的例子有環保署開發識別非法改裝車輛。這方案用人工智能識別非法改裝車輛,死氣喉發出的聲音。 OGCIO 數據分析系統經理吳文婷指出,這方案既低成本又有效偵測。在路邊設置方案,包括收集聲量的咪高峰、分析用的平板電腦、配備紅外線照明燈的攝影機。當車輛經過時,從咪高峰錄下聲音再轉化成聲紋記錄,交由平板電腦內的機械學習模型分析對比,偵測死氣喉的聲音,判斷車輛有否改裝。如發現便啟動攝影機攝取圖像及記錄車牌。
吳文婷說,人工智能識別非法改裝車輛由環保署前線人員提出並著手開發,器材成本僅約一 萬港元,僅是傳統專業設備的 1% 成本。
創新之處在於將死氣喉聲音轉化成聲紋分析,利用深度學習的卷積神經網絡模型,推論聲音是否來自經改裝的死氣喉。吳文婷稱,由於初期缺乏訓練數據,經數據加強方式產生大量死氣喉聲紋,並在政府大數據分析平台將模型訓練至成熟可用。現時可信度達至 90% ,惟用於執法還要改進,正與運輸署和警務署著手改善,以及探討日後執法的可行性。
吳文婷又指,這方案證明政府部門具有創新意念,亦有執行能力,甚至在今年的日內瓦國際發明展獲銀獎。
開發政府對話機械人即服務
另外,趙善衡稱 OGCIO 正在開發政府對話機械人即服務( Chatbot-as-a-Service ),概念如同政府雲端平台,讓各部門共享資源。自 OGCIO 在香港政府一站通網站推出協助搜尋電子表格的對話機械人 Bonny 後,已有 10 個部門設對話機械人,如天文台的度天隊長。如能夠提供 CaaS ,可同時共用自然語言處理引擎及知識庫,能加快部門推出對話機械人服務。