更多

    港大研究轉化商用  CISC 網絡爬蟲分析網絡輿情

    Eric Chong
    商業・科技・創業・編輯

    網民集合的力量,在 Reddit 的 r/WallStreetBets 擊退沽空 GameStop 的炒家發揮至極。網民在討論區和社交網絡的討論影響品牌形象,但商戶卻無法分析留言。香港大學計算機科學系副教授鄒錦沛研究網絡爬蟲技術多年,透過技術轉移處將研究成果轉為商用,成立創業公司 CISC ,推出艾慧思( IaaS )服務,企業藉此分析網絡輿情。

    鄒錦沛專問研究網絡犯罪和電腦取証,同時身兼港大資訊保安及密碼學研究中心主任,早在 2005 年與香港海關研發「網線監察系統」,追蹤網上 BitTorrent 發放侵權檔案。他解釋,該系統通過規則為基礎的爬蟲技術,自動搜集網上的 BT 種子加以分析是否屬侵權內容。當年用此系統所得的證據,拘捕外號「古惑天皇」的陳乃明,成為全球首宗用 BT 上載被控侵權案例。

    鄒錦沛基於此系統為海關開發更多網上智能情報分析技術,如分析互聯網圖片和文字,追蹤網上售賣假貨活動。之後更升級成追蹤社交平台的「網訊 」( SocNet System ),打擊商戶在社交平台銷售侵權貨品。

    他指出,同一技術應用在分析商業品牌大有潛力,於是在 2016 年成立創業公司 CISC ,把該技術轉為企業的網絡服務艾慧思。

    艾慧思加入自然語言處理( NLP )、深度學習影像分析等人工智能技術,分別從 Facebook 、 Instagram 等社交網絡,以及網上討論區搜集公共數據,經分析整理找出內裡的智能訊息。鄒錦沛表示,所產生的智能訊息可以用於保護知識產權、調查網絡罪案,而最廣泛用途便是商業智能分析。「通過分析語意,了解評論屬正評或負評,有助企業品牌掌握用戶的情緒。」

    該平台亦可按企業的需要,自動追蹤個別議題,當網絡輿論轉風向,及早作出提示。

    然而在研究成果轉化的過程充滿挑戰,鄒錦沛獲港大技術轉移處( TTO )協助,從過去的研究技術變成推出市場的商業服務。他表示,研發技術與商業社會始終有一定差距, TTO 提供支援,了解市場的需求。

    他舉例,設計用戶友善的介面是重要一環。過去為海關所開發的系統,訓練專人操作,用戶介面設計可以較複雜。惟推出市場的服務由用戶自助使用,介面設計要求簡單易用,因此聘試專人設計。

    由於過去與特區政府多個部門合作, CISC 首批客戶都是部門和院校為主,正在開拓更多商業市場。他表示,過去有海關的成功案例,有助加強客戶的信心。事實上,艾慧思還在擴展功能,更貼近企業客戶追蹤品牌的需要,例如爬蟲系統加入人工智能,從數據發掘更多資訊。

    您會感興趣的內容

    相關文章