更多

    為普及語音軟件開發 Google 開放 AI 訓練用聲音檔

    Mickey Chan
    Mickey Chan
    愛騎單車的宅,眼鏡娘控。 1.膽固醇跟美味是成正比的; 2.所有人都可以騙,但絕對不能騙自己; 3.賣掉的貨才是錢,不賣的收藏品不值一文; 4.踩單車,是為了吃更多美食! 5.正義的話語,不一定出自正義之人的口;

    悄悄推出 Metal Developer Tools for Windows    窺探 Apple 進攻遊戲領域大計

    雖然遊戲在 iPhone 和 iPad 是最大的軟件類型,不過在 Apple TV 和 Mac 機上,遊戲沒有那麼受重視。而在 Apple 公布 Mac 機以自家研發的 Apple Silicon 處理器取代 Intel CPU ,並且表明不再有 Boot Camp 來執行 Windows 遊戲之後,有些網友就認為遊戲在 Mac 機已死。不過事實上剛好相反, Apple 這一著,可能令他們成為最大遊戲平台!

    【暑假冇展睇】動漫節不敵疫情宣布延期至年底

    原定本星期三舉行的香港書展已經在今早宣布因疫情反彈而延期舉行,當時已經有人猜測緊接於 7 月 24-27 日舉行的「香港動漫電玩節暨巨匠潮流藝術玩具展」會否也因而要押後甚至取消?果不其然,大會在黃昏發出通知,正式宣告動漫節押後的消息。

    屋企如狗竇網上會議唔敢見人? 宜家虛擬美圖背景幫到你

    疫情反彈,大家又要被迫回到居家工作、網上開會的狀態。不過,筆者自問家中如亂葬崗,要用視像開會實在不能示人。著名的傢俬品牌 IKEA 也深明大家的煩惱,剛推出一系列「 IKEN 虛擬美圖背景」,讓大家作為網上會議背景示人,順便也宣傳下他們的 2020 傢伙系列,一家便宜兩家著。

    對一般初學者來說,要建立人工智能語音指令最難搞的地方,就是要去找足夠的語音資料來讓 AI 學習。 Google 最近為了讓語音軟件的開發普及化,就將一批基本語音指令的聲音檔案資料公開,讓一般開發人可以輕易進行 AI 語音學習。

    大家可以到 Open Speech Recording 網站去提供語音資料
    大家可以到 Open Speech Recording 網站去提供語音資料

    這套用來開發語音辨認軟件的 AI 學習用基本指令語音檔案名為「 Speech Commands Dataset 」,是由 Google 負責人工智能架構 TensorFlow 相關團隊,和 5 月時曾推出 Raspberry Pi 語音辨識開發套件 Voice Kit 的 AIY Project 團隊共同推出,資料容量有 1.4GB ,裡面收錄了 30 個如「 Yes 」、「 No 」、「 Left 」、「 Right 」、「 Go 」、「 Stop 」等常用英語語音指令的 1 秒鐘檔案達 65,000 個,這些檔案都是在 AIY Project 所推出的 Open Speech Recording 網站上公開招募下錄下來的。該網頁仍然在運作中,所以如果你也參與的話,說不定你的聲音也會收錄在日後的更新版本中。

    Google 的 AIY Project 曾於今年 5 月推出語音指令開發用的套件 Voice Kit ,而「 Speech Commands Dataset 」亦可以放在 Voice Kit 上使用。
    Google 的 AIY Project 曾於今年 5 月推出語音指令開發用的套件 Voice Kit ,而「 Speech Commands Dataset 」亦可以放在 Voice Kit 上使用。

    除了 Google 的計劃外,其實 Mozilla 也在今年 6 月推出類似的「 Common Voice 」計劃,他們仍在收集語音的階段,目標是希望收集 10,000 小時語音資料,而且也預計會在今年內公開資料檔。

    Mozilla 也在收集語音資料,目標是收集 10,000 小時分量的資料。
    Mozilla 也在收集語音資料,目標是收集 10,000 小時分量的資料。

    下載 Google 「 Speech Commands Dataset 」:按此
    Open Speech Recording 錄音網站:按此
    Mozilla 「 Common Voice 」網站:按此

    相關文章