'達摩院發佈新一代AI語音FPGA芯片,處理速度成百倍提升'

"

在美國舊金山舉行的芯片行業頂級學術會議HOTCHIPS上,阿里巴巴達摩院發佈了新一代AI語音FPGA芯片技術——Ouroboros,該技術能將語音生成算法的計算效率提高百倍以上。

"

在美國舊金山舉行的芯片行業頂級學術會議HOTCHIPS上,阿里巴巴達摩院發佈了新一代AI語音FPGA芯片技術——Ouroboros,該技術能將語音生成算法的計算效率提高百倍以上。

達摩院發佈新一代AI語音FPGA芯片,處理速度成百倍提升

阿里達摩院介紹,在使用AI語音合成算法WaveNet生成1秒語音的情況下,如果底層硬件採用的是CPU和GPU,生成語音需要花費50秒,但如果採用Ouroboros,在FPGA環境下完成生成只要 0.3秒。

阿里巴巴稱,這是業界首款專用於語音合成算法的 AI FPGA芯片結構設計,能將語音生成算法的計算效率提高百倍以上。

根據阿里達摩院掃地僧的說法,用AI語音合成算法WaveNet生成1秒語音,CPU和GPU需要50秒的計算時間,但Ouroboros在FPGA環境下只要 0.3秒。Ouroboros的一大突破,是用端上定製硬件加速技術替代雲端服務器,避免了對網絡連接和雲端服務的強依賴性。

針對 ASIC 實現的性能仿真預估表明,Ouroboros 的設計可以實時運行 WaveNet 等業界先進的文字轉語音(TTS,Text-to-Speech)算法 ,實現實時語音合成。

另據瞭解,Ouroboros 技術同樣適用於達摩院於今年 7 月發佈的新一代的語音合成算法KAN-TTS。該算法將商用系統裡的合成語音與原始語音的相似度提高到97%以上。

還有消息指出,Ouroboros 技術,同樣適用於達摩院於今年 7 月發佈的新一代的語音合成算法KAN-TTS。該算法將商用系統裡的合成語音與原始語音的相似度提高到97%以上。Ouroboros芯片技術除了語音合成之外,還將支持AI語音識別。基於Ouroboros研發完整的語音AI芯片,有望率先在天貓精靈上落地。

我們注意到,與阿里其它近來發布的其他芯片產品一樣,這個產品的命名也很有特色。Ouroboros中文是銜尾蛇,是一個古代流傳下來的符號,形象為一條蛇(或龍)吞食自己的尾巴,結果形成一個圓環(有時亦會展示成扭紋形,即“∞”),其名字涵義為“自我吞食者”。這個符號一直都有很多不同的象徵意義,而當中最為人接受的是“無限大”、“循環”等。

"

相關推薦

推薦中...