- 追加された行はこの色です。
- 削除された行はこの色です。
- VALL-E へ行く。
- https://valle-demo.github.io/
- https://doi.org/10.48550/arXiv.2301.02111
- https://arstechnica.com/information-technology/2023/01/microsofts-new-ai-can-simulate-anyones-voice-with-3-seconds-of-audio/
* VALL-E X [#pa287384]
- https://plachtaa.github.io/
-- https://github.com/Plachtaa/VALL-E-X
- https://twitter.com/matsu_vr/status/1695427272243884035
>
松xR
@matsu_vr
マイクロソフトのVALL-Eを、論文からオープンソースで実装してしまったらしい。短い音声を入れるだけで、その声で別の文章を生成出来ちゃうやつ。でもページの一番下にあった、日本語の音声から英語音声作ってるのがビビった。ただ、MS版のデモより少し音質は劣るかも?
*. [#j7477881]
- Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表
-- https://gigazine.net/news/20230110-microsoft-vall-e/
* 関連 [#rel]
- [[EnCodec]] (Facebook)
- [[NaturalSpeech2]] (Microsoft)