#author("2025-07-19T05:09:43+00:00","default:yoya","yoya")
TITLE:音声
[[Audio]] | [[Voice]]

- 音声合成 ([[VoiceSynthesis]])
- 音声認識 ([[VoiceRecognition]])

* コーデック [#j8408233]

- [[Speex]]
- [[Opus]] / [[SILK]] (Skype)
- [[Lyra]] (Google)
- [[Satin]] (Microsoft)

* ケプストラム [#ibc6e028]

- ケプストラム分析。Pythonで音声信号処理(2011/05/14)の第18回目。
--  http://aidiary.hatenablog.com/entry/20120211/1328964624
- SPTKの使い方 (7) メルケプストラム分析合成
--  http://aidiary.hatenablog.com/entry/20130119/1358563384


* 音声コーパス [#z078bcbb]

- https://twitter.com/forthshinji/status/1228976871917768704
>
音声合成ならJSUT https://sites.google.com/site/shinnosuketakamichi/publication/jsut (単一話者10時間)
>
音声変換ならJVS https://sites.google.com/site/shinnosuketakamichi/research-topics/jvs_corpus (100人話者)
>
歌声合成ならJVS-MuSiC https://sites.google.com/site/shinnosuketakamichi/research-topics/jvs_music (100人歌唱者) 
>
がオススメです..

* 機械学習 [#n4d8dbaf]

- 七声ニーナを支えるバックエンド技術
--  https://engineer.dena.com/posts/2021.04/voice-avatar-backend/

* その他 [#f3646d75]

- 言語情報処理論
--  https://www.gavo.t.u-tokyo.ac.jp/~mine/japanese/chiba2007/2007-11-21.pdf



* 関連 [#rel]

- [[Audio]]
- [[Sound]]