aria tech blog

深層学習に関する調べものなどをまとめます

論文サーベイ:Singing Voice Conversion(歌声変換)

目次 目次 本記事の概要 Unsupervised Singing Voice Conversion 概要 詳細 データセット PitchNet: Unsupervised Singing Voice Conversion with Pitch Adversarial Network 概要 詳細 データセット Unsupervised Cross-Domain Singing Voice Conversion 概…

論文解説:Phonetic Posteriorgrams based Many-to-Many Singing Voice Conversion via Adversarial Training

目次 目次 論文情報 概要 提案手法 Generator Audio Generation Discriminator Feature Disentanglement Discriminator 2段階の訓練 実験 結果 所感 参考文献 論文情報 arxiv:[2012.01837] Phonetic Posteriorgrams based Many-to-Many Singing Voice Conve…

論文解説:Transfer Learning from Speech Synthesis to Voice Conversion with Non-Parallel Training Data

目次 目次 論文情報 概要 提案手法 TTL-VC の概要 TTSタスクによる事前学習 TTL-VC の学習 学習フローについて 実験 結果 所感 参考文献 論文情報 arxiv:[2009.14399] Transfer Learning from Speech Synthesis to Voice Conversion with Non-Parallel Trai…

論文解説:Voice Transformer Network: Sequence-to-Sequence Voice Conversion Using Transformer with Text-to-Speech Pretraining

目次 目次 論文情報 概要 提案手法 sequence-to-sequence TTS Transformer-based TTS 学習について Decoder pretraining Encoder pretraining VC model training 実験 結果 所感 参考文献 論文情報 arxiv:[1912.06813] Voice Transformer Network: Sequence…

論文解説:AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss

目次 目次 論文情報 概要 提案手法 学習について モデル Loss なぜ学習がうまくいくのか? 実験 結果 所感 参考文献 論文情報 arxiv:[1905.05879] AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss demo : AutoVC Demo https://github.c…