卒研配属希望者へ

音声や機械学習に興味がある積極的な学生さんを歓迎します。年に2度の音響学会への参加だけでなく、成果が出れば海外の国際会議にも参加することができます(旅費・参加費は全額支給します)。研究テーマは基本的には個人で自由に設定していただきますが、こちらから幾つか提示することも可能です。具体的な過去の卒研・修論テーマについては以下を参照してください。

研究室公開

zoomのリンクや資料などをGoogle Classroomで公開しています。 link

面談について

中鹿研では第一次配属での面談は必須となっています。研究室配属を希望される方は、中鹿(nakashika[at]uec.ac.jp)までメールをお願いします。個別で日程調整します。

過去の卒研・修論テーマ例

  1. 卒研テーマ
    • 連続時間拡散モデルを用いたノンパラレルなAny-to-Many声質変換
    • FaderNetworks を用いたF0 変換による歌唱技術の付与
    • 分類型半制限ボルツマンマシンによる全音程関係を考慮した和音認識
    • FaderNet を用いた未知話者に対する音声印象変換
    • Dual Diffusion Implicit Bridges を用いた話者間の匿名性を担保した声質変換
    • 潜在変数と観測データにガンマ分布を仮定したVAEによる音声振幅スペクトル表現
    • 条件付き方位Boltzmann machineによる位相復元
    • 音素識別誤差を考慮したDNNによる声質変換
    • FaderNetworksに基づく話者性を保持した音声性別変換
    • DRM を用いた唇動画像と音声の 双方向変換
    • RBM を用いた楽器音基底と演奏情報への分離 による多重音解析
  2. 修論テーマ
    • 指数型制限ボルツマンマシンを用いた優決定ブラインド音源分離
    • FaceNet 特徴量を用いた顔画像に相応な声質変換
    • 2 種のラグ窓によるスペクトル平滑化を用いたF0 推定
    • 事前学習済みモデルによる埋め込み表現を組み込んだ音声編集モデル
    • データ変換を用いた音声生成タスクの改善
    • 話者因子係数の量子化に基づく声色制御可能な話者変換
    • 振幅重み付きエネルギー関数を用いた方位Boltzmann machineによる位相復元
    • Deep Relational Model の音声信号処理への応用
    • マルチタスクモデルを用いた disentangle な学習による楽器音変換
    • 適応型 RBM を用いた音声情報の分離による話者・感情変換

卒業生の就職先