Journal Papers (学術論文)

2021

  • Toru Nakashika and Kohei Yatabe
    Gamma Boltzmann Machine for Audio Modeling
    IEEE/ACM Transactions on Audio Speech and Language Processing, Vol.29, pp.2591-2605, 2021.

2020

  • Takuya Kishida and Toru Nakashika
    Speech chain VC: linking linguistic and acoustic levels via latent distinctive features for RBM-based voice conversion
    IEICE TRANSACTIONS on Information and Systems, Vol.E103-D, No.11, pp.1-11, August 2020.

2019

  • Yuki Takashima, Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki
    Non-parallel dictionary learning for voice conversion using non-negative Tucker decomposition
    EURASIP Journal on Audio, Speech, and Music Processing, DOI: 10.1186/s13636-019-0160-1, 1-11, pp.1-11, August 2019.
  • Kentaro Sone and Toru Nakashika
    Pre-Training of DNN-Based Speech Synthesis Based on Bidirectional Conversion between Text and Speech
    IEICE TRANSACTIONS on Information and Systems, Vol.E102-D, No.8, pp.1546-1553, August 2019.

2018

  • Toru Nakashika, Shinji Takaki, and Junichi Yamagishi
    Complex-Valued Restricted Boltzmann Machine for Speaker-Dependent Speech Parameterization From Complex Spectra
    IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.27, No.2, pp.244-254, Oct. 2018.

2017

  • Toru Nakashika and Yasuhiro Minami
    Speaker-adaptive-trainable Boltzmann machine and its application to non-parallel voice conversion
    EURASIP Journal on Audio, Speech, and Music Processing, DOI: 10.1186/s13636-017-0112-6, pp.1-10, June 2017.
  • Toru Nakashika
    Deep Relational Model: A Joint Probabilistic Model with a Hierarchical Structure for Bidirectional Estimation of Image and Labels
    IEICE Transactions on Information and Systems, Vol.E101-D, No.2, pp.428-436, Feb. 2018.

2016

  • Toru Nakashika, Tetsuya Takiguchi, and Yasuhiro Minami
    Non-Parallel Training in Voice Conversion Using an Adaptive Restricted Boltzmann Machine
    IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.24, No.11, pp.2032-2045, Nov. 2016.
  • Yuki Takashima, Toru Nakashika, Tetsuya Takiguchi, Yasuo Ariki
    Phone Labeling Based on the Probabilistic Representation for Dysarthric Speech Recognition
    American Journal of Signal Processing, Vol. 6, No. 1, pp. 19-23, doi:10.5923/j.ajsp.20160601.03, June 2016.

2015

  • Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki
    Voice conversion using speaker-dependent conditional restricted Boltzmann machine link
    EURASIP Journal on Audio, Speech, and Music Processing 2015, 2015:8, DOI 10.1186/s13636-014-0044-3, 12 pages, February 2015.
  • Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki
    Voice Conversion Using RNN Pre-Trained by Recurrent Temporal Restricted Boltzmann Machines link
    IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol.23, No.3, pp.580-587, March 2015.

2014

  • Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki
    Probabilistic spectral envelope modeling of musical instruments within the non-negative matrix factorization framework for mixed music analysis link
    Acoustical Science and Technology, Vol.35, No.4, pp.181-191, July 2014.
  • Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki
    Parallel Dictionary Learning Using a Joint Density Restricted Boltzmann Machine for Sparse-Representation-Based Voice Conversion
    Advances in Computer Science and Engineering, Vol.12, No.2, pp.101-117, June 2014.
  • Toru Nakashika, Toshiya Yoshioka, Tetsuya Takiguchi, Yasuo Ariki, Stefan Duffner, and Christophe Garcia
    Convolutive Bottleneck Network with Dropout for Dysarthric Speech Recognition
    Transactions on Machine Learning and Artificial Intelligence, Vol.2, No.2, pp.46-60, April 2014.
  • Toru Nakashika, Takeshi Okumura, Tetsuya Takiguchi, and Yasuo Ariki
    Hierarchical Sparse Representation for Object Recognition
    Transactions on Machine Learning and Artificial Intelligence, Vol.2, No.1, pp.46-60, February 2014.
  • Toru Nakashika, Takafumi Hori, Tetsuya Takiguchi, and Yasuo Ariki Depth Spatial Pyramid: a Pooling Method for 3D-Object Recognition
    Advances in Computer Science and Engineering, Vol.12, No.1, pp.15-30, 2014.
  • Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki
    Voice Conversion Based on Speaker-Dependent Restricted Boltzmann Machines
    IEICE Transactions on Information and Systems, Vol.E97-D, No.6, pp.1403-1410, June 2014.

2013

  • Daiki Nishimura, Toru Nakashika, Tetsuya Takiguchi, and Yasuo Ariki
    Mixed Music Analysis with Extended Specmurt
    Journal of software engineering and applications, Volume 6, Number 5, pp. 274-279, May 2013.
  • Daiki Nishimura, Toru Nakashika, Tetsuya Takiguchi, and Yasuo Ariki
    Sparseness Criteria of F0-Frequencies Selection for Specmurt-Based Multi-Pitch Analysis without Modeling Harmonic Structure
    Journal of Signal Processing, Vol. 17, No. 2, pp.29-38, March 2013

International Conferences (国際会議論文)

2022

  • Kotaro Onishi, Toru Nakashika, "MoCoVC: Non-Parallel Voice Conversion With Momentum Contrastive Representation Learning," Proc. APSIPA, pp. 1438-1443, Nov. 2022.
  • Kotaro Onishi, Toru Nakashika, "Consistency Regularization for GAN-Based Neural Vocoders," Proc. APSIPA, pp. 1131-1136, Nov. 2022.
  • Takumi Isako, Kotaro Onishi, Takuya Kishida, Toru Nakashika, "Controllable Voice Conversion Based on Quantization of Voice Factor Scores," Proc. APSIPA, pp. 1444-1448, Nov. 2022.

2020

  • Toru Nakashika and Kohei Yatabe, "Gamma Boltzmann Machine for Simultaneously Modeling Linear- and Log-amplitude Spectra," Proceedings of APSIPA Annual Summit and Conference 2020, pp. 471-476 December 2020.
  • Toru Nakashika, "Complex-Valued Variational Autoencoder: A Novel Deep Generative Model for Direct Representation of Complex Spectra," Proceedings of the Interspeech 2020, pp. 2002-2006, October 2020.
  • Takuya Kishida, Shin Tsukamoto and Toru Nakashika, "Simultaneous Conversion of Speaker Identity and Emotion Based on Multiple-Domain Adaptive RBM," Proceedings of the Interspeech 2020, pp. 3431-3435, October 2020.
  • Michel Pezzat, Hector Perez-Meana, Toru Nakashika and Mariko Nakano, "Many-to-Many Symbolic Multi-track Music Genre Transfer," Proceedings of the SoMeT 2020, pp. 272-281, September 2020.

2019

  • Yuki Takashima, Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki, "Non-parallel dictionary learning for voice conversion using non-negative Tucker decomposition," EURASIP Journal on Audio, Speech, and Music Processing, DOI: 10.1186/s13636-019-0160-1, pp. 1-11, August 2018.
  • Shinji Takaki, Toru Nakashika, Xin Wang and Junichi Yamagishi, "STFT spectral loss for training a neural speech waveform model," Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2019), pp. 7065-7069, May 2019.

2018

  • Kentaro Sone and Toru Nakashika, "DNN-based Speech Synthesis for Small Data Sets Considering Bidirectional Speech-Text Conversion," Proceedings of the Interspeech 2018, pp. 2519-2523, September 2018.
  • Toru Nakashika, "LSTBM: A Novel Sequence Representation of Speech Spectra Using Restricted Boltzmann Machine with Long Short-Term Memory," Proceedings of the Interspeech 2018, pp. 2529-2533, September 2018.
  • Kentaro Sone, Shinji Takaki and Toru Nakashika, "Bidirectional Voice Conversion Based on Joint Training Using Gaussian-Gaussian Deep Relational Model," Proceedings of the Odyssey 2018, pp. 261-266, June 2018.
  • Yuki Takashima, Hajime Yano, Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki, "Parallel-Data-Free Dictionary Learning for Voice Conversion Using Non-Negative Tucker Decomposition," Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2018), pp. 5294-5298, April 2018.

2017

  • Toru Nakashika and Eriko Aiba, "Practice Process Analysis Using Score Matching Method Based on OBE-DTW and its Effects on Memorizing Musical Score," Proceedings of International Symposium on Performance Science 2017 (ISPS2017), pp. 66-67, September 2017.
  • Toru Nakashika, "CAB: An energy-based speaker clustering model for rapid adaptation in non-parallel voice conversion," Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH 2017, pp. 3369-3373, 2017.
  • Toru Nakashika, Shinji Takaki and Junichi Yamagishi, "Complex-valued restricted Boltzmann machine for direct learning of frequency spectra," Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH 2017, pp. 4021-4025, 2017.

2016

  • Toru Nakashika and Yasuhiro Minami, "3WRBM-Based Speech Factor Modeling for Arbitrary-Source and Non-Parallel Voice Conversion," Interspeech 2016, pp. 1487-1491, September 2016.
  • Zhaojie Luo, Jinhui Chen, Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki, "Emotional Voice Conversion Using Neural Networks with Different Temporal Scales of F0 based on Wavelet Transform," The 9th ISCA Speech Synthesis Workshop (SSW), pp. 153-158, September 2016.
  • Toru Nakashika, Tetsuya Takiguchi and Yasuhiro Minami, "Non-Parallel Training in Voice Conversion Using an Adaptive Restricted Boltzmann Machine," IEEE/ACM Transactions on Audio, Speech and Language Processing, Vol. 24, No. 11, pp. 2032-2045, August 2016.
  • Yuki Takashima, Toru Nakashika, Tetsuya Takiguchi and Yasuo Ariki, "Phone Labeling Based on the Probabilistic Representation for Dysarthric Speech Recognition," American Journal of Signal Processing, Vol. 6, No. 1, pp. 19-23, June 2016.

Domestic Conferences (国内会議)

2024

  • 平本佳弘, 中鹿亘, “事前学習済みモデルによる埋め込み表現を組み込んだ音声編集モデルの検討,” 日本音響学会2024年春季研究発表会, 1-Q-38, pp. 931-932, March 2024.
  • 越森道貴, 嵯峨山茂樹, 中鹿亘, “2種のラグ窓によるスペクトル平滑化を用いたF0推定,” 日本音響学会2024年春季研究発表会, 2-P-36, pp. 1051-1052, March 2024.
  • 越森道貴, 嵯峨山茂樹, 中鹿亘, “複数のラグ窓対を用いた音声基本周波数と周期性尺度の推定,” 信学技報, vol. 123, no. 403, SP2023-57, pp. 85-90, March 2024.
  • 後藤純平, 中鹿亘, “FaderNetworks を用いた F0 変換による歌唱技術の付与,” 日本音響学会2024年春季研究発表会, 2-P-30, pp. 1035-1036, March 2024., March 2024.
  • 畠山 瑠一 , 奥田 耕平 , 中鹿 亘, “拡散確率モデルを用いたノンパラレルな Any-to-many 声質変換 ,” 日本音響学会2024年春季研究発表会, 2-P-22, pp. 1011-1012, March 2024.
  • 畠山 瑠一 , 奥田 耕平 , 中鹿 亘, “DDPMVC:連続時間拡散確率モデルを用いた非パラレル声質変換と評価,” 研究報告音声言語情報処理(SLP), 2024-SLP-151 No.12, March 2024.
  • 水野 友暁, 岸田 拓也, 吉村奈津江, 中鹿 亘, “Transformer を用いた脳波信号からの音声復元の検討,” 研究報告音声言語情報処理(SLP), 2024-SLP-151, 62, 1-6, March 2024.
  • 石川峻弥, 中鹿亘, “分類型半制限ボルツマンマシンによる全音程関係を考慮した和音認識,” 日本音響学会2024年春季研究発表会, 1-5-1, pp.1063-1064, March 2024.

2023

  • 芦田裕飛,中鹿亘, “SiFiSinger: SiFi-GANを内包した歌唱音声合成,” 日本音響学会2023年秋季研究発表会, 3-Q-25, pp.1375-1376, October 2023.
  • 古田翔太郎, 中鹿亘, “レイリー型制限ボルツマンマシンを用いた独立低ランク行列分析に基づくブラインド音源分離,” 日本音響学会2023年秋季研究発表会, 3-P-7, pp.536-539, October 2023.
  • 髙橋拓椰, 金子仁美, 嵯峨山茂樹, 中鹿亘, “独自非和声音データセットを用いたニューラル言語モデルに基づく旋律分析,” 日本音響学会2023年秋季研究発表会, 3-4-18, pp.1473-1474, October 2023.
  • 釘本咲, 中鹿亘, “ベータ分布に基づくFaderNetを用いた音声印象変換の性能評価,” 日本音響学会2023年秋季研究発表会, 2-Q-42, pp.1281-1282, September 2023.
  • 釘本咲, 中鹿亘, “FaderNetを用いた未知話者に対する音声印象変換,” 音学シンポジウム2023, SP2023-2, pp. 4-7, June 2023.
  • 髙橋拓椰, 金子仁美, 中鹿亘, 嵯峨山茂樹, “音楽分析・生成のための非和声音データベースの構築,” 音学シンポジウム2023, SP2023-20, pp. 97-102, June 2023.
  • 奥田耕平 岸田拓也, 中鹿亘, “Dual Diffusion Implicit Bridgesを用いた話者間の匿名性を担保した声質変換,” 日本音響学会2023年春季研究発表会,1-3Q-10, March 2023, March 2023.
  • 羽賀洋克, 矢田部浩平, 岸田拓也, 中鹿亘, “振幅重み付けエネルギー関数を用いたボルツマンマシンによる位相復元,” 日本音響学会2023年春季研究発表会, 3-3-13, pp. 769-770, March 2023.
  • Speechsplit を用いたイントネーション・リズム・発音の矯正による 外国語アクセント変換, “許 誠, 岸田 拓也, 中鹿 亘,” 日本音響学会2023年春季研究発表会,1-3P-11,, March 2023.
  • 岸田拓也、中鹿亘, “入力特徴量で条件づけた拡散確率モデルによるパラレル声質変換,” 音声研究会, March 2023.

2022

  • 岸田拓也, 中鹿亘, “条件付き制限ボルツマンマシンの平衡化傾向を利用したノンパラレル声質変換,” 日本音響学会2022年秋季研究発表会,2-Q-48,pp. 1305-1306, September 2022.
  • 井硲巧, 大西弘太郎, 岸田拓也, 中鹿亘, “話者因子係数の量子化に基づく声色制御可能な話者変換,” 日本音響学会2022年秋季研究発表会, 2-Q-47, pp. 1301-1304, September 2022.
  • 古田翔太郎, 岸田拓也, 中鹿亘, “制限ボルツマンマシンを用いた独立低ランク行列分析に基づくブラインド音源分離,” 音学シンポジウム2022, SP2022-8, pp. 26-29, June 2022.
  • 平本佳弘, 嵯峨山茂樹, 岸田拓也, 中鹿亘, “LSP周波数間隔のクロスエントロピー誤差最小化に基づくVAE声質変換,” 音学シンポジウム2022, SP2022-23, pp. 100-103, June 2022.
  • 王庭輝, 岸田拓也, 中鹿亘, “リズムスタイルを考慮したFader Networksに基づく外国語学習者の発音変換,” 日本音響学会2022年春季研究発表会, 1-3P-14, pp. 1043-1044, March 2022.
  • 大西弘太郎, 中鹿亘, “非可逆圧縮を用いた敵対的ニューラルボコーダのためのデータ拡張法,” 日本音響学会2022年春季研究発表会, 1-3-15, pp. 923-926, March 2022.
  • Zhou Yujin, 岸田拓也, 中鹿亘, “TTSモデルにおけるアラインメントロバスト性向上のための非停滞化制約付きForward Attention,” 日本音響学会2022年春季研究発表会, 2-3P-7, pp. 1113-1114, March 2022.
  • 岡留有希, 大西弘太郎, 岸田拓也, 中鹿亘, “印象表現語ラベルを用いたFaderNetworksに基づく音声印象変換,” 日本音響学会2022年春季研究発表会, 1-3-7, pp. 897-900, March 2022.
  • 羽賀洋克, 矢田部浩平, 岸田拓也, 中鹿亘, “時系列条件付きボルツマンマシンによる位相復元,” 日本音響学会2022年春季研究発表会,2-3-2, pp. 943-946, March 2022.
  • 飯田紘崇, 岸田拓也, 中鹿亘, “マルチモーダルVAEを用いた顔画像に基づく目標話者音声不要な声質変換,” 日本音響学会2022年春季研究発表会, 2-3-3, pp. 947-950, March 2022.

2021

  • 井硲 巧, 岸田 拓也, 中鹿 亘, “話者依存度に応じた特徴抽出器によるdisentagle な声質変換,” 日本音響学会2021年秋季研究発表会, 1-3-14, pp. 887-888, September 2021.
  • 岸田拓也, 中鹿亘, “深層エネルギーベースモデルによる音声の音響特徴量の生成,” 日本音響学会2021年秋季研究発表会, 2-3-1, pp. 901-904, September 2021.
  • 井硲巧, 岸田拓也, 中鹿亘, “話者特徴抽出器を加えたFaderNetVCによる未知話者声質変換,” 音学シンポジウム2021, 6pages, June 2021.
  • 岸田拓也, 中鹿亘, “Attention RBMによる音声特徴量系列の符号化と生成,” 日本音響学会2021年春季研究発表会, 2-2Q-11, pp. 1103-1106, March 2021.
  • 羽賀洋克, 矢田部浩平, 岸田拓也, 中鹿亘, “条件付きボルツマンマシンによる位相復元の初期検討,” 日本音響学会2021年春季研究発表会, 2-2P-7, pp. 1057-1058, March 2021.

2020

  • 岸田拓也, 中鹿亘, “Cluster ARBM を用いた話者・音韻相互作用分類による声質変換,” 日本音響学会2020年秋季研究発表会, 1-2-13, pp. 721-722, September 2020.
  • 岸田拓也, 中鹿亘, “Speech chain を模倣したボルツマンマシンによるワンショット多対多声質変換の検討,” 日本音響学会2020年春季研究発表会, 3-P-36, pp. 1173-1174, March 2020.
  • 荒川賢也, 岸田拓也, 中鹿亘, “マルチタスクモデルを用いたdisentangleな学習による楽器音変換,” 日本音響学会2020年春季研究発表会, 3-P-41, pp. 1185-1186, March 2020.
  • 塚本伸, 岸田拓也, 中鹿亘, “適応型 RBM を用いた音声情報の分離による話者と感情の同時変換,” 日本音響学会2020年春季研究発表会, 3-P-42, pp. 1187-1190, March 2020.

2019

  • 岸田拓也, 中鹿亘, “Speech chain VC: 音声コミュニケーションの言語-生理-音響連鎖を考慮する声質変換,” 日本音響学会2019年秋季研究発表会, 2-4-4, pp. 969-972, September 2019.
  • 塚本伸, 岸田拓也, 中鹿亘, “適応型RBMを用いたノンパラレル感情音声変換,” 日本音響学会2019年秋季研究発表会, 2-Q-33, pp. 1095-1098, September 2019.
  • 荒川賢也, 岸田拓也, 中鹿亘, “Fader Networksを用いた楽器音変換,” 日本音響学会2019年秋季研究発表会, 1-P-22, pp. 1015-1016, September 2019.
  • 中鹿亘, “複素VAE: 音声の複素スペクトルを直接表現する新しい変分自己符号化器,” 日本音響学会2019年秋季研究発表会, 3-4-1, pp. 981-984, September 2019.
  • 塚本伸, 中鹿亘, “セミパラレル手法による適応型 RBM を用いた声質変換の性能改善,” 日本音響学会2019年春季研究発表会, 1-10-3, pp. 1019-1022, March 2019.
  • 木庭慶人, 中鹿亘, “VAE を用いた多対多声質変換における音素識別制約の検討,” 日本音響学会2019年春季研究発表会, 2-P-28, pp. 1143-1144, March 2019.

2018

  • 高木信二, 中鹿亘, 山岸順一, “スペクトル系列誤差に基づくDNN音声波形モデルの学習,” 日本音響学会2018年秋季研究発表会, 2-4-3, pp. 1131-1132, September 2018.
  • 中鹿亘, 高木信二, 山岸順一, “音声スペクトル系列の自己回帰性を考慮した複素RBMの拡張,” 日本音響学会2018年秋季研究発表会, 2-4-5, pp. 1135-1138, September 2018.
  • 塚本伸, 中鹿亘, “DRMを用いた唇動画像と音声の双方向変換,” 音学シンポジウム2018, 6 pages, June 2018.
  • 荒川賢也, 中鹿亘, “RBMを用いた楽器音基底と演奏情報への分離による多重音解析,” 2018年度人工知能学会全国大会, 4O2-OS-3b-04, 2 pages, May 2018.
  • 高島悠樹, 矢野肇, 中鹿亘, 滝口哲也, 有木康雄, “非負値タッカー分解による NMF 辞書学習に基づく非パラレル声質変換,” 日本音響学会2018年春季研究発表会, 1-9-3, pp. 211-214, March 2018.
  • 曾根健太郎, 中鹿亘, “GGDRMによる双方向変換を考慮したDNN声質変換のための事前学習法,” 日本音響学会2018年春季研究発表会, 1-9-2, pp. 207-210, March 2018.
  • 荒川賢也, 中鹿亘, “RBMを用いた楽器音基底と演奏情報への分離による多重音解析の検討,” 日本音響学会2018年春季研究発表会, 1-12-11, pp. 789-792, March 2018.
  • 塚本伸, 曾根健太郎, 中鹿亘, “DRMを用いた唇動画像と音声の双方向変換の検討,” 日本音響学会2018年春季研究発表会, 1-Q-35, pp. 291-294, March 2018.
  • 中鹿亘, “長・短期記憶構造を持つ拡張ボルツマンマシンの検討,” 日本音響学会2018年春季研究発表会, 2-9-7, pp. 237-240, March 2018.
  • 中鹿亘, 高木信二, 山岸順一, “リカレント構造を持つ複素制限ボルツマンマシンによる複素スペクトル系列モデリング,” 第120回音声言語情報処理研究会, 2018-SLP-120, pp. 1-5, February 2018.
  • 高木信二, 倉田岳人, 郡山知樹, 塩田さやか, 鈴木雅之, 玉森聡, 俵直弘, 中鹿亘, 福田隆, 増村亮, 森勢将雅, 山岸順一, 山本克彦, “国際会議Interspeech2017報告,” 第120回音声言語情報処理研究会, 2018-MUS-118, pp. 1-9, February 2018.

2017

  • 中鹿亘, “フェイクデータを用いた ARBM に基づく非パラレル声質変換手法の改善,” 日本音響学会2017年秋季研究発表会, 2-Q-28, pp. 309-312, September 2017.
  • 曾根健太郎, 中鹿亘, “GCDRMを用いたテキスト・音声の同時確率表現に基づく音声認識・合成器の同時構築,” 日本音響学会2017年秋季研究発表会, 1-8-2, pp. 173-176, September 2017.
  • 中鹿亘, 高木信二, 山岸順一, “複素 RBM を用いた音声スペクトルモデリングの改良と評価,” 日本音響学会2017年秋季研究発表会, 1-8-1, pp. 169-172, September 2017.
  • 中鹿亘, 高木信二, 山岸順一, “複素RBM:制限ボルツマンマシンの複素数拡張と音声信号への応用と評価,” 情報処理学会音声言語研究会技術研究報告, 2017-SLP-117, no. 9, pp. 1-6, July 2017.
  • 曾根健太郎, 中鹿亘, 南泰浩, “テキスト・音声間の双方向変換に基づくDNN音声認識・合成のための事前学習法,” 音学シンポジウム2017, 6 pages, June 2017.
  • 中鹿亘, 南泰浩, “クラスタ適応制限ボルツマンマシンを用いた話者クラスタリングと声質変換への応用,” 第31回人工知能学会全国大会, 2L2-OS-09a-2, 2 pages, May 2017.
  • 高島悠樹, 中鹿亘, 滝口哲也, 有木康雄, “適応型 Gaussian-Gaussian RBM を用いた構音障害者音声認識,” 日本音響学会2017年春季研究発表会, 1-Q-5, pp. 95-98, March 2017.
  • 高島悠樹, 中鹿亘, 滝口哲也, 有木康雄, “構音障害者音声認識のための適応型 restricted Boltzmann machine を用いた特徴量抽出,” 電子情報通信学会技術研究報告, vol. 116, no. 477, pp. 321-326, March 2017.
  • 中鹿亘, 南泰浩, “話者クラスタ適応学習可能な拡張制限ボルツマンマシンに基づく非パラレル声質変換,” 日本音響学会2017年春季研究発表会, 1-6-16, pp. 239-242, March 2017.
  • 中鹿亘, 高木信二, 山岸順一, “複素RBM:制限ボルツマンマシンの複素数拡張と音声信号への応用,” 日本音響学会2017年春季研究発表会, 1-6-7, pp. 219-222, March 2017.

2016

  • 高島悠樹, 中鹿亘, 滝口哲也, 有木康雄, “Factored 3-Way Restricted Boltzmann Machine を用いたマルチモーダル音声認識の検討,” 日本音響学会2016年秋季研究発表会, 3-Q-10, pp. 109-112, September 2016.
  • 中鹿亘, 南泰浩, “音響・音韻・話者ファクターを考慮したThree-way RBMよる話者・音素の同時認識,” 日本音響学会2016年秋季研究発表会, 2-4-7, pp. 19-22, September 2016.
  • 中鹿亘, 南泰浩, “Three-way restricted Boltzmann machineによる音声モデリングに基づく話者・音素の同時認識,” 音学シンポジウム2016, 2016-MUS-111, no. 21, p. 6 , May 2016.
  • 高島悠樹, 中鹿亘, 滝口哲也, 有木康雄, “Restricted Boltzmann Machine を用いた話者性・雑音を考慮したモデリングの検討,” 日本音響学会2016年春季研究発表会, 3-P-10, pp. 175-178, March 2016.
  • 中鹿亘, 南泰浩, “音響・音韻・話者情報を考慮したThree-Way Restricted Boltzmann Machineを用いた任意入力声質変換,” 日本音響学会2016年春季研究発表会, 2-2-3, pp. 235-238, March 2016.

2015

  • 中鹿亘, 滝口哲也, “制約付きThree-Way Restricted Boltzmann Machineを用いた音響・音韻・話者情報の同時モデリング,” 電子情報通信学会技術研究報告, vol. 115, no. 346, pp. 7-12, December 2015.
  • 高島悠樹, 中鹿亘, 滝口哲也, 有木康雄, “構音障害者音声認識のための確率表現に基づく音素ラベリングの検討,” 日本音響学会2015年秋季研究発表会, 1-8-3, September 2015.
  • 片岡悠一郎, 中鹿亘, 滝口哲也, 有木康雄, “遺伝的アルゴリズムを用いたランダム写像行列の選択,” 日本音響学会2015年秋季研究発表会, 1-Q-4, September 2015.
  • 中鹿亘, 滝口哲也, “話者正規化学習に基づく潜在的音韻情報を考慮した音声モデリングによる非パラレル声質変換,” 日本音響学会2015年秋季研究発表会, 2-1-4, pp. 223-226, September 2015.
  • 高島悠樹, 中鹿亘, 滝口哲也, 有木康雄, “構音障害者音声認識のための混合正規分布に基づく音素ラベリングの検討,” 電子情報通信学会技術研究報告, vol. 115, no. 99, pp. 71-76, June 2015.
  • 藤井貴生, 相原龍, 中鹿亘, 滝口哲也, 有木康雄, “少量のパラレルデータを用いたNon-negative Matrix Factorizationによる雑音環境下の声質変換,” 日本音響学会2015年春季研究発表会, 2-Q-39, pp. 393-396, March 2015.
  • 高島悠樹, 中鹿亘, 滝口哲也, 有木康雄, “Deep Boltzmann Machine を用いた音素ラベル情報推定,” 日本音響学会2015年春季研究発表会, 1-1-2, pp. 3-6, March 2015.
  • 中鹿亘, 滝口哲也, 有木康雄, “適応型 Restricted Boltzmann Machine を用いたパラレルデータフリーな任意話者声質変換,” 日本音響学会2015年春季研究発表会, 3-2-3, pp. 279-282, March 2015.

Awards (受賞)

ページ改修中

Patents (特許出願)

ページ改修中

Other Publications (その他)

2024

  • 中鹿亘, 声を自在に操る“スマート”な人工知能, 旺文社 全国大学学部・学科案内号 4月臨時増刊, 2024/03/29.

2022

  • 中鹿亘, コーヒーブレイク 〜 あの日私は, 日本音響学会誌, vol. 78, no. 4, 2022/04/01.

2019

  • 中鹿亘, TV出演:世界の何だコレ!?ミステリー, フジテレビ, 2019/07/03.
  • 中鹿亘, 解説:複素数の観測データを直接表現する制限ボルツマンマシンの拡張と音声信号処理への応用, 日本音響学会誌, vol. 75, no. 3, pp. 164-172, 2019/03/01.

2017

  • 中鹿亘, ラジオ出演:THE FROGMAN SHOW A.I.共存ラジオ 好奇心家族, TBSラジオ, 2017/11/10.
  • 中鹿亘, TV出演:まさか!それがデキるのか!?世界最高技術でやっちゃいましたSP, フジテレビジョン, 2017/07/15.
  • 中鹿亘, TV出演:ホンマでっか!?TV, フジテレビジョン, 2017/05/24.

2016

  • 中鹿亘, 報道:音声対話が世界を揺るがす, 日経エレクトロニクス2016年8月号, 2016/07/20.
  • 中鹿亘, 報道:自分の声 他人そっくりに, 日本経済新聞朝刊, 2016/05/16.