研究者

Parham Mokhtari

所属:

情報通信研究機構(NICT)
脳情報通信融合研究センター
主任研究員

Specific Research Topic:

情動に関する音声コミュニケーション

Phone: 

0774-98-6407

住所:

〒619-0289 京都府相楽郡精華町光台3-5

Email: 

Homepage:

私の研究の大きな目的は、人間の知覚とコミュニケーションにおける「音響的」モダリティの物理的、心理物理的、生理学的、そして神経メカニズムをより深く理解し、またそれらの相互関係を明らかにすることです。

現在、私は音声に現れる人間の感情について研究しています。脳における異なる情動状態は、それぞれに固有の生理学的変化のパターンを伴います。それらは私たちの発声器官に、またそれが生成する音響信号に影響を及ぼします。従って、音響・聴覚情報から情動状態を検出するためには、通常は観察できない声道形状(音声生成逆問題)、そしてとりわけ声質の違いを左右する喉頭の振動モード(声帯音源波形)を正確に推定することが重要となります。これらの目的を達成するために、信号処理、機械学習、音響シミュレーション、そして電気声門図(EGG: electroglottography)や構造的MRIなどの非侵襲的測定法を用いて研究を進めています。

この研究は、今後ますます普及することが期待されるあらゆる種類のロボットや機械と、人間との間の共感的なコミュニケーションを実現することを目指しています。

主要な業績:

Mokhtari, P., Takemoto, H., Nishimura, R. and Kato, H. (2016). Vertical normal modes of human ears: individual variation and frequency estimation from pinna anthropometry. Journal of the Acoustical Society of America, 140(2), 814-831. http://dx.doi.org/10.1121/1.4960481

Mokhtari, P., Takemoto, H., Nishimura, R. and Kato, H. (2015). Frequency and amplitude estimation of the first peak of head-related transfer functions from pinna anthropometry. Journal of the Acoustical Society of America, 137(2), 690-701. http://dx.doi.org/10.1121/1.4906160

Mokhtari, P., Takemoto, H., Nishimura, R. and Kato, H. (2010). Optimum loss factor for a perfectly matched layer in finite-difference time-domain acoustic simulation. IEEE Transactions on Audio, Speech, and Language Processing, 18(5), 1068-1071. http://dx.doi.org/10.1109/TASL.2009.2035036

Mokhtari, P., Takemoto, H. and Kitamura, T. (2008). Single-matrix formulation of a time domain acoustic model of the vocal tract with side branches. Speech Communication, 50(3), 179-190. http://dx.doi.org/10.1016/j.specom.2007.08.001

Mokhtari, P., Kitamura, T., Takemoto, H. and Honda, K. (2007). Principal components of vocal tract area functions and inversion of vowels by linear regression of cepstrum coefficients. Journal of Phonetics, 35(1), 20-39. http://dx.doi.org/10.1016/j.wocn.2006.01.001