レブコム京都大学との共同研究による音声感情認識に関する論文が音声処理系トップカンファレンス「ICASSP 2022」にて採択
2022年3月3日
株式会社RevComm(レブコム、本社:東京都渋谷区、代表取締役:會田武史、以下RevComm)は、2021年1月より、京都大学 情報学研究科 音声メディア研究室と、対話音声の音声認識と言語処理技術における共同研究を開始しました。このたびその成果の一つとして、音声処理系トップカンファレンス「ICASSP 2022」にて音声感情認識に関する論文が採択されました。
ICASSP(International Conference on Acoustics, Speech, & Signal Processing)は、IEEE信号処理学会の基幹会議であり、信号処理とその応用に関する世界最大の国際会議です。採択された論文は5月にシンガポールで開催される「ICASSP 2022」にて発表を行います。
■内容
京都大学との共同研究の成果として、京都大学河原達也教授、三村正人研究員、大学院生Heran Zhang及び、RevComm シニアリサーチエンジニア石塚賢吉が音声感情認識に関する論文「SELECTIVE MULTI-TASK LEARNING FOR SPEECH EMOTION RECOGNITION USING CORPORA OF DIFFERENT STYLES」を「ICASSP 2022」に投稿し、採択されました。高精度な音声感情認識器を開発する上で障害となることの一つとして、十分な量と多様さをもつ学習データを準備することの難しさがあります。そこで本研究では、マルチタスク学習を用いて、RevCommが保有するビジネス電話応対の自然な感情音声データセットと、演技された感情音声のデータセットを組み合わせて、より効果的に音声感情認識モデルを学習する手法について提案しています。
今後は、提案した学習手法を用いて音声感情認識モデルを強化し、弊社プロダクトに組み込んで、顧客の感情の可視化や、顧客の不満を示す対話の抽出と解析などへの応用に取り組みます。
RevCommはAI技術領域にイノベーションをもたらし、コミュニケーションをより豊かにしていくことを目指しています。そのために、今後も音声・言語・画像の領域に関わる研究開発を推進し、国内外への学術的貢献や製品・サービスのAI技術の深化を積極的に行います。
このたび採択された論文
SELECTIVE MULTI-TASK LEARNING FOR SPEECH EMOTION RECOGNITION
USING CORPORA OF DIFFERENT STYLES
Heran Zhang, Masato Mimura, Tatsuya Kawahara, Kyoto University, Kyoto, Japan
Kenkichi Ishizuka, Revcomm, Inc., Tokyo, Japan
■会社概要
「コミュニケーションを再発明し、人が人を想う社会を創る」という理念のもと、音声技術とAIにより、コミュニケーション課題を解決する企業です。
音声解析AI電話「MiiTel」は、インサイドセールス市場を中心に、営業やコールセンター業務におけるトークの可視化とセルフコーチング、リモートワーク体制構築にご活用いただいています。また、オンライン商談ツール「MiiTel for Zoom」は、複数人でのオンライン商談の解析や振り返りが可能となり、営業の成約率を飛躍させます。
これまで、Google for Startups Acceleratorの採択をはじめ、B-Dash CampやTechCrunchによる様々な大会で優勝、入賞しているほか、Forbes JAPAN「日本の起業家ランキング 2021」、週刊東洋経済「すごいベンチャー100」にも選出されています。
・企業名 :株式会社RevComm
・所在地 : 150-0002東京都渋谷区渋谷1-3-9 ヒューリック渋谷一丁目ビル7階
・代表者 : 會田 武史
・事業内容 :AI × 音声のソフトウェア・データベースの開発
・企業サイト:https://www.revcomm.co.jp/
本文中に記載されている会社名、製品名は、当社の登録商標または商標です。