6月

10
ICASSP2022音声読み会(オンライン)

主催 : 東京大学　高道慎之介

ハッシュタグ：#icassp2022jp

募集内容	参加者無料先着順 120/200人発表者無料先着順 10/15人
申込者	申込者一覧を見る
開催日時	2022/06/10(金) 18:00 ～ 20:00 Googleカレンダー icsファイル
募集期間	2022/05/18(水) 23:15 〜 2022/06/10(金) 20:00まで
会場	オンラインオンライン

イベントの説明

概要

2022年5月開催の国際学術会議 ICASSP2022 の音声に関する論文読み会です．今年は 平日に zoom 開催 となります．

URLはこちら https://2022.ieeeicassp.org/

機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます．終了後にバーチャル懇親会をやるかもしれません．

発表者について

先着で募集いたします．

紹介したい論文に沿って、ジャンル（音声生成・認識・知覚(パラ言語を含む)・対話）を選択頂きますようお願いします．

ジャンルの配分は調整する場合がございます。

オンライン会場案内

ZOOMを使用します．各自インストールをお願いします。開始1時間前より開場しておきます。

ZOOM URL: https://us02web.zoom.us/j/82365970723?pwd=bU52MTRHekl1VVRxb09YU3F5QmpOUT09

発表形式

Lighting talk形式で5分とし、質問時間は合間でまとめて取る予定です。
音声、音楽などを再生させる場合は画面共有時に音声も共有するを選択ください。
セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
質問事項はDoryに記載して頂き、答えて行く形式とします。
発表資料は開催者側が用意したGoogle slideに共同編集する形式で作成していきます。
スライドは2-3枚に納めてください。

Slide: URL

Dory: URL

キャンセル

参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています。
大まかな参加人数を把握するために，当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします。

その他

本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。

スケジュール

時刻		講演者	タイトル
18:00-18:05	開会挨拶 & 諸注意	橘健太郎（LINE）	-
18:05-18:10	-	齋藤佑樹（東京大学）	#01 VocBench: A Neural Vocoder Benchmark for Speech Synthesis
18:10-18:15	-	松永裕太（東京大学）	#02 Cloning One's Voice Using Very Limited Data in The Wild
18:20-18:25	-	二見颯（ソニーグループ株式会社）	#03 Factorized Neural Transducer for Efficient Language Model Adaptation
18:25-18:30	-	上乃聖（名古屋工業大学）	#04 Improving CTC-Based Speech Recognition Via Knowledge Transferring from Pre-Trained Language Models
18:30-18:35	-	ヘンチェルミヒャエル（LINE）	#05 IMPROVING SELF-SUPERVISED LEARNING FOR SPEECH RECOGNITION WITH INTERMEDIATE LAYER SUPERVISION
18:35-18:40		佐藤宏（NTT）	#06 Learning to Enhance or Not: Neural Network-Based Switching of Enhanced and Observed Signals for Overlapping Speech Recognition
18:40-18:50	質疑応答 & ディスカッション	-	-
18:50-18:55	break	-	-
18:55-19:00	-	安藤厚志（NTT）	#07 REPRESENTATION LEARNING THROUGH CROSS-MODAL CONDITIONAL TEACHERSTUDENT TRAINING FOR SPEECH EMOTION RECOGNITION
19:00-19:05	-	中村泰貴（東京大学）	#08 Lipreading Model Based On Whole-part Collaborative Learning
19:05-19:10	-	岡本悠希（立命館大学）	#09 Environmental Sound Extraction using Onomatopoeic Words
19:10-19:15	-	川村真也（東京大学）	#10 Differentiable Digital Signal Processing Mixture Model for Synthesis Parameter Extraction from Mixture of Harmonic Sounds
19:15-19:25	質疑応答 & ディスカッション	-	-
19:25-19:30	閉会挨拶	高道慎之介 (東京大学)	-