Registration info |
参加者 Free
FCFS
発表者 Free
FCFS
|
---|
Description
概要
2022年5月開催の国際学術会議 ICASSP2022 の音声に関する論文読み会です. 今年は 平日に zoom 開催 となります.
URLはこちら https://2022.ieeeicassp.org/
機械学習に関する論文を普段読んでいる研究者、学生、エンジニアの方を想定しておりますが、誰でもご参加いただけます. 終了後にバーチャル懇親会をやるかもしれません.
発表者について
先着で募集いたします.
紹介したい論文に沿って、ジャンル(音声生成・認識・知覚(パラ言語を含む)・対話)を選択頂きますようお願いします.
ジャンルの配分は調整する場合がございます。
オンライン会場案内
ZOOMを使用します.各自インストールをお願いします。 開始1時間前より開場しておきます。
ZOOM URL: https://us02web.zoom.us/j/82365970723?pwd=bU52MTRHekl1VVRxb09YU3F5QmpOUT09
発表形式
- Lighting talk形式で5分とし、質問時間は合間でまとめて取る予定です。
- 音声、音楽などを再生させる場合は画面共有時に音声も共有するを選択ください。
- セッション後にディスカッション・質疑応答の時間を取っておりますので、そちらでも議論頂けます。
- 講演者は、お手数ですが各セッション終了後までは待機頂く様、よろしくお願いします。
- 質問事項はDoryに記載して頂き、答えて行く形式とします。
- 発表資料は開催者側が用意したGoogle slideに共同編集する形式で作成していきます。
- スライドは2-3枚に納めてください。
Slide: URL
Dory: URL
キャンセル
- 参加は抽選(先着順)になりますが、より多くの方へご参加いただきたいと考えています。
- 大まかな参加人数を把握するために,当日都合が悪くなって参加できないことが判明した方は、お手数ですが速やかにキャンセル処理をお願いします。
その他
- 本勉強会は、技術交流が目的です。知識の共有や参加者同士の交流を目的としない方の参加はお断りします。
- 参加目的が不適切だと判断される場合には、運営側で参加をキャンセルさせていただく場合がございます。
スケジュール
時刻 | 講演者 | タイトル | |
---|---|---|---|
18:00-18:05 | 開会挨拶 & 諸注意 | 橘 健太郎(LINE) | - |
18:05-18:10 | - | 齋藤佑樹(東京大学) | #01 VocBench: A Neural Vocoder Benchmark for Speech Synthesis |
18:10-18:15 | - | 松永裕太(東京大学) | #02 Cloning One's Voice Using Very Limited Data in The Wild |
18:20-18:25 | - | 二見颯(ソニーグループ株式会社) | #03 Factorized Neural Transducer for Efficient Language Model Adaptation |
18:25-18:30 | - | 上乃聖(名古屋工業大学) | #04 Improving CTC-Based Speech Recognition Via Knowledge Transferring from Pre-Trained Language Models |
18:30-18:35 | - | ヘンチェル ミヒャエル(LINE) | #05 IMPROVING SELF-SUPERVISED LEARNING FOR SPEECH RECOGNITION WITH INTERMEDIATE LAYER SUPERVISION |
18:35-18:40 | 佐藤宏(NTT) | #06 Learning to Enhance or Not: Neural Network-Based Switching of Enhanced and Observed Signals for Overlapping Speech Recognition | |
18:40-18:50 | 質疑応答 & ディスカッション | - | - |
18:50-18:55 | break | - | - |
18:55-19:00 | - | 安藤厚志(NTT) | #07 REPRESENTATION LEARNING THROUGH CROSS-MODAL CONDITIONAL TEACHERSTUDENT TRAINING FOR SPEECH EMOTION RECOGNITION |
19:00-19:05 | - | 中村泰貴(東京大学) | #08 Lipreading Model Based On Whole-part Collaborative Learning |
19:05-19:10 | - | 岡本悠希(立命館大学) | #09 Environmental Sound Extraction using Onomatopoeic Words |
19:10-19:15 | - | 川村真也(東京大学) | #10 Differentiable Digital Signal Processing Mixture Model for Synthesis Parameter Extraction from Mixture of Harmonic Sounds |
19:15-19:25 | 質疑応答 & ディスカッション | - | - |
19:25-19:30 | 閉会挨拶 | 高道 慎之介 (東京大学) | - |
Media View all Media
If you add event media, up to 3 items will be shown here.