Visual Schedule for SLP Icons

Enhanced Audio-Visual Speech Enhancement via Attention-based Sparse Graph Convolutional Neural Networks with Fire Hawk Optimization

Abstract: Audio-Visual Speech Enhancement (AVSE) has the vision to enhance speech quality and requite intelligibility by using both audio and video inputs, which is quite useful in noisy conditions.

IEEE

mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition

Abstract: Audio-Visual Speech Recognition (AVSR) combines lip-based video with audio and can improve performance in noise, but most methods are trained only on English data. One limitation is the lack ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Enhanced Audio-Visual Speech Enhancement via Attention-based Sparse Graph Convolutional Neural Networks with Fire Hawk Optimization

mWhisper-Flamingo for Multilingual Audio-Visual Noise-Robust Speech Recognition

Trending now