Search results for "Audio-visual"

Hits ?▲	Authors	Title	Venue	Year	Link	Author keywords
28	George Drettakis	Audiovisual 3d rendering as a tool for multimodal interfaces.	ICMI	2008	DBLP DOI BibTeX RDF	computer graphics, 3d audio
28	Lei Xie 0001, Zhi-Qiang Liu	Realistic Mouth-Synching for Speech-Driven Talking Face Using Articulatory Modelling.	IEEE Trans. Multim.	2007	DBLP DOI BibTeX RDF
28	Boris Reuderink, Mannes Poel, Khiet P. Truong, Ronald Poppe, Maja Pantic	Decision-Level Fusion for Audio-Visual Laughter Detection.	MLMI	2008	DBLP DOI BibTeX RDF
28	Niall A. Fox, Brian A. O'Mullane, Richard B. Reilly	VALID: A New Practical Audio-Visual Database, and Comparative Results.	AVBPA	2005	DBLP DOI BibTeX RDF
28	Léon J. M. Rothkrantz, Jacek C. Wojdel, Pascal Wiggers	Fusing Data Streams in Continuous Audio-Visual Speech Recognition.	TSD	2005	DBLP DOI BibTeX RDF
28	Guillaume Lathoud, Jean-Marc Odobez, Daniel Gatica-Perez	AV16.3: An Audio-Visual Corpus for Speaker Localization and Tracking.	MLMI	2004	DBLP DOI BibTeX RDF
28	Sofia Tsekeridou, Stelios Krinidis, Ioannis Pitas	Scene Change Detection Based on Audio-Visual Analysis and Interaction.	Theoretical Foundations of Computer Vision	2000	DBLP DOI BibTeX RDF
28	Mary Mikhail, Giovanni Palumbo, Jinane Mohammad, Mohamed El-Helaly, Aishy Amer	An Online System for Synchronized Processing of Video and Audio Signals.	CCECE	2006	DBLP DOI BibTeX RDF
27	Tapio Lokki, Matti Gröhn	Navigation with Auditory Cues in a Virtual Environment.	IEEE Multim.	2005	DBLP DOI BibTeX RDF	virtual environments, 3D sound, audio-visual, Auditory navigation
26	Hari Krishna Maganti, Daniel Gatica-Perez	Speaker localization for microphone array-based ASR: the effects of accuracy on overlapping speech.	ICMI	2006	DBLP DOI BibTeX RDF	audio-visual speaker tracking, microphone array ASR
26	Vedad Hulusic, Kurt Debattista, Vibhor Aggarwal, Alan Chalmers	Exploiting Audio-Visual Cross-Modal Interaction to Reduce Computational Requirements in Interactive Environments.	VS-GAMES	2010	DBLP DOI BibTeX RDF	sound effects, frame rate perception, perception, psychophysics, cross-modal interaction, audio-visual
26	Walid Karam, Chafic Mokbel, Hanna Greige, Gérard Chollet	Audio-Visual Identity Verification and Robustness to Imposture.	ICB	2009	DBLP DOI BibTeX RDF	audio-visual forgery, talking-face imposture, biometric verification robustness, Identity verification, face animation, voice conversion
26	Danqi Chen 0001, Dongmei Jiang, Ilse Ravyse, Hichem Sahli	Audio-Visual Emotion Recognition Based on a DBN Model with Constrained Asynchrony.	ICIG	2009	DBLP DOI BibTeX RDF	audio visual multi-stream, asynchronous DBN model
26	Jie Luo, Barbara Caputo, Alon Zweig, Jörg-Hendrik Bach, Jörn Anemüller	Object Category Detection Using Audio-Visual Cues.	ICVS	2008	DBLP DOI BibTeX RDF	Multimodal Recognition, Audio-visual Fusion, Object Categorization
26	Girija Chetty, Michael Wagner 0004	Audio Visual Speaker Verification Based on Hybrid Fusion of Cross Modal Features.	PReMI	2007	DBLP DOI BibTeX RDF	speaker identity verification, liveness checking, cross modal correlations, Audio-visual
26	Ziyou Xiong, Regunathan Radhakrishnan, Ajay Divakaran, Thomas S. Huang	Highlights extraction from sports video based on an audio-visual marker detection framework.	ICME	2005	DBLP DOI BibTeX RDF	audio-visual marker, visual object detection algorithm, semantic object, audio classification algorithm, sports highlights extraction, finer-resolution highlight segment, color information, grouping phase, soccer, golf video, motion information, baseball
26	Vladimir Pavlovic 0001, G. A. Berry, Thomas S. Huang	Integration of Audio/Visual Information for Use in Human-Computer Intelligent Interaction.	ICIP (1)	1997	DBLP DOI BibTeX RDF	audio/visual information integration, human-computer intelligent interaction, human-computer communication, auditory features, automatic gesture recognition, user interfaces, virtual environments, automatic speech recognition, visual features, computer interfaces, human communication
26	Alexander Haubold, Promiti Dutta, John R. Kender	Evaluation of video browser features and user interaction with VAST MM.	ACM Multimedia	2008	DBLP DOI BibTeX RDF	presentation video, speaker index, structure in videos, text augmentation, transcript analysis, evaluation, measures, user studies, automatic speech recognition, streaming video, speaker segmentation, video library, visual segmentation
26	Simone Cifani, Andrew Abel, Amir Hussain 0001, Stefano Squartini, Francesco Piazza	An Investigation into Audiovisual Speech Correlation in Reverberant Noisy Environments.	COST 2102 Conference (Prague)	2008	DBLP DOI BibTeX RDF
26	Shih-Fu Chang, Dan Ellis, Wei Jiang 0001, Keansub Lee, Akira Yanagawa, Alexander C. Loui, Jiebo Luo	Large-scale multimodal semantic concept detection for consumer video.	Multimedia Information Retrieval	2007	DBLP DOI BibTeX RDF	consumer video indexing, video classification, multimedia ontology, semantic classification
26	Zohar Barzelay, Yoav Y. Schechner	Harmony in Motion.	CVPR	2007	DBLP DOI BibTeX RDF
26	Lei Xie 0001, Helen Meng, Zhi-Qiang Liu	A Cantonese Speech-Driven Talking Face Using Translingual Audio-to-Visual Conversion.	ISCSLP	2006	DBLP DOI BibTeX RDF
26	Sama'a Al Hashimi, Gordon Davies	Vocal telekinesis: physical control of inanimate objects with minimal paralinguistic voice input.	ACM Multimedia	2006	DBLP DOI BibTeX RDF	paralanguage, vocal input, vocal telekinesis, voice-physical
26	Koji Iwano, Taro Miyazaki, Sadaoki Furui	Multimodal Speaker Verification Using Ear Image Features Extracted by PCA and ICA.	AVBPA	2005	DBLP DOI BibTeX RDF
26	Jong-Seok Lee, Touradj Ebrahimi	Two-Level Bimodal Association for Audio-Visual Speech Recognition.	ACIVS	2009	DBLP DOI BibTeX RDF
26	Keni Bernardin, Rainer Stiefelhagen, Alex Waibel	Probabilistic integration of sparse audio-visual cues for identity tracking.	ACM Multimedia	2008	DBLP DOI BibTeX RDF	modality fusion, sensor fusion, smart environments, human perception
26	Vasil Khalidov, Florence Forbes, Miles E. Hansard, Elise Arnaud, Radu Horaud	Audio-Visual Clustering for 3D Speaker Localization.	MLMI	2008	DBLP DOI BibTeX RDF
26	Jan Kratt, Florian Metze, Rainer Stiefelhagen, Alex Waibel	Large Vocabulary Audio-Visual Speech Recognition Using the Janus Speech Recognition Toolkit.	DAGM-Symposium	2004	DBLP DOI BibTeX RDF
26	Zeeshan Rasheed, Mubarak Shah	Movie Genre Classification By Exploiting Audio-Visual Features Of Previews.	ICPR (2)	2002	DBLP DOI BibTeX RDF
26	Shahrokh Ghaemmaghami	Audio Segmentation and Classification based on a Selective Analysis Scheme.	MMM	2004	DBLP DOI BibTeX RDF
24	Einat Kidron, Yoav Y. Schechner, Michael Elad	Cross-Modal Localization via Sparsity.	IEEE Trans. Signal Process.	2007	DBLP DOI BibTeX RDF
24	Einat Kidron, Yoav Y. Schechner, Michael Elad	Pixels that Sound.	CVPR (1)	2005	DBLP DOI BibTeX RDF
24	Hiroshi G. Okuno, Kazuhiro Nakadai, Hiroaki Kitano	Realizing Audio-Visually Triggered ELIZA-Like Non-verbal Behaviors.	PRICAI	2002	DBLP DOI BibTeX RDF
24	Serdar Yildirim, Shrikanth S. Narayanan	Automatic Detection of Disfluency Boundaries in Spontaneous Speech of Children Using Audio-Visual Information.	IEEE Trans. Speech Audio Process.	2009	DBLP DOI BibTeX RDF
24	Juergen Luettin, Stéphane Dupont	Continuous Audio-Visual Speech Recognition.	ECCV (2)	1998	DBLP DOI BibTeX RDF
24	Emily Mower, Sungbok Lee, Maja J. Mataric, Shrikanth S. Narayanan	Human perception of synthetic character emotions in the presence of conflicting and congruent vocal and facial expressions.	ICASSP	2008	DBLP DOI BibTeX RDF
24	Niall A. Fox, Ralph Gross, Jeffrey F. Cohn, Richard B. Reilly	Robust Biometric Person Identification Using Automatic Classifier Fusion of Speech, Mouth, and Face Experts.	IEEE Trans. Multim.	2007	DBLP DOI BibTeX RDF
24	Zhiyong Wu 0001, Lianhong Cai, Helen M. Meng	Multi-level Fusion of Audio and Visual Features for Speaker Identification.	ICB	2006	DBLP DOI BibTeX RDF
24	Myung-Won Kim, Joung Woo Ryu, Eun Ju Kim	Speech Recognition with Multi-modal Features Based on Neural Networks.	ICONIP (2)	2006	DBLP DOI BibTeX RDF	neural network, speech recognition, sequential pattern, post-processing, contextual information
24	Xingquan Zhu 0001, Xindong Wu 0001, Ahmed K. Elmagarmid, Zhe Feng 0001, Lide Wu	Video Data Mining: Semantic Indexing and Event Detection from the Association Perspective.	IEEE Trans. Knowl. Data Eng.	2005	DBLP DOI BibTeX RDF	knowledge-based systems, multimedia systems, database management, Video mining
24	Gianluca Monaci, Òscar Divorra Escoda, Pierre Vandergheynst	Analysis of multimodal signals using redundant representations.	ICIP (3)	2005	DBLP DOI BibTeX RDF
24	Shankar T. Shivappa, Bhaskar D. Rao, Mohan M. Trivedi	Multimodal information fusion using the iterative decoding algorithm and its application to audio-visual speech recognition.	ICASSP	2008	DBLP DOI BibTeX RDF
24	Tero Jokela, Jaakko Lehikoinen, Hannu Korhonen	Mobile multimedia presentation editor: enabling creation of audio-visual stories on mobile devices.	CHI	2008	DBLP DOI BibTeX RDF	user interfaces, mobile devices, interaction design, authoring, storytelling, smil, multimedia presentations, editor, content creation, mms, multimedia messages
24	Andrew Abel, Amir Hussain 0001	Multi-modal Speech Processing Methods: An Overview and Future Research Directions Using a MATLAB Based Audio-Visual Toolbox.	COST 2102 School (Vietri)	2008	DBLP DOI BibTeX RDF
24	Zhihong Zeng, Jilin Tu, Ming Liu 0009, Thomas S. Huang, Brian Pianfetti, Dan Roth, Stephen E. Levinson	Audio-Visual Affect Recognition.	IEEE Trans. Multim.	2007	DBLP DOI BibTeX RDF
24	Zhihong Zeng, Yuxiao Hu 0001, Glenn I. Roisman, Zhen Wen, Yun Fu 0001, Thomas S. Huang	Audio-Visual Spontaneous Emotion Recognition.	Artifical Intelligence for Human Computing	2007	DBLP DOI BibTeX RDF	Affective computing, emotion recognition, Multimodal Human-Computer Interaction, affect recognition
24	Adam O'Donovan, Ramani Duraiswami, Jan Neumann	Microphone Arrays as Generalized Cameras for Integrated Audio Visual Processing.	CVPR	2007	DBLP DOI BibTeX RDF
24	Zhihong Zeng, Yuxiao Hu 0001, Yun Fu 0001, Thomas S. Huang, Glenn I. Roisman, Zhen Wen	Audio-visual emotion recognition in adult attachment interview.	ICMI	2006	DBLP DOI BibTeX RDF	affective computing, emotion recognition, multimodal human-computer interaction, affect recognition
24	Harriet J. Nock, Giridharan Iyengar, Chalapathy Neti	Speaker Localisation Using Audio-Visual Synchrony: An Empirical Study.	CIVR	2003	DBLP DOI BibTeX RDF
24	Milind R. Naphade, Ashutosh Garg, Thomas S. Huang	Duration Dependent Input Output Markov Models For Audio-Visual Event Detection.	ICME	2001	DBLP DOI BibTeX RDF
24	Ashutosh Garg, Vladimir Pavlovic 0001, James M. Rehg	Audio-Visual Speaker Detection Using Dynamic Bayesian Networks.	FG	2000	DBLP DOI BibTeX RDF	dynamic Bayesian networks, multimodal HCI, speaker detection
23	Ashish Verma, L. Venkata Subramaniam, Nitendra Rajput, Chalapathy Neti, Tanveer A. Faruquie	Animating expressive faces across languages.	IEEE Trans. Multim.	2004	DBLP DOI BibTeX RDF
23	Surya Nepal, Uma Srinivasan 0001, Graham J. Reynolds	Semantic Based Retrieval Model for Digital Audio and Video.	ICME	2001	DBLP DOI BibTeX RDF
23	Petar S. Aleksic, Aggelos K. Katsaggelos	Speech-to-video synthesis using MPEG-4 compliant visual features.	IEEE Trans. Circuits Syst. Video Technol.	2004	DBLP DOI BibTeX RDF
22	Mihai Gurban, Jean-Philippe Thiran, Thomas Drugman, Thierry Dutoit	Dynamic modality weighting for multi-stream hmms inaudio-visual speech recognition.	ICMI	2008	DBLP DOI BibTeX RDF	multi-stream hmm, stream reliability, multimodal fusion, audio-visual speech recognition
22	Annie On Ni Wan, Hiroki Nishino, Pamela Pietro	Tre marie.	ACM Multimedia	2006	DBLP DOI BibTeX RDF	RF-ID, audio-visual improvisation, dance performance, open sound control, bluetooth
22	Yoshinao Takemae, Takehiko Ohno, Ikuo Yoda, Shinji Ozawa	Estimating human interruptibility in the home for remote communication.	CHI Extended Abstracts	2006	DBLP DOI BibTeX RDF	audio-visual tracking, online remote communication, awareness, presence, interruptibility, home
22	Kongwah Wan, Xin Yan 0001, Changsheng Xu	Automatic mobile sports highlights.	ICME	2005	DBLP DOI BibTeX RDF	a priori decision scheme, automatic mobile sports highlight, sports video highlight, live game, mobile videophone, GPRS network, audio-visual feature, circular buffer, real-time system, 3G network, real-time analysis, mobile advertising
22	John E. Redford, Keith S. Ruttle, Timothy M. Dobson	Video over ATM: experience from the Cambridge Interactive TV Trial.	ICIP	1995	DBLP DOI BibTeX RDF	cable television, Cambridge Interactive TV Trial, interactive TV industry, business ideas, MPEG audio/visual streams, CiTVIC, CTSN, asynchronous transfer mode, ATM, decoding, decoding, interactive television, service provision, telecommunication standards, digital television, interactive video, television standards, technology infrastructure
22	Dimitris I. Rigas, Dave Memery	Utilising Audio-Visual Stimuli in Interactive Information Systems: A Two Domain Investigation on Auditory Metaphors.	ITCC	2002	DBLP DOI BibTeX RDF	Interactive Information Systems, Stock Control Systems, E-Mail Tool, Auditory Design, User Interface, Multimedia, Software Design, Speech
22	Robert Kaucic, Barney Dalton, Andrew Blake 0001	Real-Time Lip Tracking for Audio-Visual Speech Recognition Applications.	ECCV (2)	1996	DBLP DOI BibTeX RDF
21	Matteo Bregonzio, Murtaza Taj, Andrea Cavallaro	Multi-Modal Particle Filtering Tracking using Appearance, Motion and Audio Likelihoods.	ICIP (5)	2007	DBLP DOI BibTeX RDF
21	Kyung-Ae Cha, Kyungdeok Kim	MPEG-4 Scene Description Optimization for Interactive Terrestrial DMB Content.	ICESS	2007	DBLP DOI BibTeX RDF	T-DMB, Scene description Optimization, MPEG-4 System, Interactive Content, BIFS
21	Ming Liu 0009, Hao Tang 0001, Huazhong Ning, Thomas S. Huang	Person Identification Based on Multichannel and Multimodality Fusion.	CLEAR	2006	DBLP DOI BibTeX RDF
21	Seungmin Rho, SooCheol Lee, Eenjun Hwang, YangKyoo Lee	XCRAB: A Content and Annotation-Based Multimedia Indexing and Retrieval System.	ICCSA (4)	2004	DBLP DOI BibTeX RDF
21	Adriano de Andrade Bresolin, Diamantino Rui da Silva Freitas, Adrião Duarte Dória Neto, Pablo Javier Alsina	European and American Audio-Visual Speech Recognition, Using SVM in Portuguese Language.	DCC	2008	DBLP DOI BibTeX RDF	Image Pattern Recognition, Neural Networks, Speech Recognition
21	Zhihong Zeng, Yuxiao Hu 0001, Ming Liu 0009, Yun Fu 0001, Thomas S. Huang	Training combination strategy of multi-stream fused hidden Markov model for audio-visual affect recognition.	ACM Multimedia	2006	DBLP DOI BibTeX RDF	affective computing, emotion recognition, multimodal human-computer interaction, affect recognition
21	Iain McCowan, Maganto Hari Krishna, Daniel Gatica-Perez, Darren Moore, Sileye O. Ba	Speech Acquisition in Meetings with an Audio-Visual Sensor Array.	ICME	2005	DBLP DOI BibTeX RDF
21	Mike Leggett	Losers and finders: indexing audio-visual digital media.	Creativity & Cognition	2005	DBLP DOI BibTeX RDF	interactive, taxonomy, index, digital media
21	Hari Kalva, Alexandros Eleftheriadis	Algorithms for multiplex scheduling of object-based audio-visual presentations.	IEEE Trans. Circuits Syst. Video Technol.	2004	DBLP DOI BibTeX RDF
21	Hari Sundaram, Shih-Fu Chang	Determining computable scenes in films and their structures using audio-visual memory models.	ACM Multimedia	2000	DBLP DOI BibTeX RDF	computable scenes, periodic analysis transform, shot-level structure, memory models, films, scene detection
21	Karren Yang, Dejan Markovic, Steven Krenn, Vasu Agrawal, Alexander Richard	Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement by Re-Synthesis.	CoRR	2022	DBLP DOI BibTeX RDF
21	Zi-qiang Zhang, Jie Zhang 0042, Jian-Shu Zhang, Ming-Hui Wu, Xin Fang, Li-Rong Dai 0001	Learning Contextually Fused Audio-visual Representations for Audio-visual Speech Recognition.	CoRR	2022	DBLP BibTeX RDF
21	Joanna Hong, Minsu Kim, Daehun Yoo, Yong Man Ro	Visual Context-driven Audio Feature Enhancement for Robust End-to-End Audio-Visual Speech Recognition.	CoRR	2022	DBLP DOI BibTeX RDF
21	Ziqiang Zhang, Jie Zhang 0042, Jian-Shu Zhang, Ming-Hui Wu, Xin Fang, Lirong Dai 0001	Learning Contextually Fused Audio-Visual Representations For Audio-Visual Speech Recognition.	ICIP	2022	DBLP DOI BibTeX RDF
21	Joanna Hong, Minsu Kim, Daehun Yoo, Yong Man Ro	Visual Context-driven Audio Feature Enhancement for Robust End-to-End Audio-Visual Speech Recognition.	INTERSPEECH	2022	DBLP DOI BibTeX RDF
21	Ankit P. Shah, Shijie Geng, Peng Gao, Anoop Cherian, Takaaki Hori, Tim K. Marks, Jonathan Le Roux, Chiori Hori	Audio-Visual Scene-Aware Dialog and Reasoning Using Audio-Visual Transformers with Joint Student-Teacher Learning.	ICASSP	2022	DBLP DOI BibTeX RDF
21	Karren Yang, Dejan Markovic, Steven Krenn, Vasu Agrawal, Alexander Richard	Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement by Re-Synthesis.	CVPR	2022	DBLP DOI BibTeX RDF
21	Ankit P. Shah, Shijie Geng, Peng Gao, Anoop Cherian, Takaaki Hori, Tim K. Marks, Jonathan Le Roux, Chiori Hori	Audio-Visual Scene-Aware Dialog and Reasoning using Audio-Visual Transformers with Joint Student-Teacher Learning.	CoRR	2021	DBLP BibTeX RDF
21	Josefine Hölling, Maria Svahn, Sandra Pauletto	Audio-Visual Interactive Art: Investigating the effect of gaze-controlled audio on visual attention and short term memory.	Audio Mostly Conference	2021	DBLP DOI BibTeX RDF
21	Lucas D. Terissi, Gonzalo D. Sad, Juan Carlos Gómez	Robust front-end for audio, visual and audio-visual speech classification.	Int. J. Speech Technol.	2018	DBLP DOI BibTeX RDF
21	Jiyoung Lee, Sunok Kim, Seungryong Kim, Kwanghoon Sohn	Audio-Visual Attention Networks for Emotion Recognition.	AVSU@MM	2018	DBLP DOI BibTeX RDF
21	Zafi Sherhan Syed, Kirill A. Sidorov, A. David Marshall	Automated Screening for Bipolar Disorder from Audio/Visual Modalities.	AVEC@MM	2018	DBLP DOI BibTeX RDF
21	Luca Remaggi, Hansung Kim, Philip J. B. Jackson, Adrian Hilton 0001	An Audio-Visual Method for Room Boundary Estimation and Material Recognition.	AVSU@MM	2018	DBLP DOI BibTeX RDF
21	Rongfeng Su, Lan Wang, Xunying Liu	Multimodal learning using 3D audio-visual data for audio-visual speech recognition.	IALP	2017	DBLP DOI BibTeX RDF
21	Petros Koutras, Athanasia Zlatintsi, Elias Iosif, Athanasios Katsamanis, Petros Maragos, Alexandros Potamianos	Predicting audio-visual salient events based on visual, audio and text modalities for movie summarization.	ICIP	2015	DBLP DOI BibTeX RDF
21	Humberto Pérez Espinosa, Hugo Jair Escalante, Luis Villaseñor Pineda, Manuel Montes-y-Gómez, David Pinto Avendaño, Verónica Reyes-Meza	Fusing Affective Dimensions and Audio-Visual Features from Segmented Video for Depression Recognition: INAOE-BUAP's Participation at AVEC'14 Challenge.	AVEC@MM	2014	DBLP DOI BibTeX RDF
21	Ahmed Hussen Abdelaziz, Steffen Zeiler, Dorothea Kolossa	Using twin-HMM-based audio-visual speech enhancement as a front-end for robust audio-visual speech recognition.	INTERSPEECH	2013	DBLP DOI BibTeX RDF
21	Peng Shen, Satoshi Tamura, Satoru Hayamizu	Audio-visual interaction in sparse representation features for noise robust audio-visual speech recognition.	AVSP	2013	DBLP BibTeX RDF
21	Michel F. Valstar, Björn W. Schuller, Kirsty Smith, Florian Eyben, Bihan Jiang, Sanjay Bilakhia, Sebastian Schnieder, Roddy Cowie, Maja Pantic	AVEC 2013: the continuous audio/visual emotion and depression recognition challenge.	AVEC@ACM Multimedia	2013	DBLP DOI BibTeX RDF
21	Marc Rébillat, Xavier Boutillon, Etienne Corteel, Brian F. G. Katz	Audio, visual, and audio-visual egocentric distance perception by moving subjects in virtual environments.	ACM Trans. Appl. Percept.	2012	DBLP DOI BibTeX RDF
21	Natalie Fecher	The 'Audio-Visual Face Cover Corpus': Investigations into audio-visual speech and speaker recognition when the speaker's face is occluded by facewear.	INTERSPEECH	2012	DBLP DOI BibTeX RDF
21	Wei Jiang 0001, Alexander C. Loui	Audio-visual grouplet: temporal audio-visual interactions for general video concept classification.	ACM Multimedia	2011	DBLP DOI BibTeX RDF
21	Satoshi Tamura, Masato Ishikawa, Takashi Hashiba, Shin'ichi Takeuchi, Satoru Hayamizu	A robust audio-visual speech recognition using audio-visual voice activity detection.	INTERSPEECH	2010	DBLP DOI BibTeX RDF
21	Yuki Denda, Takanobu Nishiura, Yoichi Yamashita	Omnidirectional Audio-Visual Talker Localization Based on Dynamic Fusion of Audio-Visual Features Using Validity and Reliability Criteria.	IEICE Trans. Inf. Syst.	2008	DBLP DOI BibTeX RDF
21	King-Shy Goh, Koji Miyahara, Regunathan Radhakrishnan, Ziyou Xiong, Ajay Divakaran	Audio-visual event detection based on mining of semantic audio-visual labels.	Storage and Retrieval Methods and Applications for Multimedia	2004	DBLP DOI BibTeX RDF
21	Gerasimos Potamianos, Chalapathy Neti, Sabine Deligne	Joint audio-visual speech processing for recognition and enhancement.	AVSP	2003	DBLP BibTeX RDF
21	Martin Heckmann, Frédéric Berthommier, Christophe Savariaux, Kristian Kroschel	Effects of image distortions on audio-visual speech recognition.	AVSP	2003	DBLP BibTeX RDF
21	Jing Huang 0019, Gerasimos Potamianos, Chalapathy Neti	Improving audio-visual speech recognition with an infrared headset.	AVSP	2003	DBLP BibTeX RDF
21	Tomoaki Yoshinaga, Satoshi Tamura, Koji Iwano, Sadaoki Furui	Audio-visual speech recognition using lip movement extracted from side-face images.	AVSP	2003	DBLP BibTeX RDF