Niranjan, Priyanka Singh, Rasna Sehrawat, Ashwini Katkar, Mona Sharma, Pushpa Nagini Sripada, and Sulabha Narendra Patil. “MULTIMODAL EMOTION RECOGNITION USING AUDIO-TEXT FUSION AND TRANSFORMER-BASED CONTEXTUAL REPRESENTATION LEARNING”. ShodhKosh: Journal of Visual and Performing Arts 7, no. 1s (February 17, 2026): 190–201. Accessed May 2, 2026. https://www.granthaalayahpublication.org/Arts-Journal/ShodhKosh/article/view/7045.