Publications | Tanveer

Tanveer Hannan, Dimitrios Mallios, Parth Pathak, Faegheh Sardari, Thomas Seidl, Gedas Bertasius, Mohsen Fayyaz, Sunando Sengupta (2025). DocSLM: A Small Vision-Language Model for Long Multimodal Document Understanding. In ArXiv.

PDF Cite Code

Gengyuan Zhang, Tanveer Hannan, Hermine Kleiner, Beste Aydemir, Xinyu Xie, Jian Lan, Thomas Seidl, Volker Tresp, Jindong Gu (2025). AViLA: Asynchronous Vision-Language Agent for Streaming Multimodal Data Interaction. In ArXiv.

PDF Cite

Jian Lan, Yifei Fu, Udo Schlegel, Gengyuan Zhang, Tanveer Hannan, Haokun Chen, Thomas Seidl (2025). My Answer Is NOT Fair: Mitigating Social Bias in Vision-Language Models via Fair and Biased Residuals. In ArXiv.

PDF Cite

Tanveer Hannan, Md Mohaiminul Islam, Jindong Gu, Thomas Seidl, Gedas Bertasius (2024). ReVisionLLM: Recursive Vision-Language Model for Temporal Grounding in Hour-Long Videos. In CVPR.

PDF Cite Code

Tanveer Hannan, Md Mohaiminul Islam, Thomas Seidl, Gedas Bertasius (2024). RGNet: A Unified Retrieval and Grounding Network for Long Videos. In ECCV.

PDF Cite Code Project

Maximilian Bernhard, Tanveer Hannan, Niklas Strauß, Matthias Schubert (2024). Context Matters: Leveraging Spatiotemporal Metadata for Semi-Supervised Learning on Remote Sensing Images . In ECAI.

PDF Cite

Tanveer Hannan, Rajat Koner, Maximilian Bernhard, Suprosanna Shit, Bjoern Menze, Volker Tresp, Matthias Schubert, Thomas Seidl (2023). GRAtt-VIS: Gated Residual Attention for Auto Rectifying Video Instance Segmentation. In ICPR.

PDF Cite Code

Rajat Koner, Tanveer Hannan, Suprosanna Shit, Sahand Sharifzadeh, Matthias Schubert, Thomas Seidl, Volker Tresp (2022). InstanceFormer: An Online Video Instance Segmentation Framework. In AAAI23.

PDF Cite Code Poster

Tanveer Hannan, Rajat Koner, Jonathan Kobold, Matthias Schubert (2022). Box Supervised Video Segmentation Proposal Network. In IMVIP22.

PDF Cite Code Slides Video

Md Mohaiminul Islam, Tanveer Hannan, Laboni Sarker, Zakaria Ahmed (2022). COVID-DenseNet: A Deep Learning Architecture to Detect COVID-19 from Chest Radiology Images. In ICDSA22.

PDF Cite Code Slides

Elena A. Kronberg, Tanveer Hannan, Jens Huthmacher, Marcus Münzer, Florian Peste, Ziyang Zhou, Max Berrendorf, Evgeniy Faerman, Fabio Gastaldello, Simona Ghizzardi, Philippe Escoubet, Stein Haaland, Artem Smirnov, Nithin Sivadas, Robert C. Allen, Andrea Tiengo, Raluca Ilie (2021). Prediction of Soft Proton Intensities in the Near-Earth Space Using Machine Learning. In ApJ21.

PDF Cite Code