Tanveer Hannan

PhD Student of AI

LMU Munich

Biography

I am a fourth-year PhD student in the Department of Computer Science at LMU Munich, where I have the privilege of working with Prof. Thomas Seidl and Prof. Gedas Bertasius. My main research focus is computer vision, video understanding, and large vision language modeling. Recently, I finished an internship at Huawei Trustworthy Lab this summer as a Research Scientist Intern, focusing on the reliability and robustness of large vision language models.

Previously, I was a Machine Learning Intern at Hensoldt Analytics where I also did my Master’s Thesis. Also, I was a research assistant at MCML and Siemens. Before joining LMU Munich, worked as a software developer at Helical inc.

Experience

Research Scientist Intern

Huawei

July 2024 – January 2025 Munich

Reliability of Large Vision Language Models

Research Intern

Hensoldt Analytics

July 2021 – December 2021 Munich

Multiple Object Tracking in Videos

Research Assistant

MCML

October 2020 – June 2021 Munich

Hierarchical Transformer for Object Detection

Student Intern

Siemens, Advanta

October 2020 – April 2021 Munich

Reinforcement Learning for Supply Chain Management

Software Engineer

Helical Inc.

November 2018 – August 2019 Munich

Software Developer

Featured Publications

Tanveer Hannan, Md Mohaiminul Islam, Jindong Gu, Thomas Seidl, Gedas Bertasius

November, 2024 In CVPR

ReVisionLLM: Recursive Vision-Language Model for Temporal Grounding in Hour-Long Videos

Video Understanding

Recent Publications

Quickly discover relevant content by filtering publications.

Tanveer Hannan, Md Mohaiminul Islam, Jindong Gu, Thomas Seidl, Gedas Bertasius (2024). ReVisionLLM: Recursive Vision-Language Model for Temporal Grounding in Hour-Long Videos. In CVPR.

PDF Cite Code

Tanveer Hannan, Md Mohaiminul Islam, Thomas Seidl, Gedas Bertasius (2024). RGNet: A Unified Retrieval and Grounding Network for Long Videos. In ECCV.

PDF Cite Code Project

Maximilian Bernhard, Tanveer Hannan, Niklas Strauß, Matthias Schubert (2024). Context Matters: Leveraging Spatiotemporal Metadata for Semi-Supervised Learning on Remote Sensing Images . In ECAI.

PDF Cite

Tanveer Hannan, Rajat Koner, Maximilian Bernhard, Suprosanna Shit, Bjoern Menze, Volker Tresp, Matthias Schubert, Thomas Seidl (2023). GRAtt-VIS: Gated Residual Attention for Auto Rectifying Video Instance Segmentation. In ICPR.

PDF Cite Code

Rajat Koner, Tanveer Hannan, Suprosanna Shit, Sahand Sharifzadeh, Matthias Schubert, Thomas Seidl, Volker Tresp (2022). InstanceFormer: An Online Video Instance Segmentation Framework. In AAAI23.

PDF Cite Code Poster

See all publications

Contact

hannan@dbs.ifi.lmu.de
Oettingenstraße 67, Munich, Bayern 80538