Dengming Zhang

Hello there, I'm Dengming Zhang, a master's student at the Zhejiang University.

My primary research focuses on Multimodal Large Models under low-data and low-compute constraints. On the low-data side, I study how to merge multiple domain-specialized, fine-tuned expert LLMs into one generalist model using only 1–5 samples, while retaining SOTA-level performance (ICLR 2026). On the low-compute side, I explore how to equip vision foundation models with audio using a single RTX 4090, and improve audio-visual affective understanding to a SOTA-level. I am also interested in Generative AI (Image/Music), Affective Computing, Meta-learning, and HCI.

By the way, I am good at combining scientific research with engineering implementation, and I have rich experience in front-end development, back-end development, and cluster devops. Some of the open source projects that I lead/participate in can be found on my GitHub.

Status Update

Seeking PhD opportunities for Fall 2026

Connect

News

2026/01

A paper on Model Merging got accepted to ICLR 2026.

2025/11

A preprint on Emotion Multimodal LLM is now on arXiv.

2025/09

A preprint on Model Merging is now on arXiv.

2025/07

Two papers on Controllable Music Generation got accepted to ACM MM 2025 and ACM MM 2025.

2025/06

A paper on Controlled Text Rendering Image Generation got accepted to ICCV 2025.

2024/12

A paper on Personalized Emotion Recognition got accepted to AAAI 2025.

2024/08

A paper on Controlled Style Image Generation got accepted to UIST 2024.

Research Highlights

Grouped by research direction. Click the venue link in News to jump here.

Research Area

Multimodal Large Models

2 Paper

Expert Merging: Model Merging with Unsupervised Expert Alignment and Importance-Guided Layer Chunking thumbnail

ICLR 26

#01International Conference On Learning Representations (ICLR)2026

Expert Merging: Model Merging with Unsupervised Expert Alignment and Importance-Guided Layer Chunking

Dengming Zhang, Xiaowen Ma, Zhenliang Ni, Zhenkai Wu, Han Shu, Xin Jiang, Xinghao Chen

Unsupervised expert alignment and importance-guided layer chunking merge multiple fine-tuned experts into one generalist model.

#02Preprint2025

Learning to Hear by Seeing: It's Time for Vision Language Models to Understand Artistic Emotion from Sight and Sound

Dengming Zhang, Weitao You, Jingxiong Li, Weishen Lin, Wenda Shi, Xue Zhao, Heda Zuo, Junxian Wu, Lingyun Sun

Audio-visual emotion understanding by teaching vision-language models to align sight and sound for artistic emotion.

Research Area

Affective Computing & Music Emotion

1 Paper

Personalized Dynamic Music Emotion Recognition with Dual-Scale Attention-Based Meta-Learning thumbnail

AAAI 25

#03Proceedings Of The AAAI Conference On Artificial Intelligence (AAAI)2025

Personalized Dynamic Music Emotion Recognition with Dual-Scale Attention-Based Meta-Learning

Dengming Zhang, Weitao You, Ziheng Liu, Lingyun Sun, Pei Chen

Dual-scale attention meta-learning for personalized, dynamic music emotion recognition.

Research Area

Meta-learning & Diagnosis

1 Paper

Few-shot bearing fault diagnosis based on meta-learning with discriminant space optimization thumbnail

MST 22

#04Measurement Science And Technology2022

Few-shot bearing fault diagnosis based on meta-learning with discriminant space optimization

Dengming Zhang, Kai Zheng, Yin Bai, Dengke Yao, Dewei Yang, Shaowang Wang

Discriminant space optimization improves few-shot bearing fault diagnosis with meta-learning.

Research Area

Controllable Generation & Creative AI

4 Paper

StyleFactory: Towards Better Style Alignment in Image Creation through Style-Strength-Based Control and Evaluation thumbnail

UIST 24

#05Proceedings Of The 37th Annual ACM Symposium On User Interface Software And Technology (UIST)2024

StyleFactory: Towards Better Style Alignment in Image Creation through Style-Strength-Based Control and Evaluation

Mingxu Zhou, Dengming Zhang, Weitao You, Ziqi Yu, Yifei Wu, Chenghao Pan, Huiting Liu, Tianyu Lao, Pei Chen

Style-strength control and evaluation to improve style alignment in image creation.

FonTS: Text Rendering with Typography and Style Controls thumbnail

ICCV 25

#06International Conference On Computer Vision (ICCV)2025

FonTS: Text Rendering with Typography and Style Controls

Wenda Shi, Yiren Song, Dengming Zhang, Jiaming Liu, Xingxing Zou

Controllable text rendering with typography and style controls.

Controllable Video-to-Music Generation with Multiple Time-Varying Conditions thumbnail

ACM MM 25(Oral)

#0733rd ACM International Conference On Multimedia (ACM MM)2025

Controllable Video-to-Music Generation with Multiple Time-Varying Conditions

Junxian Wu, Weitao You, Heda Zuo, Dengming Zhang, Pei Chen, Lingyun Sun

Generates music from video with multiple time-varying conditioning signals.

Spatial-Temporal Decomposition and Alignment in Controllable Video-to-Music Generation thumbnail

ACM MM 25

#0833rd ACM International Conference On Multimedia (ACM MM)2025

Spatial-Temporal Decomposition and Alignment in Controllable Video-to-Music Generation

Weitao You, Heda Zuo, Junxian Wu, Dengming Zhang, Zhibin Zhou, Lingyun Sun

Decomposes spatial and temporal cues to improve controllable video-to-music generation.

Experience

Huawei Noah's Ark Lab

Research Intern2025.06 - 2025.12

Shanghai, China

Research internship on Model Merging (Expert Merging)^[1].

Tencent

Algorithm Engineer2025.04 - 2025.06

Shenzhen, China

Work on Game Character Material Generation with animation

Huawei Noah's Ark Lab

2025.06 - 2025.12

Research InternShanghai, China

Research internship on Model Merging (Expert Merging)^[1].

Tencent

2025.04 - 2025.06

Algorithm EngineerShenzhen, China

Work on Game Character Material Generation with animation

Awards

First Zhaoyuan Chengen Technology Innovation Scholarship (Top 1)
2021.12, University-wide Unique Award
First-Class Academic Scholarship (Top 5%)
2022.12, 2021-2022 Academic Year
First-Class Academic Scholarship (Top 5%)
2021.12, 2020-2021 Academic Year
First-Class Academic Scholarship (Top 5%)
2020.12, 2019-2020 Academic Year
First Prize in Chongqing, National Electronic Design Contest
2022.01, Chongqing Municipal Education Commission
First Prize, TI Cup Electronic Design Contest
2020.11, Chongqing Municipal Education Commission
Chongqing Excellent Undergraduate Graduation Thesis
2023.06, Chongqing Municipal Education Commission

First Zhaoyuan Chengen Technology Innovation Scholarship (Top 1)
2021.12, University-wide Unique Award
First-Class Academic Scholarship (Top 5%)
2022.12, 2021-2022 Academic Year
First-Class Academic Scholarship (Top 5%)
2021.12, 2020-2021 Academic Year
First-Class Academic Scholarship (Top 5%)
2020.12, 2019-2020 Academic Year
First Prize in Chongqing, National Electronic Design Contest
2022.01, Chongqing Municipal Education Commission
First Prize, TI Cup Electronic Design Contest
2020.11, Chongqing Municipal Education Commission
Chongqing Excellent Undergraduate Graduation Thesis
2023.06, Chongqing Municipal Education Commission

Dengming Zhang

News

Research Highlights

Multimodal Large Models

Affective Computing & Music Emotion

Meta-learning & Diagnosis

Controllable Generation & Creative AI

Experience

Huawei Noah's Ark Lab

Tencent

Huawei Noah's Ark Lab

Tencent

Awards

First Zhaoyuan Chengen Technology Innovation Scholarship (Top 1)

First-Class Academic Scholarship (Top 5%)

First-Class Academic Scholarship (Top 5%)

First-Class Academic Scholarship (Top 5%)

First Prize in Chongqing, National Electronic Design Contest

First Prize, TI Cup Electronic Design Contest

Chongqing Excellent Undergraduate Graduation Thesis

First Zhaoyuan Chengen Technology Innovation Scholarship (Top 1)

First-Class Academic Scholarship (Top 5%)

First-Class Academic Scholarship (Top 5%)

First-Class Academic Scholarship (Top 5%)

First Prize in Chongqing, National Electronic Design Contest

First Prize, TI Cup Electronic Design Contest

Chongqing Excellent Undergraduate Graduation Thesis