Selected Publications

Agentic Chain-of-Thought Steering for Efficient and Controllable LLM Reasoning
Yu Xia, Zhouhang Xie, Xin Xu, Byungkyu Kang, Prarit Lamba, Xiang Gao, Julian McAuley.
arXiv 2026 [Paper]
Learning to Hint for Reinforcement Learning
Yu Xia, Canwen Xu, Zhewei Yao, Julian McAuley, Yuxiong He.
arXiv 2026 [Paper]
Multi-Agent Collaborative Filtering: Orchestrating Users and Items for Agentic Recommendations
Yu Xia, Sungchul Kim, Tong Yu, Ryan A. Rossi, Julian McAuley.
WWW 2026 [Paper]
SAND: Boosting LLM Agents with Self-Taught Action Deliberation
Yu Xia, Yiran Shen, Junda Wu, Tong Yu, Sungchul Kim, Ryan A. Rossi, Lina Yao, Julian McAuley.
EMNLP 2025 [Paper]
From Selection to Generation: A Survey of LLM-based Active Learning
Yu Xia*, Subhojyoti Mukherjee*, Zhouhang Xie, Junda Wu, Xintong Li, Ryan Aponte, Hanjia Lyu, Joe Barrow, Hongjie Chen, Franck Dernoncourt, Branislav Kveton, Tong Yu, Ruiyi Zhang, Jiuxiang Gu, Nesreen K Ahmed, Yu Wang, Xiang Chen, Hanieh Deilamsalehy, Sungchul Kim, Zhengmian Hu, Yue Zhao, Nedim Lipka, Seunghyun Yoon, Ting-Hao Kenneth Huang, Zichao Wang, Puneet Mathur, Soumyabrata Pal, Koyel Mukherjee, Zhehao Zhang, Namyong Park, Thien Huu Nguyen, Jiebo Luo, Ryan A. Rossi, Julian McAuley.
ACL 2025 [Paper]
Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval
Yu Xia, Junda Wu, Sungchul Kim, Tong Yu, Ryan A. Rossi, Haoliang Wang, Julian McAuley.
NAACL 2025 [Paper]
Beyond Chain-of-Thought: A Survey of Chain-of-X Paradigms for LLMs
Yu Xia, Rui Wang, Xu Liu, Mingyan Li, Tong Yu, Xiang Chen, Julian McAuley, Shuai Li.
COLING 2025 [Paper]
Aligning as Debiasing: Causality-Aware Alignment via Reinforcement Learning with Interventional Feedback
Yu Xia, Tong Yu, Zhankui He, Handong Zhao, Julian McAuley, Shuai Li.
NAACL 2024 [Paper]
Hallucination Diversity-Aware Active Learning for Text Summarization
Yu Xia, Xu Liu, Tong Yu, Sungchul Kim, Ryan A. Rossi, Anup Rao, Tung Mai, Shuai Li.
NAACL 2024 [Paper]
Which LLM to Play? Convergence-Aware Online Model Selection with Time-Increasing Bandits
Yu Xia*, Fang Kong*, Tong Yu, Liya Guo, Ryan A. Rossi, Sungchul Kim, Shuai Li.
WWW 2024 Oral [Paper]
Towards Joint Utilization of Absolute and Relative Bandit Feedback for Conversational Recommendation
Yu Xia*, Zhihui Xie*, Tong Yu, Canzhe Zhao, Shuai Li.
UMUAI 2024 Special Issue on CRS [Paper]
User-Regulation Deconfounded Conversational Recommender System with Bandit Feedback
Yu Xia, Junda Wu, Tong Yu, Sungchul Kim, Ryan A. Rossi, Shuai Li.
KDD 2023 [Paper]

Yu Xia

Selected Publications