2024级

靳子源(2024级)
毕业院校:桂林电子科技大学/智能科学与技术
研究方向:生成模型、多模态Agent
研究内容:在生成模型领域主要研究如何解决视频/图片生成过程中的时空一致性问题,如桌面物体整理中前后物品的时空一致性保持、高度一致性的生成动漫模型。在多模态Agent领域中重点关注如何搭建一套Agent App系统,使其具备帮助用户操作Windows的能力。

叶恒炜(2024级)
毕业院校:上海科技大学/计算机科学与技术专业
研究方向:多模态大语言模型、多智能体系统、游戏智能体
研究内容:建立标准化的基准来评估大语言模型在多模态游戏任务中的复杂视觉推理性能;基于检索增强生成,提高多智能体系统中的信息传输效率。
