
科研2025 - Present
智能视觉实验室
面向复杂场景理解的多模态视觉代理
围绕视觉语言模型、空间推理和工具调用构建研究原型,探索模型如何在开放场景中解释目标、关系和操作约束。
PyTorchPythonVLMEvaluation


中国,上海
目前的研究兴趣包括计算机视觉、多模态学习、具身智能和高质量工程系统。我喜欢把论文里的想法做成可运行、可解释、可迭代的原型,也持续记录实现细节、实验经验和工具链心得。
Computer Vision / Multimodal Learning / Deep Learning / Optimization
Python / PyTorch / TypeScript / React / Next.js
Linux / Docker / Git / LaTeX / Data Visualization
精选项目

智能视觉实验室
围绕视觉语言模型、空间推理和工具调用构建研究原型,探索模型如何在开放场景中解释目标、关系和操作约束。

某科技公司 AI 平台组
参与训练任务管理、实验追踪和模型服务链路建设,关注研发体验、稳定性和可观测性。