个人主页

你的名字

计算机视觉 / 多模态智能 / 全栈工程

我关注智能视觉系统如何从复杂世界中理解结构、行动和意义。这个网站收集我的研究、项目、实习经历、技术写作和一些构成我日常好奇心的兴趣。

经历论文

中国，上海

目前的研究兴趣包括计算机视觉、多模态学习、具身智能和高质量工程系统。我喜欢把论文里的想法做成可运行、可解释、可迭代的原型，也持续记录实现细节、实验经验和工具链心得。

研究与算法

Computer Vision / Multimodal Learning / Deep Learning / Optimization

工程

Python / PyTorch / TypeScript / React / Next.js

工具链

Linux / Docker / Git / LaTeX / Data Visualization

精选项目

从研究问题到可运行系统

查看全部

科研2025 - Present

智能视觉实验室

面向复杂场景理解的多模态视觉代理

围绕视觉语言模型、空间推理和工具调用构建研究原型，探索模型如何在开放场景中解释目标、关系和操作约束。

PyTorchPythonVLMEvaluation

实习2025 Summer

某科技公司 AI 平台组

机器学习平台实习生

参与训练任务管理、实验追踪和模型服务链路建设，关注研发体验、稳定性和可观测性。

TypeScriptReactPythonDocker

代表论文

论文、预印本与研究记录

查看全部

2026

preprint

准备投稿

面向开放世界场景理解的结构化视觉表示

Your Name, Collaborator A, Advisor B

Preprint

研究视觉语言模型在开放场景中的结构化表达、错误模式和可解释评测方式。

arxiv code

2025

workshop

已接收

复杂视觉任务中的高效评测协议

Your Name, Collaborator C

Workshop on Reliable AI Systems

提出轻量评测集构建方法，帮助在有限计算预算下发现关键错误类型。

paper

把做过的事写清楚

查看全部

2026年6月23日

第一篇技术笔记：从个人主页开始

为什么把研究、项目和写作放进同一个可维护的网站。