1.考古vr
古希腊陶器是考古学和艺术史的重要实物证据研究者需要从单件陶器中提取多层信息:材质与工艺、形制类别、装饰主题、出土地与时间、甚至可能的作坊或画师不过传统计算机视觉和通用多模态模型在这类高度专业化任务上常陷入两类困境:。
2.考古a
一是缺乏领域知识(模型在通用语料里几乎没接触过「雅典黑釉杯」或「红绘风格」这样的概念);二是仅靠监督微调(SFT)容易学到「表层捷径」,在遇到组合性、推理性或少样本问题时就失效基于此,AI Geeks、澳大利亚人工智能研究所等机构的研究人员提出:既要有专门的数据与任务划分,也要有针对性的训练策略来补弱提升。

3.考古专家视频
论文链接: https://doi.org/10.48550/arXiv.2509.17191项目地址:https://github.com/AIGeeksGroup/VaseVQA论文的技术主线可以用一句话概括:
4.考古界专家
先把模型训练到有基础能力(SFT),再通过诊断找出各类问题的薄弱环节,用类型条件化的强化学习(RL)和精细化奖励去有针对性地补弱。

5.考古sci
图1:现有视觉语言模型在古希腊陶瓶理解上的局限性与所提出的VaseVL框架关键步骤如下:任务分层与问题类型化:作者把陶器理解任务划分为若干类(例如材质、工艺、形制、产地/归属、年代、装饰描述等),为后续诊断与差异化训练提供维度。
6.考古专家危险吗
诊断评估:对SFT后的模型在每一类问题上分别评测,识别哪些类型表现弱(例如归属推理与装饰描述通常比简单事实类问题更难)类型条件化强化学习:针对弱项设计加权奖励,奖励由「关键词命中率 语义相似度」组成;同时采用带KL正则的策略更新手段避免模型过度偏离原有SFT行为。
7.世界考古权威期刊
作者还引入一种稳定化的策略优化方法(论文提出的变体)来保证训练稳定按类型细化评估指标:不同问题类型采用更合适的评价方式(比如对描述类用生成质量指标,对事实类用字符/关键词相似度),避免单一指标一刀切

8.考古专家学者
图2:VaseVL的整体框架该方法将有监督微调(SFT)与基于组相对策略优化(GRPO)的强化学习相结合给定陶瓶图像x、问题q 和参考答案a^*,模型通过在词汇奖励与语义奖励之间取得平衡,并限制策略偏离参考策略 ,从而提升其推理能力。
9.在线考古专家
数据与基准(VaseVQA)让评测更具信服力为了能系统评估上述方法,研究人员同时构建了一个面向古希腊陶器的多模态问答基准(VaseVQA)该基准覆盖大量陶器图片与多类型问答对,且在标注上引入专家审校,力求兼顾规模与专业性。
10.国内考古专家
更重要的是,基准把任务按问题类型拆分,使得模型的薄弱处能被明确定位并针对性优化

表1:VaseVQA基准测试上的性能比较RL代表推理注入关键发现与实证价值论文的实验显示:仅做SFT能显著提升模型的基础识别能力,但在归属推理和复杂描述上仍有限;在诊断基础上做类型条件化RL优化后,模型在那些先前薄弱的类型上有可观提升——这说明「补弱导向」的训练策略在专业垂直任务上很有效;。
细粒度的评价(按问题类型)对于判断模型真实能力与设计针对性改进尤为重要。

表2:消融实验结果说明RI表示Reasoning Injection(推理注入)Qwen2.5-VL-SFT表示前述模型经过



评论(0)