Skip to content

批改工作流

工作流决定了 AI 批改时使用哪个模型、以什么方式进行评分。不同工作流适用于不同场景。

📱 移动端用户

如果你在手机上浏览,可以左右滑动查看表格。

内置工作流

脚本内置 3 个工作流:

工作流主模型适合场景
快速批改(推荐)aimarker-fast(不思考)速度快、性价比高,适合大多数题型
普通批改aimarker-pro(默认深度)精度更高,适合复杂题型
双评模式(高精度)aimarker-fast(不思考)+ 副模型两次评分超阈值自动仲裁

自定义工作流

你可以创建自己的工作流,自由组合:

  • 供应商:5plus1 官方、火山引擎、OpenAI 兼容等
  • 模型:每个供应商下的可用模型
  • 思考链深度:不设置 / minimal(不思考)/ low / medium / high

创建步骤

  1. 点击配置面板的「批改工作流」→「新建」
  2. 输入工作流名称
  3. 在弹出的编辑窗口中选择供应商、模型和思考链深度
  4. 点击「保存」

双评模式

双评模式使用两个 AI 模型独立评分:

  1. 主模型副模型同时对同一份试卷评分
  2. 如果分差 ≤ 阈值(默认 2 分),取平均分作为最终得分
  3. 如果分差 > 阈值,启动仲裁模型进行第三轮评分
  4. 仲裁模型综合两位老师的评分给出最终裁定

配置双评

  1. 在工作流编辑窗口中勾选「启用双评模式」
  2. 选择副模型(供应商 + 模型 + 思考深度)
  3. 选择仲裁模型(建议使用更高精度的模型)
  4. 设置分差阈值(默认 2 分)

双评结果

批改完成后,提交对话框会显示双评详情:

  • 老师 A / 老师 B 的评分和评分依据
  • 分差
  • 判定结果(共识 / 三评仲裁)

思考链深度

部分模型支持「思考链」(Chain of Thought),让 AI 在回答前进行推理:

深度说明适用场景
不设置模型默认行为大多数场景
minimal不思考,直接输出速度优先
low轻度思考简单题型
medium中度思考复杂题型
high深度思考需要详细推理的题目

注意:不是所有模型都支持思考链。请参考模型官方文档。