批改工作流
工作流决定了 AI 批改时使用哪个模型、以什么方式进行评分。不同工作流适用于不同场景。
📱 移动端用户
如果你在手机上浏览,可以左右滑动查看表格。
内置工作流
脚本内置 3 个工作流:
| 工作流 | 主模型 | 适合场景 |
|---|---|---|
| 快速批改(推荐) | aimarker-fast(不思考) | 速度快、性价比高,适合大多数题型 |
| 普通批改 | aimarker-pro(默认深度) | 精度更高,适合复杂题型 |
| 双评模式(高精度) | aimarker-fast(不思考)+ 副模型 | 两次评分超阈值自动仲裁 |
自定义工作流
你可以创建自己的工作流,自由组合:
- 供应商:5plus1 官方、火山引擎、OpenAI 兼容等
- 模型:每个供应商下的可用模型
- 思考链深度:不设置 / minimal(不思考)/ low / medium / high
创建步骤
- 点击配置面板的「批改工作流」→「新建」
- 输入工作流名称
- 在弹出的编辑窗口中选择供应商、模型和思考链深度
- 点击「保存」
双评模式
双评模式使用两个 AI 模型独立评分:
- 主模型和副模型同时对同一份试卷评分
- 如果分差 ≤ 阈值(默认 2 分),取平均分作为最终得分
- 如果分差 > 阈值,启动仲裁模型进行第三轮评分
- 仲裁模型综合两位老师的评分给出最终裁定
配置双评
- 在工作流编辑窗口中勾选「启用双评模式」
- 选择副模型(供应商 + 模型 + 思考深度)
- 选择仲裁模型(建议使用更高精度的模型)
- 设置分差阈值(默认 2 分)
双评结果
批改完成后,提交对话框会显示双评详情:
- 老师 A / 老师 B 的评分和评分依据
- 分差
- 判定结果(共识 / 三评仲裁)
思考链深度
部分模型支持「思考链」(Chain of Thought),让 AI 在回答前进行推理:
| 深度 | 说明 | 适用场景 |
|---|---|---|
| 不设置 | 模型默认行为 | 大多数场景 |
| minimal | 不思考,直接输出 | 速度优先 |
| low | 轻度思考 | 简单题型 |
| medium | 中度思考 | 复杂题型 |
| high | 深度思考 | 需要详细推理的题目 |
注意:不是所有模型都支持思考链。请参考模型官方文档。