场景 / 坑

同样一个”方案调研”的任务,我分别交给不同模型:

  • minimax 出来的结果就很差,常常和我提示词的要求有偏差;而且一次不能说太多,说多了它会丢
  • Opus / Sonnet,只要提示词写得认真,就能较好地完成、拿到我预期的结果。

同样的需求、同样的我,换个模型,结果天差地别

当时怎么做

我判断”该用哪个模型”靠两招:

  1. 平时多了解别人对各模型的评价——它们各自擅长什么、适合什么场景,心里有杆秤。
  2. 直接问模型自己胜不胜任:把任务描述给它,问”你能胜任这个吗?“。如果它自己都觉得不胜任,那就要嘛换一个更强的模型,要嘛适当降低期望,别硬逼一个不擅长的模型。

心法

模型不是越贵越好,是”任务 ↔ 模型”要匹配;同一个需求换个模型可能天差地别。选不准时两招:多看别人对模型的评价,以及直接问模型自己胜不胜任——它说不行,就换或降期望。

可自检练习

任务: 拿你手上一个真实任务,做两件事:

  1. 先想/查一下:这是哪类活(写作?调研?算数?翻译?),哪些模型在这类活上口碑好。
  2. 把任务描述给你打算用的模型,直接问它:「你能胜任这个吗?有没有更适合的做法?」根据它的回答,决定用它 / 换更强的 / 适当降低期望

做对了长这样:

  • 你不再默认”只用某一个模型干所有事”。
  • 动手前你会先判断任务类型,必要时直接问模型自己行不行,再决定用谁。

关联