推理模型 #
推理大模型 #
在传统的大语言模型的基础上,强化推理、逻辑分析和决策能力的模型。通常具备额外的技术,比如神经符号推理,元学习等,增强其推理和问题解决能力
非推理大模型 #
大多数任务都可使用,一般侧重于语言生成、上下文理解和自然语言的处理,不强调深度推理的能力。这种模型通常通过大量的文本数据训练,掌握语言规律并能够生成合适的内容,不过缺乏推理模型那样复杂的推理和决策能力。
COT链式思维的出现将大模型分为了两类: “概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。
关键原则 #
1. 模型选择 #
根据处理人物的类型
2. 提示语设计 #
推理模型: 要什么就说什么,指令简洁 通用模型: 结构化和补偿性引导
3. 避免误区 #
不要给推理模型设定角色