辉达在官网提供文章,解释 NVIDIA AI 在加速推论方面的优势。AI发展长期以来受到「更多运算、更多训练资料、更多参数」就能打造更强的AI模型这一思维驱动,然而,测试阶段扩展技术的出现改变了这一观念。在推论阶段运用额外运算来提升准确度,让大型语言模型(LLM)能透过多次推论处理复杂问题,并且在推理过程中详述解决步骤。这种方式要求强大的运算资源来支撑AI的推理过程,进一步推动了对加速运算能力的需求,并促使AI训练与推理技术的快速发展。
预训练扩展被认为是AI发展的基础法则。它证明了增加训练资料、模型参数与运算资源可以有效提升AI的效能。大型基础模型依赖于多模态数据(如文字、影像、音讯等),使得AI在理解与推理能力上不断进化。预训练过程需要大量的资源,这对许多组织而言是一个不小的负担。
因此,许多企业选择使用开源基础模型,并透过微调(fine-tuning)等技术,使这些模型更符合特定应用场景的需求。这一模式不仅降低了AI的采用门槛,还推动了AI技术的普及,同时促进了加速运算技术的发展,进一步推动了AI在各领域中的应用。

训练后扩展技术使得AI模型能够更贴合特定的应用需求。可以将预训练视为AI学习的通识知识,而训练后扩展则是将其专业能力进一步强化。例如,大型语言模型可透过这些技术来增强情感分析、翻译,甚至在医疗与法律等专业领域中的理解能力。训练后扩展的核心方法包括微调、剪枝(pruning)、量化(quantization)、蒸馏(distillation)、强化学习(RL)和合成资料增强(Synthetic Data Augmentation)。这些技术不仅提升了AI的运算效率,还增强了其准确性和适应性。
微调技术透过专属资料来最佳化模型,使其能更精确地应对特定的任务。蒸馏技术则是让小型模型从大型教师模型中学习,在效能和计算成本之间取得平衡。强化学习则透过用户回馈(RLHF)或AI自身回馈(RLAIF)来优化模型决策,这在改善聊天机器人回应品质方面有显著效果。
最佳解搜寻采样(Best-of-n sampling)技术则能从多个生成结果中筛选出最佳答案,提高输出质量。合成资料技术则能帮助补充训练数据中的边缘案例,提升AI在特殊情境中的应用能力。

随著AI技术的发展,长思考技术逐渐成为解决复杂问题的关键。大型语言模型在面对复杂问题时,若仅依赖单次推论,往往无法得出最佳结果。为了解决这一挑战,AI模型需要进行深入推理,并基于这些推理给出合理的答案,这正是代理型AI的核心能力。这一过程与人类的思考模式类似。例如,当面对简单的算数问题「2+2」时,大多数人能够直接回答「4」,但若要求制定一个能让公司利润成长10%的商业计划,则需要经过多步推理和评估不同方案,才能给出最合理的建议。
为了寻找问题的最佳解决方案,长思考技术允许AI在推理过程中进行额外运算,并在回答前预演多个可能的解决方案。这种方式的运算量可能是单次推论的100倍,但这样能够提高最终答案的准确性和可靠性。例如,在开发复杂的客制化程式码时,AI可能需要数分钟甚至数小时来进行推理,最终找到最佳方案。这一推理过程能将复杂问题分解为多个步骤,并将思考过程展示给使用者,进一步提高问题解决的透明度。

测试阶段扩展技术包含多种方法。思维链(chain-of-thought)提示将问题拆解为简单步骤,有助于AI更系统化地进行推理;多数决抽样技术让AI生成多个回应并选择最常见的答案;搜寻技术则能通过评估不同回应路径来优化最终结果。这些技术的综合应用,使得AI能够更有效地处理多步骤、复杂的推理问题,并在实际应用中发挥更大的价值。
这些技术对多个行业的发展至关重要,尤其在医疗领域,AI能通过测试阶段扩展技术分析大量资料,预测疾病进展,并根据药物化学结构推测潜在副作用。此外,AI还能筛选临床试验资料,提供个性化治疗建议,并解释不同疗法的优缺点。
在零售与供应链管理领域,长思考技术能帮助企业进行精确的需求预测、最佳化物流路径,并作出永续的采购决策。全球企业也能利用AI草拟商业计划、编写与除错程式码,甚至优化无人驾驶车辆和仓储机器人的运行路径。随著新一代推理模型如OpenAI的o1-mini和o3-mini、DeepSeek R1、Google DeepMind的Gemini 2.0 Flash Thinking等相继问世,AI在推理和决策领域的潜力将得到进一步释放。
不过,这些模型在推理过程中需要使用大量运算,才能对复杂问题进行推理与产生正确答案,代表企业仍需要扩充加速运算资源,才能提供能够解决复杂问题、编写程式码和规划多步骤的下一代AI推理工具,这也符合辉达在DeepSeek推出低成本AI模型后,仍强调需要购买更多AI晶片,支持AI模型发展的理论。
