上海人工智能实验室(上海AI实验室)致力于通过“通专融合”的路径探索开放、可控、可信的通用人工智能(AGI),其核心技术之一在于同步提升深度推理与专业泛化能力。2024年11月25日,上海AI实验室展示了自主生成高智力密度数据、具备元动作思考能力的“模型”等一系列创新进展,并开放强推理模型书生InternThinker的试用体验。
该模型具备长思维能力,并能在推理过程中进行自我反思和纠正,从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。InternThinker通过元动作思考范式引导模型的搜索空间,使模型更高效地习得和产生多样化的推理策略组合,基于通专融合的方式进行数据合成,并通过构建大规模沙盒环境获取反馈,在不依赖已有强推理模型的情况下,实现高质量思维链的独立构建,并大幅提升模型的复杂任务处理性能。
强大的推理能力是迈向通用人工智能的重要基础,上海AI实验室的研究团队还创新性地设计了元动作思考范式,引导模型解决问题的过程,如理解问题、回忆知识、规划、执行、反思、总结等。模型在解决复杂任务时,会显式且动态地选择元动作,并展开相关动作的具体思维过程。
在“通专融合”的探索中,上海AI实验室采用了基于通专融合的技术路线生产所需数据。通过构建大规模沙盒环境,为可形式化验证的推理任务提供反馈信号,包括数十种编程语言的高效率代码执行编译环境,以及代码领域之外的通用推理任务沙盒。这使得模型在多种专业任务中都能表现出较强的推理能力,并具备一定的任务泛化性。
试用链接:https://internlm-chat.intern-ai.org.cn(登录后点击左侧“InternThinker”即可体验)。上海AI实验室诚邀广大用户及开发者试用并反馈,共同推动技术进步。
InternThinker模型:深度学习中的“元动作”思考
为高效提升模型的推理能力,InternThinker采用了更接近人类学习方式的路径。人在学习解决复杂推理任务时,并非从海量的样本中进行单点知识的学习,而是思维模式的学习——在解决问题的过程中,通过回忆相关知识点,对正确的解题过程进行理解、记忆,对错误解题等过程进行反思和修正,即对自我的认知过程进行觉察和调节——该能力也被称作元认知能力。
受元认知理论的启发,研究团队设计了一系列元动作来引导模型解决问题的过程,如对问题的理解、知识回忆、规划、执行、反思、总结等。模型在面对复杂任务时,会显式且动态地选择元动作,再进一步展开相关动作的具体思维过程。
InternThinker模型仍在持续迭代中,期待与您共同见证其在通用人工智能领域的突破和进步。