过去几年,人工智能研究中最显著的突破是大型语言模型(LLMs)在自然语言处理方面取得的进展。这
些神经网络模型基于Transformer架构[VSP+ 17],并在大规模的网络文本数据体上进行训练,其核心是使用
一个自我监督的目标来预测部分句子中的下一个单词。在本文中,我们报告了由OpenAI开发的新LLM的证
据,它是GPT-4[Ope23]的早期和非多模态版本,根据1994年的定义,表现出许多智能的特征。尽管是纯粹
的语言模型,这个早期版本的GPT-4在各种领域和任务上表现出显著的能力,包括抽象、理解、视觉、编码
、数学、医学、法律、对人类动机和情感的理解等等。
评论0