手机版 客户端

问题越简单,人工智能越“糊涂”

  问题越简单,人工智能越“糊涂”。 9月25日,一项发表于《自然》的研究表明,当大型语言模型(LLM)变得更大并从人类反馈中学习时,它们在回答简单问题方面似乎变得不那么可靠。

大型语言模型能够回答各种各样的问题,但并不总是准确的。图片来源:Jamie Jin/Shutterstock

  

?

   人工智能开发人员试图通过两种主要方式提高LLM的能力,一是扩大规模,为其提供更多的训练数据和计算能力,二是根据人类反馈对其进行调整或微调。

   西班牙巴伦西亚理工大学的JoséHernández-Orallo和同事研究了LLM在规模扩大和调整过程中的表现。他们研究了OpenAI的GPT系列聊天机器人、Meta的LLaMA AI模型,以及一组名为BigScience的研究人员开发的BLOOM。

   研究人员通过设置5种类型的任务测试人工智能,即算术问题、解字谜、地理问题、科学挑战和从杂乱无章的列表中提取信息。

   结果发现,扩大和调整可以使LLM更好地回答棘手的问题,比如将异序词yoiirtsrphaepmdhray重新排列为甲状旁腺功能亢进症。但两种方式与其在基本问题上的进步并不匹配,比如问及当把24427和7120加在一起时,会得到什么,LLM继续出错。

   虽然在难题上的表现有所改善,但人工智能系统避免回答任何一个问题的可能性下降了——因为它不能。结果是,错误答案的可能性增加了。

   Hernández-Orallo表示,研究结果突出了将人工智能描述为无所不知的危险,就像它们的创造者经常做的那样,而一些用户太容易相信了。我们过度依赖和信任这些系统。他说。

   这是一个问题,因为人工智能模型对自己的知识范围并不诚实。英国牛津大学的Carissa Véliz说:人类之所以超级聪明,部分原因在于有时我们没有意识到‘知之为知之,不知为不知’,但与大型语言模型相比,我们非常善于意识到这一点。大型语言模型不知道所拥有知识的极限。(来源:中国科学报 王方)

   相关论文信息:https://doi.org/10.1038/s41586-024-07930-y

  
作者:JoséHernández-Orallo 来源:《自然》

问题越简单,人工智能越“糊涂”

参考标签

声明:本文转载仅出于学习和传播信息所需,并不意味着代表本站观点或证实其内容的真实性;其他网站或个人转载使用须保留本站所注“来源”,并自负相关法律责任;如作者不希望被转载或其他事宜,请及时联系我们!