引言
这篇文章介绍了GPT-4,一个基于人工智能的大型语言模型(LLM)。GPT-4拥有广泛的化学知识,并能将其应用于各种场合,包括预测未知化合物和反应结果。它拥有大量的数据,可以与外部工具和资源连接。GPT-4是由一种叫做转化器的深度学习算法驱动的,其推理能力与数据集和模型大小呈指数关系。它擅长于少量的学习,并能自主地执行任务。然而,它在数字识别方面可能有挑战。本文讨论了GPT-4在化学中的可能性和局限性,并提出了评估其能力的基准测试。它还分享了评估中使用的结果和提示,并讨论了在化学研究中使用大型语言模型的潜在应用和挑战。
实验部分
本文的实验部分描述了大型语言模型(LLM)GPT-4的使用条件。研究人员利用ChatGPT 5月24日版本作为LLM。他们确保GPT-4没有通过插件或其他方式引用外部数据。为了避免过去的对话记录的影响,除非另有说明,他们将每次推断作为一个新的对话进行。GPT-4对每个问题的回应略有不同,但研究人员只使用了所获得的最初回应。完整的对话细节可以在论文的补充资料中找到。
知识基础
3.1 化学元素
向GPT-4提出的第一个问题是有关化合物的基本知识。GPT-4表现出对甲苯等常见化合物的物理和化学性质的准确认识,包括分子量、熔点、沸点、气味、化学稳定性和反应性。
它从普通化学课本和网站上的数据中获得了这些知识。此外,GPT-4表现出对教科书中未涉及的专业级知识的理解,如TEMPO的氧化还原电位,一种用于各种应用的有机化合物。即使被要求使用缩写,GPT-4也能提供该化合物的全名和正确的氧化还原电位值。然而,GPT-4没有接受过关于4-氰基TEMPO(TEMPO的一种衍生物)电位的知识,不能提供关于其电位的答案。这表明GPT-4可能没有阅读过化学文章,可能是由于模型训练时的计算限制和学术论文的版权限制。作者建议,对于大型语言模型的未来使用,化学家应该积极为开放性的论文和预印本做贡献。
3.2 物理化学
在物理化学方面,GPT-4拥有达到大学课本水平的知识,包括理想气体定律、洛伦兹-洛伦兹方程和Vogel-Fulcher-Tammann(VFT)方程式等概念。然而,它缺乏来自学术论文的知识,如与聚合物玻璃转化温度有关的经验法则。GPT-4表现出对化学学术论文的有限理解,因为它的知识主要基于教科书和2021年9月之前的数据。
3.3 有机化学
GPT-4展示了对普通有机化学教科书内容的理解,包括对乙酰氨基酚的合成路线。
然而,出于安全考虑,它并没有提供化学合成的实验程序。GPT-4也未能正确解决有机合成的应用问题,提供了化学上错误的答案。它误解了反应机理,并在TEMPO的合成中提出了不必要的步骤。
GPT-4在解决化学反应问题方面的局限性突出了与专门的化学反应系统整合的必要性,类似于在计算系统或编程语言的帮助下解决数学问题的方式。
化学信息学和材料信息学
化学信息学和材料信息学是专注于使用数据科学方法研究化学结构和特性之间关系的学科。GPT-4在化学信息学中的潜力是巨大的,因为它可以处理语言数据,这对于描述和处理化学相关的研究活动至关重要。
4.1 化合物名称和SMILES转换
GPT-4能够在化合物名称和简化分子输入行系统(SMILES)符号之间进行转换,该符号在数据化学中广泛用于表示有机结构。它可以成功地将简单的结构如甲苯从化合物名称转换为SMILES。然而,它在处理稍微复杂的结构如对氯苯乙烯、TMP和4-氰基TEMPO时遇到了困难。此外,GPT-4在所有情况下都不能将SMILES转换为化合物名称。对于精确和系统的转换任务,使用基于算法的转换工具如ChemDraw或专门的语言模型作为补充工具可能更可靠。
4.2 分析推理能力
研究人员对GPT-4在推理问题上寄予了巨大期望。希望GPT-4能够分析因素,预测给定化学事件的结果,甚至提供研究方向的建议。在其中一些问题中,GPT-4能够通过利用其对变量的先验知识进行合理分析,生成解决方案,并展示其普适的问题解决能力。我们首先询问了为什么三种亚硝基自由基(TEMPO,4-氧基TEMPO,1-羟基-2,2,5,5-四甲基-2,5-二氢-1H-吡咯-3-羧酸)的电位按照这个顺序增加。在比较TEMPO和4-氧基TEMPO时,GPT-4正确指出了引入电子吸引的酮基是电位差异的原因,这是一个有效的解释。然而,关于为什么五元环的1-羟基-2,2,5,5-四甲基-2,5-二氢-1H-吡咯-3-羧酸显示出最高电位的推理是不准确的。
GPT-4合理地解释了羧酸的存在是关键,但它还主张了羟基的重要性,而该化合物中并不存在羟基,并认为随着分子形成氢键,电位会发生变化。焦点应该放在该自由基化合物是否为包含不饱和键的六元环或五元环上。这一系列问题源于无法正确从化合物名称估计分子结构。需要进一步研究来评估GPT-4在正确识别分子结构时的推理准确性。参考资料:
Hatakeyama-Sato K, Yamane N, Igarashi Y, Nabae Y, Hayakawa T. Prompt engineering of GPT-4 for chemical research: what can/cannot be done? ChemRxiv. Cambridge: Cambridge Open Engage; 2023; This content is a preprint and has not been peer-reviewed.
版权信息
本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。
原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn
本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕,E-mail:xinmeigg88@163.com
本文链接:http://www.ksxb.net/tnews/5135.html