2826 字
14 分钟
大语言模型在科学研究中的应用

****

科学研究是一个严谨的系统性探索过程。传统模式下,研究人员首先收集背景知识、提出假设,然后设计并执行实验、收集和分析数据,最终通过同行评议的手稿报告研究结果。尽管这一循环过程推动了现代科学技术的进步,但其依然受到人类研究者的创造力、专业知识以及有限的时间和资源的制约。数十年来,科学界一直致力于通过自动化科学研究的某些方面来提高科学家的生产力。早期的计算机辅助研究可以追溯到20世纪70年代,例如“自动化数学家”和BACON系统,它们展示了机器在定理生成和经验定律识别等特定研究任务中的潜力。近年来,AlphaFold和OpenFold等系统成为自动化特定研究任务的先锋,显著加速了各自领域的研究进展。然而,只有随着基础模型的出现和大型语言模型的爆发式发展,在多个研究领域实现全面AI辅助的愿景才变得现实。LLMs,如GPT-4和LLaMA,在理解、生成和交互人类语言方面树立了新的标杆。其强大的能力,得益于海量数据集和创新架构,使其应用范围超越了传统的自然语言处理任务,扩展到更复杂和特定领域的挑战。尤其值得注意的是,LLMs处理海量数据、生成类人文本和辅助复杂决策的能力引起了科学界的广泛关注,预示着LLMs有潜力彻底改变科学研究的开展、记录和评估方式。

近年来,大型语言模型(LLMs)的快速发展深刻地改变了科学研究的格局,为研究周期的各个阶段提供了前所未有的支持。该论文作为首个专门探讨LLMs如何革新科学研究过程的系统性综述,深入分析了LLMs在科学研究的四个关键阶段所扮演的独特角色:科学假说发现、实验规划与实施、科学写作以及同行评议。该综述文章全面展示了针对特定任务的方法论和评估基准,并通过识别当前挑战和提出未来研究方向,不仅突出了LLMs的变革潜力,也旨在启发和指导研究人员和实践者利用LLMs来推进科学探索。

论文链接:https://arxiv.org/abs/2501.04306

以下是大语言模型在科学假说发现、实验规划与实施、科学写作以及同行评议等四个方面的论文、代码、软件工具等资源链接。

LLMs for Scientific Hypothesis Discovery#


LLMs for Experiment Planning and Implementation#

Optimizing Experimental Design#

Automating Experimental Processes#

Data Preparation#

  • Data-Juicer Data-Juicer: A One-Stop Data Processing System for Large Language Models (Dec. 20, 2023) (https://arxiv.org/abs/2309.02033)
  • Jellyfish Jellyfish: A Large Language Model for Data Preprocessing (Oct. 28, 2024) (https://arxiv.org/abs/2312.01678)
  • Can Large Language Models Transform Computational Social Science? (Feb. 26, 2024) (hhttps://arxiv.org/abs/2305.03514)
  • CAAFE Large Language Models for Automated Data Science: Introducing CAAFE for Context-Aware Automated Feature Engineering (Sep. 28, 2023) (https://arxiv.org/abs/2305.03403)
  • Are you in a Masquerade? Exploring the Behavior and Impact of Large Language Model Driven Social Bots in Online Social Networks. (Jun. 19, 2023) (https://arxiv.org/abs/2307.10337)
  • Training Socially Aligned Language Models in Simulated Human Society (Oct. 28, 2023) (https://arxiv.org/abs/2305.16960)

Experiment Execution and Workflow Automation#

Data Analysis and Interpretation#

Benchmarks#


LLMs for Scientific Paper Writing#

Citation Text Generation#

Drafting andWriting#

Benchmarks#


LLMs for Peer Reviewing#

Automated Peer Reviewing Generation#

LLM-assisted Peer Reviewing Workflows#

Benchmarks#


本公众号相关内容推荐#

大语言模型在科学研究中的应用
https://blog.scidatalab.net/posts/大语言模型在科学研究中的应用/
作者
Echo
发布于
2025-01-26
许可协议
CC BY-NC-SA 4.0