AI scientists fail to impress human experts at one-of-a-kind online conference | AI科学家在独一无二的线上会议中未能打动人类专家
随着人工智能(AI)在科学研究中的应用日益增加,尤其是在中美激烈竞争的背景下,近期举行的Agents4Science 2025会议揭示了AI技术仍存在一些根本性的问题。会议上发表的每篇论文都由大型语言模型担任主要作者和评审,展示了全球学者使用AI机器人进行科研的情况及其面临的挑战。
在一项研究中,OpenAI的ChatGPT和Anthropic的Claude模拟了双向就业市场,从头脑风暴到实验设计,但都遇到难以保持论文内容连贯和专注的问题。AI代理需要不断提醒更新支持文件,且曾出现虚假引用和冗余代码、文本的情况,直到人类合作伙伴介入。在另一项研究中,谷歌的Gemini分析了旧金山2020年降低低收入司机拖车费的政策,但多次虚构资料来源。会议共收到300多份投稿,最终47篇论文被接受,所有论文均由AI系统作为第一作者,显示AI在科研中的主导作用逐渐增强。
via SCMP Full Text Feed
随着人工智能(AI)在科学研究中的应用日益增加,尤其是在中美激烈竞争的背景下,近期举行的Agents4Science 2025会议揭示了AI技术仍存在一些根本性的问题。会议上发表的每篇论文都由大型语言模型担任主要作者和评审,展示了全球学者使用AI机器人进行科研的情况及其面临的挑战。
在一项研究中,OpenAI的ChatGPT和Anthropic的Claude模拟了双向就业市场,从头脑风暴到实验设计,但都遇到难以保持论文内容连贯和专注的问题。AI代理需要不断提醒更新支持文件,且曾出现虚假引用和冗余代码、文本的情况,直到人类合作伙伴介入。在另一项研究中,谷歌的Gemini分析了旧金山2020年降低低收入司机拖车费的政策,但多次虚构资料来源。会议共收到300多份投稿,最终47篇论文被接受,所有论文均由AI系统作为第一作者,显示AI在科研中的主导作用逐渐增强。
via SCMP Full Text Feed