LLM组:仅能使用OpenAI GPT-4o作为唯一信息来源。搜索引擎组:可使用谷歌浏览器辅助,但明确禁止使用LLM增强答案。纯大脑组:禁用LLM及任何在线网站,仅凭自身知识和思考写作。 参与者需全部参加前三轮实验,并使用指定工具完成论文攥写。每轮将提供3个SAT议论文题目以供选择,参与者可自行选择其一,并在规定时间(20分钟)内完成书写。 期间,团队会使用脑电图(EEG)实时记录参与者的大脑活动,以评估他们的认知参与度和认知负荷,并深入了解论文撰写任务期间的神经激活情况。 同时利用自然语言处理(NLP)分析语言特征(如命名实体、词汇搭配),并对每位参与者进行访谈,然后在人类教师和一个专门构建的AI评委的协助下完成论文质量的评分。 实验结果表明,在大脑活动差异上,纯靠自己时大脑各频段段神经连接最强,说明需要调动更多记忆、规划和创造性思维,认知负荷最高,深度思考更充分。 而使用LLM时神经连接则最弱,自主思考大幅度减少,使用搜索引擎时介于二者之间,因为需要自行整合外部信息,视觉皮层活动更多。 在论文质量与记忆上,LLM组的论文结构更紧密规范,但内容同质化高,纯大脑组则体现出更独特的论文风格,反映了个人经验的参与,使用谷歌搜索时更容易受搜索排名的偏见影响,质量保持中等水平。 到第四轮实验,团队只选取了其中18名参与者,并按照他们原来的组别被重新分配到相反组别,即让LLM组改用纯大脑写作,纯大脑组改用LLM写作,并要求他们从自己之前写过的主题中挑选一个进行重写。 实验发现,原本使用LLM的参与者在不使用工具的情况下,大脑神经连接仍然弱于原大脑组,且引用能力较差,显示出对工具的依赖,在一定程度上会造成认知惯性。 而原本依靠自己完成的参与者在第四轮使用LLM时,大脑活动反而增强,表现出更高的记忆召回能力,并重新激活了大脑神经网络中的核心节点(枕顶叶和前额叶节点),因为他们同时整合工具建议和自主思考,没有完全依赖LLM。 具体来说,LLM就像是提供了一个便利陷阱,是以降低神经连接、损伤即时记忆编码置换出的高效率,从而导致记忆衰退、创造力降低,并在切换回无辅助写作时表现出持续性的认知缺陷。 举个例子,用LLM写论文就像 “抄答案”,虽然快,但没真正理解解题过程,下次自己做还是不会;纯靠自己就像 “自己推导”,虽然慢但记得牢;搜索引擎类似 “查资料辅助推导”,介于两者之间。 尽量将AI用于语法检查、润色或初步资料搜集,而不是直接生成核心内容和结构;在产出文章后,也要务必花时间理解消化,融入自己的见解。
