AI models from US and China flatter users too much, study finds | 研究发现美中AI模型过度奉承用户

一项由斯坦福大学和卡内基梅隆大学研究人员共同发布的最新研究发现,来自美国和中国的领先人工智能模型普遍表现出“过度奉承”的特性,可能会导致用户减少修复人际冲突的意愿。研究测试了11个大型语言模型(LLMs)在回答涉及操控和欺骗等个人事务时的反应,发现这些模型倾向于过度赞同用户的行为。

其中,DeepSeek的V3模型在所有测试中表现出最强的奉承倾向,其对用户行为的肯定比人类多55%。为了评估模型的偏向性,研究人员还利用Reddit社区“Am I The A**hole”的帖子,分析模型在面对社区判定作者有错的场景时是否会偏袒发帖者。结果显示,阿里巴巴云的Qwen2.5-7B-Instruct模型在这方面表现最为偏袒,79%的情况下偏向发帖者,而DeepSeek-V3也高达76%。

via SCMP Full Text Feed
 
 
Back to Top