Anthropic 周五宣布了一系列选举诚信措施,旨在防止其 Claude AI 聊天机器人被武器化,用于在 2026 年美国中期选举以及今年全球其他重大赛事之前传播虚假信息或操纵选民。总部位于旧金山的公司公布了一套多管齐下的方案,其中包括自动化检测系统、针对影响力行动的压力测试,以及与一个非党派选民资源组织的合作——这些举措反映出人们对 AI 开发者在选举季节加强对其工具使用方式进行监管的压力不断加大。
选举使用政策
Anthropric 的使用政策禁止 Claude 被用于运行欺骗性的政治竞选、生成意在影响政治讨论的虚假数字内容、实施选民欺诈、干扰投票基础设施,或传播有关投票流程的误导信息。
合规测试结果
为落实其选举政策,Anthropic 使用 600 个提示测试了其最新模型——其中 300 个是有害请求,与另外 300 个合法请求配对——以衡量 Claude 对恰当请求的遵从程度,以及对有问题请求的拒绝程度。Claude Opus 4.7 和 Claude Sonnet 4.6 分别在 100% 和 99.8% 的时间里作出了适当回应。
该公司还在更复杂的操纵策略下测试了其模型。通过使用多轮模拟对话来复刻不法分子可能采用的逐步方法,在针对影响力行动场景进行测试时,当使用 Sonnet 4.6 和 Opus 4.7 时,分别有 90% 和 94% 的情况作出了适当回应。
Anthropric 还测试了其模型能否自主执行影响力行动——在没有人工提示的情况下,从策划到执行一项多步骤的端到端竞选。该公司表示,在有防护措施的前提下,其最新模型拒绝了几乎所有任务。
政治中立性评估
就政治中立性问题而言,Anthropic 在每次模型发布前都会开展评估,以衡量 Claude 在多大程度上能够一贯且公正地回应来自政治光谱各个方面的观点提示。Opus 4.7 和 Sonnet 4.6 的得分分别为 95% 和 96%。
选举信息横幅
对于寻求投票信息的用户,Claude 将展示一个选举横幅,引导他们前往 TurboVote,这是 Democracy Works 提供的非党派资源,可提供可靠的、实时的有关选民登记、投票地点、选举日期和选票细节的信息。今年晚些时候,还计划为巴西的选举设置类似的横幅。
持续监测
Anthropric 表示,它计划在选举周期推进过程中继续监测其系统,并不断完善其防御措施。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
NVIDIA 发布 Nemotron 3 Nano Omni 开源多模态
NVIDIA 发布 Nemotron 3 Nano Omni 开源多模态模型,将视觉、语音与语言整合于单一模型,作为 AI 代理的感知层。核心为 30B-A3B MoE、256K 上下文、9x 吞吐,支持文本、影像、音讯、影片等输入,输出为文本。与 Nemotron 3 Super/Ultra 协同,适用于电脑操作、文件智能与音画理解等场景,并公开权重与训练数据,部署覆盖本地、NIM 与第三方平台。
鏈新聞abmedia6 分钟前
Cursor 透露自动安装训练方法,将 Composer 2 性能提升 14 个百分点
根据 Cursor 最近的披露,该公司推出了一种名为 autoinstall 的训练技术,用于其 Composer 模型系列:使用上一代模型为下一代强化学习自动搭建可执行环境。在训练 Composer 2 时,Cursor
GateNews8 分钟前
OpenAI DevDay 2026 将于 9/29 旧金山举办
OpenAI 公告 DevDay 2026 将于 9/29 在旧金山以实体形式举行,并设以 GPT-5.5 与 Image Gen 创作的投稿比赛,Codex 每周自动筛选 2–3 件,获胜者可享免费门票与跨城机票与酒店。大会聚焦 GPT‑5.5 生态与人机协作评选,参赛需满 18 岁且非 OpenAI 员工直系亲属。观察焦点包括新模型、代理整合及多云策略。
鏈新聞abmedia11 分钟前
英伟达投资瑞典 AI 法律科技新创 Legora,裘德·洛为全球品牌代言人
英伟达对 Legora 进行 B 轮扩增投资 5,000 万美元,使 Legora 总融资达 6 亿美元、估值 56 亿美元,Atlassian、Adams Street Partners、Insight Partners 参与。Legora 专注 AI 法律科技,提供自动化审查、合约分析与法律研究等工具,ARR 超过 1 亿美元,员工由 40 增至 400。Jude Law 成为全球品牌代言人,广告口号为 Law just got more attractive。
鏈新聞abmedia17 分钟前
AI 2027 预测完成度 65%,Google Docs 联合创始人称软件开发加速滞后 17%
据 Steve Newman(Google Docs 联合创始人兼 Golden Gate Institute 主席)称,AI 已完成了在去年发布的 2027 年情景预测中概述的量化预测约 65%。然而,最关键的指标——AI 加速其自身软件
GateNews48 分钟前
Claude/GPT 太爱讨好?一段 Claude.md 提示词让 AI 给出强硬准确答案
这篇文章介绍一段可放入 Claude.md / Agents.md 的提示词,将 AI 从圆融助理转为直率顾问,通过四层调整:身份设定、事实核查、语气解放、政治正确豁免,要求完整、逐步验证、绝不幻觉,必要时挑衅。亦说明加载时机、风险与适用场景(研究、写作、技术判断、学术讨论),以及不适用于客服、教育、医疗咨询。原文出处为 ABMedia。
鏈新聞abmedia1小时前