DGrid AI 发布 PoQ-Judge 研究论文,将 LLM 质量评估成本降低 72%

据 ChainCatcher 称,DGrid AI 于今日发布其最新研究论文《PoQ-Judge》,提出了一种多架构质量评估框架,消除了对参考答案的需求。该框架在保留测试集上与人工评估得分实现了 0.747 的相关性,同时通过级联评估和在线权重校准将评估成本降低了 72% 以上。PoQ(Proof of Quality)是 DGrid 的专有共识机制,旨在防止在协议层部署低质量模型以及进行数据操纵。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论