Naver 于 2 日发布了一款新 AI 模型,该模型整合了妈妈论坛帖子和餐厅评论中的真实生活信息,以提高答案准确性。该模型是在 Naver D2SF 江南举行的题为“从搜索到执行:创造 Naver AI 搜索的下一代 AI 技术”的会议上推出的。这款基于 HyperCLOVA X 的轻量级模型应用了“驾驭工程”(harness engineering),以反映 Naver 生态系统中的生活导向信息,使 AI 能够基于实际用户经验而非通用数据提供答案。
Naver 在“AI Tab”搜索服务中部署的 AI 模型采用了驾驭工程,这是一种像马具引导马匹一样控制和引导 AI 智能体行为的结构。当用户搜索数学辅导班费用时,系统会根据妈妈论坛上家长最近讨论的内容提供答案。当用户询问餐厅停车情况时,AI 不仅反映官方商家信息,还会反映实际停车过的用户的真实评价。
Naver AI 搜索服务负责人 Han Seung-kyun 将驾驭工程比作 AI 的“工作常识”,并指出“要创建在服务中良好运行的 AI 智能体,除了大型语言模型(LLM)外,同时设计成本效益和稳定性的驾驭工程至关重要。”Han 补充道,“将过去 27 年积累的搜索基础设施和专业知识、博客和论坛等海量内容,以及购物和本地生活等各类服务资产与 AI 技术连接起来,引导从搜索到执行的体验,是 Naver 独特的竞争力,无人能轻易效仿。”
Naver 构建了分工明确的小语言模型(SLM)结构,以提高 AI Tab 的效率。并非由一个巨型 LLM 处理所有任务,而是结合特定角色的小语言模型(SLM)来降低运营成本,同时提高响应速度和质量。采用这种方法,Naver 将设备运营成本降低了多达 3 倍,并将响应速度提升了 2 倍以上。
Naver 使用 Clarify RL(强化学习)技术训练 AI,该技术确保 AI 不会随意解读模糊请求,而是通过额外问题确认用户意图。因此,与 HyperCLOVA X 相比,幻觉减少了多达 30 个百分点。
Naver Cloud HyperScale AI 模型负责人 Lee Ki-chang 强调,“应用于 AI Tab 的模型的特点是从训练数据构建到模型设计和强化学习的整个流程都针对 Naver 服务进行了优化”,并补充说,“目标是创建一个在 Naver 用户的搜索、购买和预订等实际服务流程中运行最准确、最高效的模型。”
Naver 公布了利用 AI Tab 搜索栏前端的 SmartLens 推进多模态技术发展的战略。多模态技术使 AI 能够理解和利用包括图像和视频在内的各种形式的信息,而不仅仅是文本。
用户可以在搜索栏上传图像而非文本,并发出诸如“查找类似产品”或“预订具有这种氛围的场所”等指令。虽然现有 AI 已能进行图像和视频搜索,但 LLM 模型先识别图像,再进行基于文本的搜索。相比之下,Naver 的多模态智能体将图像输入到执行的整体过程理解为一个单一请求。
Naver 未来 AI 中心负责人 Yoon Sang-doo 表示,“Naver 通过 SmartLens 近 10 年积累的视觉搜索技术是创造 AI 智能体观察世界的眼睛的核心技术”,并补充说,“未来 Naver 的 AI 智能体服务将朝着不仅通过文本,还通过图像理解用户意图,并连接实际行为的方向发展。”
Naver 在 2 号当天发布了什么? Naver 于 2 号当天在 Naver D2SF 江南发布了一款新 AI 模型,该模型整合了妈妈论坛帖子和餐厅评论中的生活导向信息。该模型基于 HyperCLOVA X,并使用驾驭工程来反映其回答中的真实用户经验。
Naver 使用新 AI 模型将运营成本降低了多少? Naver 使用小语言模型(SLM)结构将设备运营成本降低了多达 3 倍。该公司还将响应速度提升了 2 倍以上,并将幻觉率比 HyperCLOVA X 降低了多达 30 个百分点。
Naver AI 搜索中的 SmartLens 多模态技术是什么? SmartLens 是 Naver 的多模态技术,允许用户在搜索栏上传图像并接收诸如“查找类似产品”或“预订具有这种氛围的场所”等指令的答案。该技术将图像输入到执行的整体过程理解为一个单一请求,利用了 Naver 近 10 年积累的视觉搜索技术。
相关快讯