是否想知道您的LLM API是否过于超过收费?隐藏的
发布时间:2025-06-19 10:33
本文的五月仪式来自马里兰州大学的案件(合作,自动化,可扩展和高效的情报)实验室。主要参与者是Sun Guoheng医生和Wang Ziyao医生的学生,教育家是Li Ang教授。研究背景:在业务保护与用户纸知识纸之间找到平衡:无形的令牌,可见账单:迫切需要审核电话和多机构合作。提高这些功能通常取决于模型中“思考”的一系列复杂过程,或者代理系统中代理之间的频繁信息相互作用。但是,为了保护知识产权的基本权利(例如防止模型建模或代理流的泄漏)并提供更好的Guma经验,服务提供商通常会隐藏这些中间步骤并仅向用户显示最终输出。这是保护和减轻与卷发的关系的常见技能T商业环境和技术。最近,实验室案例实验室提到了隐藏其内部工作流程的此类服务,仅是为了恢复最终结果,但被指控为“商业不透明LLM服务(COLS)。 “该模型会默默增加用户成本或降低自己的成本。图3将LLM推理捕获为一个例子,显示了基本模型隐藏的倾斜令牌的数量,这通常是最终答案的十二倍。修订。通过提高生成的数字NG令牌或模型中的内部调用数量。具体而言,通过LLM推理,代币的生长可能是由理解的冗余步骤引起的(例如重复提取和扩张不良);在代理LLM中,模型的扩展频率也可能存在l呼叫,甚至宽恕沟通行为。 2。崩溃的质量,即服务提供商在保持计费标准的同时,用便宜的模型或工具悄悄地代替了它。示例:调用小规模或数量的LLM推理模型;工具调用而不是实际实施代理LLM,或使用低成本工具更改索取的高成本工具,例如将Web搜索更改为本地知识库。此外,如图4所示,团队还建议IS结构化的三层审核蓝图旨在促进Cols行业建立标准且经过验证的审计基础架构:第一层(服务实施层):记录大型操作,例如COLS内部模型生成,通信通信,通信和工具呼叫;第二层(安全承诺和记录层):按照DENENENENECTED DIGEST,HASH链,区块链等的形式提交上述操作;第三层(观众D反馈层):允许用户或第三方审计机构独立验证服务行为,并为反馈报告提供有关理性账单或服务一致性的用户。图4:三层审核大纲。基于“经过证明但没有泄漏”的概念,该地块鼓励Haulp Cols服务提供商在保护业务敏感信息的同时,为用户提供明确可靠的服务承诺。该系统不仅支持技术透明度,而且还为政策和合规性制定提供了实施途径。硬币:计数商业不可见量的令牌LLM apisarxiv链接:https://arxiv.org/pdf/2505.137778github链接:https://github.com/case-lab-md/case-lab-md/llm--------------- https://huggingface.co/collections/s1ghhhh/coin-llm- auditing-6842a46Feea043D46C0d338e In order to solve the billing audit problem of the reasoning LLM API, the research team also proposed a verification framework to prevent token quantity inflation coin硬币硬币旨在提供技术可能性,使用户有一种验证服务真实性的方法,同时尊重和保护Cols贸易和知识权拥有的秘密,从而在用户和Cols之间建立“信任的桥梁”。如算法1所示,硬币包含了许多灵活性验证,其中每次旋转证明了COLS声称的令牌数量是否准确,以及推理的隐藏代币是否实际上参与获得答案,并最终由验证者判断。对于正常的例子,硬币已成功证明并提前完成,而对于更难判断或恶意样本的样本,硬币将证明更多的周期以防止错过判断。算法1:硬币适应性的多轮验证。硬币概述的单轮验证主要包括两个主要模块:1。令牌体积的验证:如图所示5-(a),该模块明智地使用了充满Craper的加密技术的技术。 COLS需要使用所有隐藏令牌的“指纹”(即嵌入向量,嵌入)作为叶子节点,开发一棵哈希树,并向审核员(可能是用户或独立的第三方平台)提供最终哈希根(Merkle root)。在此期间,审计师只需要请求并验证很少有随机绘制的“指纹”及其到达哈希树(Merkle Proof)的路径即可证明令牌的总数与表达式一致,而无需访问所有令牌的原始内容。该方法的主要优点是,这将确保随着某些步骤泄漏的准确性。更重要的是,达希尔(DahilY设计。回应用户疑问会大大增加了伪造的伪造成本。 2。语义语义的语义验证:仅仅验证的准确性不足以完全消除用户的疑问,因为从理论上讲,COLS仍然可以产生大量与任务目的相关的“无效”令牌,以显示隐藏的代币。如图5-(b)所示,硬币设计了一种轻巧的“头匹配”,以研究隐藏令牌检查和最终答案之间的语义连贯性和逻辑相关性,并提供了一个关系标记。如果商标明显低,则可能表明这些隐藏的令牌对最终结果的贡献有限。该机制旨在确保用户支付的费用,并与有效的推理过程相对应,该过程真正实现了任务的目的。图5:硬币验证大纲。团队确定了各种自适应攻击可以实施并基于COLS,在许多不同领域中开发困难的数据集,例如医疗保健,代码,数学,一般推理等,用于在煤炭框架中训练头和验证者,并证明了营房的性能。实验结果表明,硬币框架具有共同的特征:代币数量扩展的大量识别:图6显示了各种模拟场景中硬币检测的成功率(发现成功率,DSR)。显然,随着膨胀率的提高(通货膨胀率=伪造的令牌数量 /实际令牌数),硬币识别能力也得到了相应的增强。在具有较高膨胀率的情况下(即,Cols伪造的代币占50%以上),即使在“自适应令牌扩展”方案的情况下,特殊设计和语义上与原始内容的平均DSR也可以达到94.7%的平均DSR,而少量数量也可以达到94.7%。信息已暴露。在COLS错误报告10%令牌的情况下,硬币的平均DSR约为40%。可定制的:图6中的红色和蓝线代表两个验证者的URI,一个基于神经网络,而其他基于策略。前者的恶意例子具有很高的DSR,但正常样本的错误速率也相对较高。 Cols和用户可以讨论后者以设置参数,以在减少正常样本的错误作者和扩大良好发现的数量之间达到平衡。高于审计的极低:用户和服务提供商的整个审计过程较低。在验证过程中,审核员只需访问少于4%的隐藏令牌信息(指纹)即可完成高精度验证。如图7所示,建筑的单核CPU结构的树仅持续约一秒钟,而额外的开销几乎不被忽略拥有强大的计算资源。图片6:在不同的扩张率(通货膨胀率)下处理大量扩展攻击的硬币性能。图7:在不同数量的隐藏代币和隐藏模型下,默克尔哈希树建造的成本。通常,马里兰大学的实验室案例团队系统地研究了目前在透明度“隐藏操作”方面面临的挑战,并建议对审计大纲进行首次审计,以解决令牌数量通货膨胀问题。硬币的主要贡献是探索平衡智力保护的知识知识服务与服务透明度的理性需求之间的技术途径,这希望为在用户和服务提供商之间发展信心提供强大的技术支持。直到今天,主流模型还没有揭示其理解过程NG,尽管本节仍然要求用户付款。但是,已经有一些变化标志着主要LLM API提供商试图在知识产权和用户权利之间达到平衡。例如,几乎所有服务提供商都提供返回摘要的服务; Claude 4.0可以提供飞机倾斜令牌,以使用户能够评估真实性并确保不再理解过程。案例实验室团队呼吁学术界和工业界在这个新兴领域中进行Mag -Ovocus,并共同促进建立更清晰,平等和令人难以置信的AI服务标准和技能。未来的研究方向可能包括制定更完整且容易被部署的审计协议或框架,探索使用审计机制(例如行业标准或第三方认证标准)的可行性,并确定相关技术和最佳技能的发展。最终目标是促进健康Y和整个大型生态系统模型的可持续发展,因此,削减人工智能技术可以更好地为基于赢得长期公共信任的社会服务。
购买咨询电话
400-123-4567