你的位置:开云「中国」Kaiyun·官方网站-登录入口 > 新闻资讯 > 开云「中国」Kaiyun·官方网站-登录入口以便把窜改应用到源文献中-开云「中国」Kaiyun·官方网站-登录入口
开云「中国」Kaiyun·官方网站-登录入口以便把窜改应用到源文献中-开云「中国」Kaiyun·官方网站-登录入口
发布日期:2025-03-02 05:41    点击次数:196

开云「中国」Kaiyun·官方网站-登录入口以便把窜改应用到源文献中-开云「中国」Kaiyun·官方网站-登录入口

让DeepSeek代替Claude想考,缝合怪玩法火了。

原因无它:比单独使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模子的遵守更好。

先来看一段VCR:

掀开新闻客户端 擢升3倍畅达度

再来看一个测评截止:

在代码剪辑基准Polyglot Benchmark上,缝合模子遵守小超o1-high和R1一头。

在这个测试中,R1上演架构师,描写如何管束代码问题。

而Claude上演模范员,按条目生成特定的代码剪辑辅导,以便把窜改应用到源文献中。

除此以外,本质经过中还得出还有几个有敬爱敬爱的论断:

o1与Claude Sonnet搭配遵守并不如单独使用o1。

使用R1或o1当架构师,Claude以外的其他模子当模范员,遵守齐不如单独使用R1或o1。

但o1-preview和o1-mini当架构师,使用许多不同的模子当模范员齐能提高组合的获利。

使用R1的推理经过token遵守不如使用R1的最终输出token。

这么看来,R1和Claude Sonnet还竟然一双绝配啊~

DeepClaude应用自身100%免费且开源,在GitHub上已揽获3k星星(固然API要用我方的)。

网友测试后转头到:Claude擅长撰写明晰、结构细致的文本和代码,因此它能将DeepSeek-R1的方针调度为精粹的回复。

DeepClaude作家之一双此有感而发:

AI智能体和智能体应用正在展示出一种“数字寰球优先”的范式调度,智能系统正在成为主动的调解者,而不单是是被迫的用具。

DeepSeek和Claude的混血儿

具体来说,DeepClaude是一个LLM推理API,通过Rust编写。

它提供了一个长入的接口,将DeepSeek R1的CoT逻辑推明智商和Claude的回复在单一流中无缝衔尾。

设置者不错通过这个API同期调用两种模子的功能,还能透顶掌控我方的API密钥和数据。

打造它的团队名为Asterisk,团队成员具有安全询查&CTF(Capture The Flag)配景,致力于于于诓骗AI让查验代码安全这事儿变得愈加高效。

团队以为,DeepSeek R1的CoT深度推理以致达到了LLM具有反省瓦解(metacognition)的进程,它大致自我雠校、想考不常见/顶点/终点的情况,并在当然讲话中进行相同蒙特卡洛树搜索(MCTS)的推理。

不外R1在代码生成、创造力和对话时刻方面有所欠缺,Claude 3.5 Sonnet在这些方面发达出色,刚好不错作补充。

何不将两者筹谋起来?取两者之长,打造出DeepClaude~

对话中,Claude申报之前,系统会清晰“”这么的预填充文本。

DeepClaude筹谋了这两种模子,具有以下特点:

托管API透顶免费,允许用户使用我方的密钥,并将DeepSeek和Claude的流式API整合在一齐,提供计较组合使用量和价钱等便利功能。

代码是开源的,用户不错解放托管、修改和再行分发。团队示意它也曾在Asterisk的分娩环境中大范围使用,每天处理数百万token,于今尚未出现故障,只好不浪掷就行。

One More Thing

你以为两个模子缝合即是极限了吗?

No no no

还有网友设置出了三缝合玩法,将DeepSeek-R1和Gemini 2.0 Flash的想考截止组合起来,在让Claude Sonnet去回答问题。

在GPQA测试(谷歌搜不到的理化生博士级选择题)中也赢得了好获利。

参考通顺:

[1]https://aider.chat/2025/01/24/r1-sonnet.html

[2]https://x.com/deepclaude_/status/1886911416478642279

[3]https://x.com/omercelik/status/1883510797193937278

[4]https://x.com/mufeedvh/status/1883620781583901011

— 完 —

宽待在辩驳区留住你的方针!开云「中国」Kaiyun·官方网站-登录入口



相关资讯