首页
工具箱
开发工具集
代码美化
文件转换
社媒预览图生成
SEO 计算器
友链
关于
Kevin's Blog
累计撰写
638
篇文章
累计创建
2416
个标签
累计收到
0
条评论
栏目
首页
工具箱
开发工具集
代码美化
文件转换
社媒预览图生成
SEO 计算器
友链
关于
目 录
CONTENT
以下是
性能基准
相关的文章
2025-10-18
Claude Haiku 4.5:最快、最经济的编码模型
Claude Haiku 4.5 是 Anthropic 推出的高效编码模型,在保持与 Claude Sonnet 4 相当编码性能的同时,运行速度快两倍且成本仅为三分之一。支持多代理协作,在 SWE-bench 等基准测试中表现优异,适合实时编程辅助和企业级部署。
2025-10-18
2
0
0
大语言模型/LLMs
工程与开发
2025-10-15
nanochat:百元预算的最佳 ChatGPT 替代方案
nanochat 是一个全栈实现的大语言模型项目,支持在单个 8XH100 节点上完成分词、预训练、微调、评估及 Web 交互的全流程。通过精简代码和明确脚本,用户可用 100 美元预算构建类 ChatGPT 系统,适合教育、研究及轻量级部署场景。
2025-10-15
3
0
0
工程与开发
大语言模型/LLMs
2025-10-08
Claude Sonnet 4.5:世界最佳编程模型与AI代理基座
Claude Sonnet 4.5是Anthropic发布的最新前沿大语言模型,被誉为世界最佳编程模型。它在SWE-bench Verified评估中获得77.2%的成绩,支持30+小时复杂任务处理,在OSWorld计算机使用基准测试中以61.4%领先。同时提供Claude Agent SDK供开发者构建自定义AI代理。
2025-10-08
5
0
0
大语言模型/LLMs
AI 代理