写代码靠模型还是靠Harness？Artificial Analysis Coding Agent Index深度拆解

Type: article
Author: unknown
Primary Topic: AI编程
Ingested: 2026-05-12

Summary

本文基于Artificial Analysis Coding Agent Index的三大基准测试数据，深度分析了编码Agent中模型与Harness各自的贡献权重。核心结论是模型决定基本盘（±10分），Harness决定天花板（±2-3分），但Harness的真正竞争力在于生态开放程度——能兼容多少家模型。文章以Claude Code为例，指出其支持5家模型的开放平台定位，相比Gemini CLI和Codex的封闭生态具有长期优势。

Key Concepts

Harness与模型的性能关系
编码Agent基准测试
生态开放程度
模型选择策略
SWE-Bench评测
多模型兼容架构
生态锁定风险

Entities

Artificial Analysis
Claude Code
Cursor CLI
Codex
Gemini CLI
Anthropic
OpenAI
Google
Kimi
DeepSeek
Ahmad Awais
OpenClaw
Opus 4.7
Sonnet 4.6
GPT-5.5
Kimi K2.6
DeepSeek V4
Gemini 3.1 Pro

Source

Raw: coding-agent-model-vs-harness-analysis.md

Relations

(none)

Auto-generated on 2026-05-12

相关文章（自动整合）

小米 MiMo Code：“记忆革命“架构反超 Claude Code — 同属相关主题（重叠度: 7，整合于 2026-06-15）
用 Codex + AI 全流程制作中国风文字冒险游戏 — 同属相关主题（重叠度: 3，整合于 2026-06-12）
别再写Prompt了，去写循环 — 同属相关主题（重叠度: 3，整合于 2026-06-10）
一文搞懂Loop工程、Harness工程、FDE——Agentic Engineering的三个层次 — 同属相关主题（重叠度: 3，整合于 2026-06-10）
让AI自我构建的RSI火了，Google泼冷水，DeepSeek们摸到了边 — 同属相关主题（重叠度: 4，整合于 2026-06-07）
2026年真正能让你coding效率起飞的10个Claude Code/Codex高星GitHub仓库 — 同属相关主题（重叠度: 3，整合于 2026-06-05）
Gemma 4 12B 发布：多模态 Agent 开始离开云端 — 同属相关主题（重叠度: 4，整合于 2026-06-05）
Headroom — AI Agent 上下文压缩层 — 同属相关主题（重叠度: 4，整合于 2026-06-05）
Codex Agent 用了两周，我把每月额度从“不够用“变成了“用不完“ — 同属相关主题（重叠度: 3，整合于 2026-06-04）
Claude Code + DeepSeek V4 Pro + Kimi K2.6 编程Agent三件套方案 — 同属相关主题（重叠度: 4，整合于 2026-06-03）
Kooky：AI 编程终端，解决多智能体窗口地狱 — 同属相关主题（重叠度: 5，整合于 2026-06-03）
ai-memory-core：200行Rust库给AI Agent装长期记忆 — 同属相关主题（重叠度: 3，整合于 2026-06-02）
CUA：17.3k Star 开源 Computer Use Agent，后台操控不抢鼠标 — 同属相关主题（重叠度: 5，整合于 2026-06-02）
5月31日开源速报：自进化模型M2.7震撼开源 — 同属相关主题（重叠度: 2，整合于 2026-06-01）
微软开源 SkillOpt：让 Agent Skill 自动优化进化 — 同属相关主题（重叠度: 3，整合于 2026-05-30）
MUSE-Autoskill：自进化智能体技能框架 — 同属相关主题（重叠度: 3，整合于 2026-05-30）
AI成功率从20%飙到100%！只需一个Harness文件 — 同属相关主题（重叠度: 4，整合于 2026-05-27）
用Claude Code+Godot单枪匹马做Steam游戏：AI不是魔法 — 同属相关主题（重叠度: 3，整合于 2026-05-24）
用Hermes直接指挥本地CodeX写代码，Profiles搭建多Agent实践 — 同属相关主题（重叠度: 4，整合于 2026-05-24）
龙虾已死，Codex新生：Appshots让Codex变成真正的个人Agent — 同属相关主题（重叠度: 3，整合于 2026-05-24）
Serena：给AI Coding Agent装一个真正的IDE（24.4K Star MCP工具包） — 同属相关主题（重叠度: 3，整合于 2026-05-24）
Augment Auggie 73% 成本暴降：语义索引 + Prism 路由完胜 Claude Code + Opus 4.7 — 同属相关主题（重叠度: 3，整合于 2026-05-20）
Anthropic “Code w/ Claude“ 开发者大会全程实录（2026-05-13） — Claude Code凭开放生态在编码Agent中脱颖而出（重叠度: 3，整合于 2026-05-14）