天秤AI・天秤AI BizにClaude Opus 4.1を導入いたしました。Claude Opus 4.1は、前世代モデルからコーディング、分析、推論能力において大幅な性能向上を実現したモデルです。
主な改良点
コーディング性能の向上
- SWE-bench Verifiedで74.5%のスコアを達成
- 複数ファイルにわたるコードリファクタリング性能が大幅に向上
- 大規模コードベース内での正確な修正箇所の特定が可能
- 不要な調整やバグの導入を最小限に抑制
分析・リサーチ能力の強化
- 詳細な情報追跡能力の向上
- エージェント型検索機能の改善
- 深度のあるデータ分析スキルの強化
推論能力の向上
- エージェント型タスクでの性能向上
- 実世界での問題解決能力の強化
- 複雑な推論プロセスの改善
第三者による評価
GitHub: Claude Opus 4.1はほぼすべての機能においてOpus 4からの性能向上を確認。特に複数ファイルのコードリファクタリングで顕著な改善が見られる。
Rakuten Group: 大規模コードベース内での正確な修正を、不要な調整やバグの導入なしに実行する能力に優れており、日常的なデバッグタスクでチームに好まれている。
Windsurf: ジュニア開発者ベンチマークでOpus 4から1標準偏差の改善を実現。Sonnet 3.7からSonnet 4への性能向上と同程度の飛躍を示している。
利用可能サービス
天秤AI: 個人ユーザー向けサービスでClaude Opus 4.1の高度なAI機能をご利用いただけます。
天秤AI Biz: ビジネス向けサービスでClaude Opus 4.1の強化されたコーディング・分析機能をご活用いただけます。
ご利用について
Claude Opus 4.1は、既存のプランでそのままご利用いただけます。追加料金は発生いたしません。
特にコーディング、データ分析、複雑な問題解決タスクにおいて、Claude Opus 4.1の向上した性能をご実感いただけます。
詳細情報
Claude Opus 4.1の技術的詳細や性能評価については、Anthropic公式サイトをご覧ください:
https://www.anthropic.com/news/claude-opus-4-1
今後も継続的にモデルの改善を行い、より優れたAI体験を提供してまいります。ご質問やフィードバックがございましたら、お気軽にお聞かせください。