Anthropicが生物情報学ベンチマークBioMysteryBenchを公開。GitHub Copilotのトークンベース課金移行が発表され開発者コミュニティで注目。コーディングエージェントの運用効率化ツールも活発。
公式アップデート
Anthropic: BioMysteryBench 公開
Anthropicが生物情報学分野のベンチマーク「BioMysteryBench」を公開。Claudeが人間の専門家と同等以上の性能を達成したと報告。
OpenAI: OpenAI on AWS
OpenAIモデルがAWS上で利用可能に。前回から継続。
OpenAI: Sora 2
動画生成AI「Sora 2」を公開。前回から継続。
OpenAI: GPT-5で科学研究を加速
GPT-5の科学分野への応用事例を公開。前回から継続。
OpenAI: Agents SDK次世代版
Agents SDKの新バージョンを発表。エージェント開発の進化を目指す。
OpenAI: Soraフィード設計思想
Soraのフィードキュレーション方針を公開。前回から継続。
コミュニティの反応
OpenAI on AWS
ポジティブ
OpenAIモデルがAWS Bedrockで直接提供開始。Stateful Runtimeでエージェント実行強化され、AWSのAIプラットフォーム優位性が高まると評価。 — @FABYMETAL4 X
OpenAIのAzure独占終了でAWS経由の正式提供が可能に。クラウド選定が変わりAnthropicにもチャンスとの分析。 — @RamTuckey X
OpenAIのMS独占終了でAWS・Googleでも提供しやすくなり、Azure依存企業以外への販売拡大。クラウドモデル競争時代へ。 — @suenaga_log X
OpenAIのMS専属終了は販路拡大。AWSがAIショッピングモール化で売り場確保、分散成長でポジティブ。 — @PPodkayne X
ネガティブ
OpenAIのMS独占終了でAWSでもモデルホスト可能に。MSがアドバンテージを失いAnthropic優位との見方。 — @umiyuki_ai X
Sora 2
ポジティブ
Sora 2の性能に衝撃を受け、超えられるAIを期待。 — @towya_aillust X
ネガティブ
Sora 2サービス終了を惜しむ声。ウォーターマークがなければ良かったとの意見。 — @old_pgmrs_will X
GitHub Copilot トークンベース課金移行
Tips
GitHub Copilotが6月1日からプレミアムリクエスト制からトークンベース課金に変更。コスパ優位が揺らぐ可能性。 — 妹尾悠真 Zenn
コーディングエージェント運用
Tips
97%のPermission確認を自動化するCoding Agent用OSS「ccgate」が誕生。Claude CodeやCodexのPermission確認をLLMに代行させるCLI。 — TAK848 Zenn
Claude Codeのルーチン機能で定期的にパフォーマンスチューニングをさせている。ベンチマーク基盤があればAIに任せられるとの実践報告。 — yamadashy Zenn
Claude Code入門 Skills徹底解説。仕組みの解説からハンズオンまで。前回から継続。 — i-inose Qiita
AIエージェント設計・セキュリティ
Tips
AIエージェントを安全に動かすためのサンドボックス技術について調査。コード実行・ブラウザ操作・API呼び出しを安全に行う仕組みを解説。 — Sotamaki Zenn
AIに会社のGoogleアカウントを渡すリスク。Google MCP接続時の意図しない情報アクセスとサービスアカウントによるゲートウェイ設計を提案。前回から継続。 — techan Zenn
非エンジニアの「作りたい」と「安全に公開したい」を両立するSandbox MCPを作った。前回から継続。 — 辻 亮佑 Zenn
AI活用事例
Tips
大規模案件のSlackにAI社員3人を常駐させたら、2年目が参画1週間で設計根本に踏み込んだ。AI社員による知識共有の加速を報告。 — htakasu Zenn
ClaudeでAdobeツールを使える「Adobe for creativity connector」でできることまとめ。前回から継続。 — katoriko Qiita
ガバメントAI「源内」を閉域AWS環境へデプロイ。デジタル庁がOSS公開した生成AI利用環境の自治体向け実装。 — takeda_h Qiita
RAG・検索技術
Tips
ベクトルDBを使わないRAG。全てのナレッジを階層化する「Corpus2Skill」手法を紹介。前回から継続。 — Atsushi Kadowaki Zenn
Lakebase × LangGraph × Qwen3で作る、セッションを跨ぐ記憶を持つAIエージェント。PostgresSaverを使った短期メモリ付きエージェント構築。 — taka_yayoi Qiita
GitHub信頼性問題
Tips
GitHub神話の6日間。ガバナンス、稼働率、セキュリティ、コストが同時に揺らいだ一週間を振り返り。 — crowdy Qiita