OpenAIがGPT-5.5をリリースし次世代モデル競争が加速。AnthropicのProject Glasswingは1万件超の重大脆弱性を発見し具体的成果が続々。Codex Anywhereによるマルチプラットフォーム展開も進行中。
公式アップデート
GPT-5.5
OpenAIが次世代モデルGPT-5.5をリリース。性能向上が図られているが、詳細な技術仕様は限定的。日本政府向けにサイバー防御特化版「GPT-5.5-Cyber」の提供方針も報じられている。
Project Glasswing(前回から継続)
Anthropicが推進するAIサイバーセキュリティ実証イニシアチブ。Claude Mythos Previewを活用した防御AIエージェントによる脆弱性検出パイロットが本格的な成果を報告。OSSスキャン23,000件中、高重大度6,000件以上を検出し、真陽性率90.6%を達成。Cloudflare(2,000件)、Firefox(271件)、wolfSSLなど具体的なパートナーでの成果が公開された。前回のcURL創設者による限定的評価から一転し、大規模な成果報告が相次いでいる。
Codex Anywhere
OpenAI Codexの新たな配布形態として、デスクトップ・Web横断でのマルチプラットフォーム展開が進行中。
Claude Code v2.1.143
Anthropicがプラグイン依存関係強制、コンテキストコスト予測表示、worktree.bgIsolation設定、claude agents新フラグ追加などのアップデートを実施。
GPT-5による科学研究加速
OpenAIがGPT-5の科学研究応用事例を公開。研究プロセスの効率化における具体的な活用シナリオを提示。
ChatGPT Study Mode(前回から継続)
学習支援モードの安定運用・撤退議論が継続中。前回報告されたメニューからの突然の消失問題の後、提供状況についての議論が続いている。
Codex CLI v0.131.0-alpha.22
開発者向けCLIのアルファ版アップデート。
コミュニティの反応
Project Glasswing
ポジティブ
AnthropicのProject Glasswing(Claude Mythos Preview)で1ヶ月で1万件超の重大脆弱性発見、Cloudflare/Firefox/wolfSSLなどで具体的な成果多数。パッチ追いつかずメンテナーから「スローダウン要請」も。 — @joho_no_todai
Project Glasswing初期報告まとめ。ClaudeでOSSスキャン23k件中高重大度6k件以上、真陽性率90.6%。銀行不正送金阻止事例など。 — @oikon48
Project Glasswingの衝撃成果(Cloudflare 2k件/Firefox 271件など)。AIがサイバーセキュリティを主導する時代到来、人間がボトルネックに。 — @minervacosmetic
Tips
Project Glasswing初期報告の詳細要約。成果・課題・提言(パッチサイクル短縮/MFA徹底など)を整理。Claude Securityツール紹介も。 — @itnavi2022
CloudflareのProject Glasswing参加レポート。Mythosを「前世代とは別のツール」と評価しつつ、ハーネス運用や誤検知課題も指摘。 — @nakajimeeee
GPT-5.5
ポジティブ
OpenAIが日本政府にサイバー防御特化の「GPT-5.5-Cyber」を提供する方針。 — @mameyama_kun
5.5になって特定の遊び方がすごく良くなった。 — @k_s__s_k
ネガティブ
GPT-5.5でも検索で情報が見つからず誤情報が出るので油断できない。 — @NanakatoAi
GPT 5.5めっちゃ重いので今日は開発やめてゲームする。 — @yamakazoo
Codex Anywhere
該当なし
GPT-5による科学研究加速
該当なし
ChatGPT Study Mode
該当なし(前回レポートで撤退議論の投稿あり)
Codex CLI
Tips
Codexアップデート後にWindowsでCodex mobileが使えなくなったが、Codex CLIを前のバージョンに戻したら接続できた。 — @fukutomoo
AI開発ツール・設計論(コミュニティ記事)
Tips
Karpathy CLAUDE.mdは本当に普遍解か?──Opus 4.7との構造的合致と、モデル依存性を考察。CLAUDE.mdは「コード」でありモデルは「ランタイム」と分析。 — みーた Zenn
日々の開発で使っているClaude Code Skills。brainstorming、subagent-driven-development等の実践的な活用法を紹介。 — inari111 Zenn
1時間で開発を完了する。Claude Code の Skill で社内プロジェクトを仕組み化した話。気合ではなく仕組みで開発を前に進める取り組み。 — Misaki Ito Zenn
Microsoft 公式の WinUI agent plugin でWinUI 3アプリ開発がぐっと楽に。GitHub Copilot CLI / Claude Code / OpenAI Codex向けの公式プラグイン。 — Kazuki Ota Zenn
既存サービスにMCPサーバーを組み込む際の設計ポイント。保険ビジネスプラットフォームへのMCP統合の実装事例。 — あつし Zenn
日本語PDFで「Keyword search is all you need」を試す。Agent RAGとVector RAGの精度・コスト比較をclaude-sonnet-4-6で検証。 — レトリバ青木 Zenn
Vector DBを外したら、RAGではなくAgent Runtimeが残った。検索基盤ではなく判断境界が見えるAgentを志向。 — mofuteq Zenn
Googleの新しいTUI Antigravity CLIを試してみた。セットアップの流れやGemini CLIとのコード生成比較。 — ほき Zenn
GoogleのModern Web Guidanceスキル登場。AIが古いCSS・JSを書く問題をGoogle公式ガイドラインで解決。 — 鹿野 壮 Zenn
Claude Codeを本気で使う:Skills、Hooks、サンドボックス、サブエージェント。ChatGPTに慣れた人向けの実践ガイド。 — spfpt Qiita
ドキュメントが失われたAWS環境を1日で再現+再構築手順書まで生成。Claude Opus 4.7「infra delegate to」の威力。 — ntaka329 Qiita
受け入れ駆動開発を試している:AIエージェント時代のDev/Review/QAの進め方。壊れにくい開発フロー設計。 — autotaker1984 Qiita
あれほど頼れるAIが、しょっぱいテストケースを作ってくる理由を考えた。QAタスクにおけるLLMの課題を分析。 — yurizono Qiita
インフラエンジニアのkiro活用。既存AWS環境をSpec機能でドキュメント化。 — REALKTMR Qiita