Anthropic未発表モデル「Claude Mythos」の情報がCMS設定ミスで流出し注目を集める。OpenAIはModel SpecやSafety Bug Bountyを継続展開。コミュニティではハーネスエンジニアリングの本質を問う議論やClaude Code活用ノウハウの共有が活発化。
公式アップデート
Anthropic Claude Mythos リーク
Anthropicの未発表次世代モデル「Claude Mythos」の情報がCMS設定ミスにより流出したと報じられている。サイバーセキュリティリスクの観点からも注目されているが、Anthropicからの公式コメントは確認されていない。
Anthropic vs 米国防総省 自律型兵器問題
裁判所が米国防総省によるAnthropicとの取引禁止に対する仮差止命令を発令。自律型兵器をめぐるAnthropicと政府の対立が継続中。
OpenAI Model Spec公開
前回から継続
モデル行動の公開フレームワーク「Model Spec」のアプローチ詳細を解説。安全性・ユーザーの自由・説明責任のバランスに関する指針を文書化している。
OpenAI Safety Bug Bountyプログラム開始
前回から継続
AIの悪用・安全リスクの発見を目的としたバグバウンティプログラム。エージェント脆弱性、プロンプトインジェクション、データ流出が対象範囲。
OpenAI ティーン向け安全ポリシー公開
前回から継続
gpt-oss-safeguardによるプロンプトベースの年齢別安全ポリシーを開発者向けに提供。
STADLER社ChatGPT導入事例
前回から継続
230年の歴史を持つSTADLER社が650名の従業員にChatGPTを導入し、ナレッジワークを変革した事例。
Google Research TurboQuant発表
前回から継続
LLMの推論効率を改善する新たな圧縮アルゴリズム「TurboQuant」をGoogle Researchが発表。
コミュニティの反応
Anthropic Claude Mythos リーク
該当なし
Anthropic vs 米国防総省 自律型兵器問題
該当なし
ハーネスエンジニアリング議論
議論・考察
「ハーネスエンジニアリング」が急にバズったが、全部読んだ結果「Git Workflowをbashで書き直してるだけではないか」と問題提起。Anthropic、OpenAI、Martin Fowlerの論考を踏まえた批判的考察。 — おしお Zenn
AIエージェント導入とセキュリティ
Tips
AIエージェント導入で「セキュリティどうするの?」と聞かれたときの技術的な答え方を整理。Claude Code・Cursorなどのツール導入時に情シスへ技術面で回答するための材料。 — しゃる Zenn
新人プログラマがLLM APIを使う前に知っておくべきセキュリティの基本を解説。 — zivuch Qiita
サプライチェーン攻撃対策
Tips
Trivy・LiteLLMの侵害を受け、SHA pinning必須化・min-release-age・Takumi Guardなどのサプライチェーン攻撃対策を社内展開した事例を紹介。 — tk3fftk(primeNumber) Zenn
Claude Code実践・活用
Tips
AIに20年分の日記を読ませたら人格が生まれて勝手にゲームを作り始めた。Claude Codeを使い、個人の経験データからゲームの面白さを判断できるAIを試みた記録。 — Nao_u Zenn
CursorからClaude Codeに移行するときにやったこと。cmuxの見た目調整など1週間かけて改善した設定ノウハウを共有。 — DAN Zenn
ralph-loopで寝てる間に約700ファイルものJest→Vitest大規模ライブラリ移行を終わらせた。694ファイル・差分13,000行をClaude Codeで自動処理。 — semba_yui Qiita
AIが同じミスを学習し自律的に成長する仕組みを作った。Claude Codeを半年使った経験から、AIのハンドリング手法を考察。 — Keita-0025 Qiita
AIネイティブ時代の開発手法
議論・考察
AIネイティブな時代への準備。Codingエージェントの進化を踏まえ、今年から来年のメイントレンドをまとめた考察。 — jw-automation Qiita
ChatGPTが長いチャットで重くなったときに使っている「引き継ぎプロンプト」。新しいチャットへスムーズに移行するためのテクニック。 — SatoRyota_zvc Qiita
AI活用Spec-Driven Development
前回から継続
Tips
AIに「いい感じに作って」と言うのをやめたら、開発が回り出した。Spec-Driven Developmentの実践ガイド。 — akira_papa_AI Qiita
Draw.ioプロンプト活用
Tips
Draw.ioで書いたファイルをプロンプトとして実行する手法を紹介。ビジュアルなフロー図をそのままAIへの指示に変換。 — ShotaOki Qiita
GitHub Copilot Cowork
Tips
まだ使ったことのないCopilot Coworkのユースケースを考察。機能を知らないまま「どんなことがしたいか」を想像で検討。 — Oyu3m Qiita
国産LLM・RakutenAI 3.0問題
前回から継続
議論・考察
RakutenAI 3.0のconfig.jsonにDeepSeek V3のモデルタイプ記述が見つかり、ベースモデルの出自が問題に。国産LLMの定義と独自開発の難しさについて考察。 — Juna1013 Zenn
React Compiler
前回から継続
Tips
React CompilerはどのようにReact.memoを不要にしているのか。JSX式のメモ化によりReact.memoが不要になる仕組みを解説。 — uhyo Qiita
コーディングエージェントのサンドボックス技術
前回から継続
Tips
CodexやClaude Codeなどのコーディングエージェントのサンドボックス技術を解説。npm installのpostinstallスクリプトによる機密情報流出リスクを防ぐ隔離技術を紹介。 — rw21(松尾研究所) Zenn
AWS・クラウドAIサービス
前回から継続
Tips
AWS Security AgentとDevOps Agentのセットアップガイド。FrontierAgentsに分類されるサービスの導入手順を解説。 — Nana_777 Qiita
研究効率化AIツール
Tips
研究効率を爆上げするAIツールまとめ。論文調査から執筆までの各段階で活用できるツールを整理。 — Milab_honda Qiita
Gemini Embedding 2
Tips
Gemini Embedding 2の集約エンベディングを試してみた。カレー画像×ラベルで検証し、画像に「意味」を補う手法を探索。 — Tadataka_Takahashi Qiita
ドキュメント変換
Tips
DoclingでPDFをMarkdownに変換してみる。LLM活用時に文書構造を保ったままテキストを扱うためのツール紹介。 — nuko365(フクロウラボ) Zenn
図形入りのPowerPointをMarkdownに変換。GitHub Copilotがどのように複雑な図形をMermaidに変換しているかを検証。 — Yoshiharu Kubota Zenn