GitHub急成長リポ

Hermes Agentが自己改善型エージェントとしてトレンド入り。VoxCPM2が30言語対応TTS をオープンソース公開。Multica・Archon・claude-memなどエージェント運用基盤が複数ランクインし、AIコーディングエージェントのエコシステム成熟が加速している。

注目度

公式アップデート

NousResearch/hermes-agent

Nous Researchが公開した自己改善型AIエージェント「Hermes Agent」がGitHub Trending全言語・Python両部門にランクイン。最大の特徴は閉じた学習ループ:経験からスキルを自動生成し、使用中に自己改善、定期的にナッジで知識を永続化する。FTS5セッション検索とLLM要約によるクロスセッション想起、Honcho dialecticユーザーモデリングを搭載。Telegram、Discord、Slack、WhatsApp、Signal、CLIからの統一アクセスに対応し、ゲートウェイ1プロセスで全プラットフォームを処理。ターミナルバックエンドはLocal、Docker、SSH、Daytona、Singularity、Modalの6種。DaytonaとModalではサーバーレス永続化によりアイドル時のコストがほぼゼロ。Nous Portal、OpenRouter(200+モデル)、z.ai/GLM、Kimi/Moonshot、MiniMax、OpenAI等に対応し、hermes modelでモデル切り替え可能。agentskills.ioオープン標準互換。MITライセンス。

ソース

microsoft/markitdown

前回から継続。各種ファイル(PDF、PowerPoint、Word、Excel、画像、音声、HTML、CSV、JSON、XML、ZIP、YouTube、EPub等)をMarkdownに変換するPythonユーティリティ。MCP(Model Context Protocol)サーバーによるClaude Desktop連携、markitdown-ocrプラグインによるLLM Vision OCR(PDF/DOCX/PPTX/XLSX内の画像からテキスト抽出)が追加機能として利用可能。プラグインシステム、Azure Document Intelligence連携、Docker対応。AutoGenチームによる開発。

ソース

coleam00/Archon

前回から継続。AIコーディングエージェント向けのワークフローエンジン。YAMLで開発プロセス(計画→実装→検証→レビュー→PR作成)を定義し、決定論的に再現可能な形で実行。各ワークフロー実行は独立したgit worktreeで分離され、5件の修正を並列実行可能。17種のデフォルトワークフロー(archon-fix-github-issue、archon-idea-to-pr等)を搭載。Web UI、CLI、Telegram、Slack、Discord、GitHubから統一的に操作可能。Claude CodeとCodexに対応。MITライセンス。

ソース

OpenBMB/VoxCPM2

OpenBMBがVoxCPM2をリリース。2Bパラメータ、200万時間超の多言語音声データで訓練されたトークナイザーフリーText-to-Speechシステム。端対端のDiffusion Autoregressiveアーキテクチャにより、離散トークン化をバイパスして連続的な音声表現を直接生成。30言語対応(中国語方言9種含む)、自然言語記述からの音声デザイン(参照音声不要)、制御可能な音声クローニング(短い参照クリップ+スタイル指示)、Ultimate Cloning(参照音声+トランスクリプトによる忠実再現)を搭載。AudioVAE V2の非対称エンコード/デコード設計により16kHz入力から48kHzスタジオ品質出力を直接生成。RTFはRTX 4090で約0.3、Nano-VLLMアクセラレーションで約0.13。MiniCPM-4バックボーン。Apache-2.0ライセンスで商用利用可。

ソース

multica-ai/multica

コーディングエージェントをチームメイトとして管理するオープンソースプラットフォーム。エージェントにイシューを割り当てると、自律的にコード作成、ブロッカー報告、ステータス更新を実行。Claude Code、Codex、OpenClaw、OpenCodeに対応。スキルシステムにより解決策が再利用可能なスキルとして蓄積。ローカルデーモンとクラウドランタイムの統合管理、マルチワークスペース対応。Go(Chiルーター)+ Next.js 16 + PostgreSQL 17(pgvector)のアーキテクチャ。セルフホスト可能。

ソース

thedotmack/claude-mem

Claude Code向けの永続メモリ圧縮システム。セッション中のツール使用を自動キャプチャし、AI(Claude Agent SDK使用)で圧縮、次回セッションにコンテキストとして自動注入。セマンティック検索、プログレッシブディスクロージャー(レイヤード記憶取得+トークンコスト可視化)、Webビューア(localhost:37777)、<private>タグによるプライバシー制御を搭載。npx claude-mem installで一発インストール。Gemini CLI、OpenClawにも対応。AGPLv3ライセンス。

ソース

コミュニティの反応

NousResearch/hermes-agent

ポジティブ

Hermes Agentはスキル自動生成と自己改善が可能で、OpenClawよりアーキテクチャが優れている — @bridgemindai 出典

discofork.aiにHermes Agentが自律的に15以上の機能(フォークスコアリング、ブックマーク、モバイル対応など)をPRで実装・デプロイ — @vultuk 出典

モデル選択でNous Portalを使えばAPIキー不要、オープンソースで多様なインフラ対応 — @Teknium 出典

ネガティブ

メール送信タスクがループで進まず、エラー原因特定が難しい。スキル改善コマンドを求める声 — @Kenkowang 出典

Tips

NVIDIA DGX Spark上でHermes Agentを20分でセットアップし、コールドアウトリーチメール自動送信に活用 — @bridgemindai 出典

microsoft/markitdown

ポジティブ

MarkItDownでファイルをMarkdown統一後Claude Codeに渡し、ドキュメント分析前処理を自動化 — @9aKYDTkbwn63955 出典

MCPサーバー(Claude Desktop対応)とOCRプラグイン(画像文字抽出)を紹介 — @xiaohu 出典

ネガティブ

markitdownはMythos PDF(245ページ)を構造化せず平坦なテキストに変換、他のツールより劣る — @jdrhyne 出典

Tips

Claude Codeにmarkitdown CLIをhook追加し、PDFをトークン節約で変換する手法 — @mdowney 出典

coleam00/Archon

ポジティブ

ArchonがGitHub Trending #1に。AIワークフロー vs Cognitive OSの哲学的分岐を指摘し称賛 — @Mixeryatko121 出典

Archon(star 14k超)をAIコーディングハーネスビルダーとして紹介。CI/CDパイプライン統合向け — @tokikane_biz 出典

エージェントワークフローを再利用可能なオープンソースコンポーネントとしてレビュー — @simmon_charlie 出典

OpenBMB/VoxCPM

ポジティブ

VoxCPM2はElevenLabs($1320/月)を無料で凌駕。2Bパラメータ、声クローニング・デザイン、8GB VRAMでローカル実行可能。GitHubトレンド1位 — @aakashgupta 出典

Diffusion-Autoregressiveでトークンベース超え。概念から声生成、48kHz高品質、PyTorch対応・LoRAファインチューニング可能 — @DataChaz 出典

ゼロショット声デザインが魅力的。短いクリップでクローニング、動画制作クオリティ向上 — @hos_giken 出典

ネガティブ

ElevenLabsのコア商品を商品化する形。モデルは優れるが製品化(ツール・契約)での差別化が必要 — @beknabdik 出典

multica-ai/multica

ポジティブ

Claude Managed Agentsのオープンソースクローンとして、Claude Code/Codex/OpenClaw対応、自ホスト可能で4000+スター急上昇 — @DataChaz 出典

今週のトップ5 GitHubリポジトリの一つとして紹介 — @RoundtableSpace 出典

Tips

コーディングエージェントをチームメンバーのように運用。issue割り当てで進捗/ブロック管理、Claude Code/Codex/OpenClaw統一運用でhandoff軽減 — @LancelotRT_AI 出典

デスクトップアプリとしてCLI不要、Claude Code/OpenCode/Codexをローカルでマルチエージェント運用 — @hasantoxr 出典

thedotmack/claude-mem

ポジティブ

Claude-MemプラグインがセッションをAI圧縮し、次回にコンテキスト注入。コードベース再説明不要で超便利 — @Andriy_shkinder 出典

claude-memがGitHub Trending 2位(49.7Kスター)。セッション自動キャプチャ&コンテキスト注入でClaude Code必須ツール — @yumeno_naka_2 出典

Tips

ファッションビデオパイプラインでclaude-mem使用。95%トークン削減を実感、失敗プロンプトを繰り返さない本当の価値がある — @Surajdotdot7 出典

自動キャプチャ&圧縮で95%トークン減、Webビューアで記憶確認可能。一コマンドインストールで透明性が高い — @PuntoyComaTech 出典

ソース