LLM/NLP最新論文 - 2026-05-11

Beyond Semantic Similarityがエージェント検索向けにコーパス直接対話という新パラダイムを提案し78 upvotes。Skill1とSkillOSがスキル獲得・再利用の統合的強化学習を推進。Continuous Latent Diffusion Language Modelが自己回帰に依存しないテキスト生成の新たな可能性を示した。

注目度

注目論文

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

著者: Zhuofeng Li, Haoxiang Zhang, Cong Wei et al.

現代の検索システムは語彙的・意味的を問わず、コーパスへのアクセスを単一のtop-k検索ステップに圧縮する固定的な類似度インターフェースを介して提供している。この抽象化はエージェント検索においてボトルネックとなる。本研究はコーパスとの直接対話による新しい検索パラダイムを提案した（78 upvotes）。

新規性: 従来のtop-k検索が「検索してから推論」という固定パイプラインに縛られていた問題を根本的に再定義し、エージェントがコーパスと直接対話しながら情報を探索できるフレームワークを構築した点が画期的である。正確な語彙制約や疎な手がかりの追跡など、既存の類似度検索では対処困難な課題に応える。

手法: エージェントがコーパスに対して反復的にクエリを発行し、中間結果に基づいて検索戦略を動的に修正する対話型検索を実現する。単一ステップのtop-k検索ではなく、複数ステップの探索的アクセスにより、複雑な情報要求に対応する。

Hugging Face Daily Papers

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

著者: Yaorui Shi, Yuxin Chen, Zhengxi Lu et al.

永続的なスキルライブラリにより言語モデルエージェントはタスク間で成功戦略を再利用できる。このライブラリの維持には、スキル選択・実行時活用・経験からの蒸留という3つの結合した能力が必要である。本研究はこれらを統合的に強化学習で最適化するフレームワークを提案した（64 upvotes）。

新規性: 既存手法がスキルの選択・活用・蒸留を個別に最適化していたのに対し、3つの能力を単一の強化学習フレームワークで統合的に進化させる点が独自である。スキルライブラリの構築と利用を一貫した学習目標の下で最適化する。

手法: エージェントのスキル選択・活用・蒸留の各フェーズを統合的な報酬信号で最適化する。タスク実行の成功に基づく報酬が3つの能力すべてに勾配を伝播し、スキルライブラリの質とエージェントの活用能力が共進化する仕組みを実現している。

Hugging Face Daily Papers

Continuous Latent Diffusion Language Model

著者: Hongcan Guo, Qinyu Zhao, Yian Zhao et al.

大規模言語モデルは自己回帰パラダイムの下で顕著な成功を収めてきたが、高品質なテキスト生成は固定的な左から右への順序に縛られる必要はない。本研究は連続潜在拡散によるテキスト生成モデルを提案し、生成効率・スケーラブルな表現学習・効果的な生成を同時に実現した（61 upvotes）。

新規性: 自己回帰に依存しない連続潜在空間での拡散プロセスによりテキスト生成を行う点が根本的に新しい。離散トークンの逐次生成という制約から解放されることで、並列生成と柔軟な生成順序を可能にしている。

手法: テキストを連続潜在空間にエンコードし、その潜在表現上で拡散プロセスを適用する。デノイジングにより潜在表現を生成し、デコーダでテキストに変換する。スケーラブルな表現学習と生成効率を両立する設計により、自己回帰モデルに対する実用的な代替を実現している。

Hugging Face Daily Papers

著者: Junbo Cui, Bokai Xu, Chongyi Wang et al.

マルチモーダル大規模言語モデルの能力は静的なオフラインデータ処理からリアルタイムストリーミング対話へと進化してきたが、人間レベルのマルチモーダル対話には依然として遠い。本研究はリアルタイム全二重（双方向同時通信）オムニモーダル対話を実現する軽量MLLMの最新版を提案した（60 upvotes）。

新規性: モダリティ網羅性やレイテンシ単体ではなく、全二重対話（話しながら聞く）というインタラクション品質に焦点を当て、軽量モデルで実現した点が重要である。ボトルネックが「モダリティ対応」から「対話の自然さ」に移行している現状を反映している。

手法: 音声・視覚・テキストを統合的に処理しつつ、入力の受信と出力の生成を同時に行う全二重アーキテクチャを採用する。リアルタイム性を確保するための効率的な推論機構と、割り込み・応答タイミングの制御を実装している。

Hugging Face Daily Papers

MiA-Signature: Approximating Global Activation for Long-Context Understanding

著者: Yuqing Li, Jiangnan Li, Mo Yu et al.

認知科学において報告可能な意識的アクセスは分散記憶システム上のグローバル点火と関連しているとされる一方、個人はすべての活性化内容に直接アクセスできないという緊張関係がある。本研究はこの知見に着想を得て、長文脈理解のためのグローバル活性化近似手法を提案した（49 upvotes）。

新規性: 認知科学のグローバルワークスペース理論をLLMの長文脈処理に応用するという学際的アプローチが独自である。分散された情報の統合という認知的メカニズムをアーキテクチャレベルで実装し、長文脈理解の本質的な改善を図っている。

手法: 長い入力コンテキストに対してグローバルな活性化パターンを近似的に計算し、分散された関連情報を統合的に参照可能にする。全トークンへの完全なアテンションではなく、認知科学的に動機づけられた選択的統合により、計算効率と理解品質を両立する。

Hugging Face Daily Papers

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

著者: Ivan Bondarenko, Roman Derunets, Oleg Sedukhin et al.

SemEval-2026 Task 8（MTRAGEval）のTask B（参照パッセージを用いた生成）における優勝システムを提示した。7つのLLMと2つのプロンプティングバリアントからなる異種アンサンブルに対し、GPT-4o-miniジャッジがインスタンスごとに最良候補を選択する手法で、26チーム中1位を達成した（39 upvotes）。

新規性: 単一モデルの性能向上ではなく、異種モデルアンサンブルとLLMジャッジの組み合わせによる実用的な品質最大化戦略が独自である。各モデルの得意領域を活かしつつ、軽量なジャッジモデルで最適候補を選択する効率的な設計を実現した。

手法: 7つの異なるLLMに対して2種類のプロンプティング戦略を適用し、インスタンスごとに14の候補応答を生成する。GPT-4o-miniをジャッジとして各候補の忠実性・品質を評価し、最良の応答を選択する。モデル多様性とジャッジの判断力の相乗効果により、安定した高品質生成を実現している。

Hugging Face Daily Papers

SkillOS: Learning Skill Curation for Self-Evolving Agents

著者: Siru Ouyang, Jun Yan, Yanfei Chen et al.

LLMベースのエージェントはストリーミングタスクの処理に活用されているが、多くは一回限りの問題解決者に留まり、過去の対話から学習できていない。本研究は経験から再利用可能なスキルを自動キュレーションし、自己進化するエージェント基盤を提案した（33 upvotes）。

新規性: スキルの「キュレーション」（獲得・整理・品質管理）自体を学習対象とした点が重要である。単にスキルを蓄積するのではなく、どのスキルを保持し、どのように組織化するかをメタ学習する仕組みにより、スキルライブラリの質を自動的に維持する。

手法: ストリーミングタスクの処理経験から再利用可能なスキルを抽出し、スキルの有用性・汎用性・重複度に基づいてライブラリを動的にキュレーションする。メタ学習によりキュレーション戦略自体を最適化し、タスク分布の変化に適応する自己進化的なエージェントを構築している。

Hugging Face Daily Papers

分野別の動向

エージェントのスキル獲得と自律性

本日最も注目すべきトレンドである。Skill1（64 upvotes）とSkillOS（33 upvotes）がエージェントのスキル蓄積・再利用を強化学習で統合的に最適化する方向で研究を進めており、前日のCreativityBenchやAuto Researchがエージェントの能力評価・応用に焦点を当てていたのに対し、本日はスキル獲得メカニズムの本質的な改善に回帰している。両研究がほぼ同時期に類似の問題設定に取り組んでいることは、エージェントの自己進化がコミュニティの中心課題になっていることを示している。

検索・情報アクセスの再設計

Beyond Semantic Similarity（78 upvotes）が本日最高のupvotesを獲得し、エージェント検索における従来のtop-k検索パラダイムの限界を明確に指摘した。RAGの「検索→生成」という固定パイプラインがエージェント時代には不十分であるという認識が広がりつつあり、コーパスとの対話的アクセスという新たな方向性が提示された。エージェント研究の成熟に伴い、基盤となる情報アクセス層の再設計が求められている。

非自己回帰テキスト生成

Continuous Latent Diffusion Language Model（61 upvotes）が自己回帰に依存しないテキスト生成の実用性を示した。前日のContinuous-Time Distribution Matching（画像拡散モデルの蒸留）と合わせ、連続空間での拡散プロセスが画像のみならずテキスト生成にも本格的に適用される流れが加速している。自己回帰パラダイムの支配に対する代替の成熟度が上がっている。

マルチモーダルリアルタイム対話

MiniCPM-o 4.5（60 upvotes）が全二重対話という次世代のインタラクション品質を軽量モデルで実現し、MiA-Signature（49 upvotes）が認知科学に着想を得た長文脈理解を提案した。前日のAudio-Visual Intelligenceサーベイが領域のロードマップを示したのに対し、本日は具体的な実装と理論的基盤の両面で進展が見られた。

注目論文

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Continuous Latent Diffusion Language Model

MiniCPM-o 4.5: Towards Real-Time Full-Duplex Omni-Modal Interaction

MiA-Signature: Approximating Global Activation for Long-Context Understanding

RaguTeam at SemEval-2026 Task 8: Meno and Friends in a Judge-Orchestrated LLM Ensemble for Faithful Multi-Turn Response Generation

SkillOS: Learning Skill Curation for Self-Evolving Agents

分野別の動向

エージェントのスキル獲得と自律性

検索・情報アクセスの再設計

非自己回帰テキスト生成

マルチモーダルリアルタイム対話

ソース