cs.CV Feb 18
Namitha Padmanabhan, Matthew Gwilliam, Abhinav Shrivastava
TL;DR: TeCoNeRVは、動画圧縮のためのImplicit Neural Representations(INRs)の効率を向上させる手法で、空間的および時間的に重み予測を分解し、ビットストリームサイズを削減し、動画内容に関連した重み変化を促すことで、480pおよび720pでのPSNRをそれぞれ2.47dBおよび5.35dB改善し、36%低いビットレートと1.5-3倍の高速エンコーディングを実現しています。
Implicit Neural Representations (INRs) have recently demonstrated impressive performance for video compression. However, since a separate INR must be overfit for each video, scaling to high-resolution...
cs.LG math.ST stat.ME Feb 18
Weijing Tang, Ming Yuan, Zongqi Xia +1
TL;DR: 知識埋め込み潜在射影モデルを提案し、外部のセマンティック埋め込みを活用して不均衡なデータにおける表現学習を正則化する手法を開発しました。このアプローチは、医療記録の高次元データ解析において、統計的誤差と近似誤差のトレードオフを特定し、実世界のEHRアプリケーションでの有効性を示しています。
Latent space models are widely used for analyzing high-dimensional discrete data matrices, such as patient-feature matrices in electronic health records (EHRs), by capturing complex dependence structu...
cs.CR cs.AI cs.MA Feb 18
Nils Palumbo, Sarthak Choudhary, Jihye Choi +3
TL;DR: PCASは、LLMベースのエージェントシステムにおける複雑な認可ポリシーを確実に施行するためのポリシーコンパイラであり、因果関係を捉えた依存グラフを用いて情報フローを追跡し、実行前に違反をブロックすることで、ポリシー遵守率を向上させる。
LLM-based agents are increasingly being deployed in contexts requiring complex authorization policies: customer service protocols, approval workflows, data access restrictions, and regulatory complian...
cs.RO cs.CV Feb 18
Runpei Dong, Ziyan Li, Xialin He +1
TL;DR: TL;DR: 本論文では、ヒューマノイドロボットによる視覚的ロコ操作のための新しいパラダイムHEROを提案し、残差を考慮したエンドエフェクタ追跡ポリシーを用いることで、エンドエフェクタの追跡誤差を3.2倍削減し、様々な日常物体を操作できるシステムを実現しました。
Visual loco-manipulation of arbitrary objects in the wild with humanoid robots requires accurate end-effector (EE) control and a generalizable understanding of the scene via visual inputs (e.g., RGB-D...
cs.CL Feb 18
Hee Seung Hwang, Xindi Wu, Sanghyuk Chun +1
TL;DR: REFINE(Reinforced Fast Weights with Next Sequence Prediction)は、次トークン予測の枠組みを用いてファストウェイトモデルを強化し、長文コンテキストのモデリングを最適化する手法であり、実験結果では従来のNTPによる監視型ファインチューニングを上回る性能を示しています。
Fast weight architectures offer a promising alternative to attention-based transformers for long-context modeling by maintaining constant memory overhead regardless of context length. However, their p...
cs.CY cs.AI Feb 18
Shen Zhou Hong, Alex Kleinman, Alyssa Mathiowetz +9
TL;DR: 2025年中に実施された研究では、大規模言語モデル(LLM)が初心者の生物学的実験スキル向上に寄与するかを評価した結果、LLMの使用が複雑な実験手順の完了率を大幅に向上させることはなかったが、一部のタスクでわずかなパフォーマンス向上が見られたことが示された。これは、AIの生物セキュリティ評価の実際の有用性を検証する必要性を浮き彫りにしている。
Large language models (LLMs) perform strongly on biological benchmarks, raising concerns that they may help novice actors acquire dual-use laboratory skills. Yet, whether this translates to improved h...
cs.CV Feb 18
Mingjia Shi, Yinhan He, Yaochen Zhu +1
TL;DR: TL;DR: 本研究では、視覚と言語のモダリティを統合するための「Saliency-Aware Principle」(SAP)選択を提案し、視覚的根拠の誤りを減少させながら安定した推論を実現する方法を示しています。SAPはモデルに依存せず、追加のトレーニングなしで多様な推論行動を並行して探索できることが実証されています。
Vision-language models (VLMs) aim to reason by jointly leveraging visual and textual modalities. While allocating additional inference-time computation has proven effective for large language models (...
cs.CL cs.AI Feb 18
Wenxuan Ding, Nicholas Tomlin, Greg Durrett
TL;DR: LLMエージェントが環境との相互作用を通じて情報を取得する際に、コストと不確実性のトレードオフを考慮する「Calibrate-Then-Act (CTA)」フレームワークを提案し、これによりより最適な探索と意思決定が可能になることを示しています。
LLMs are increasingly being used for complex problems which are not necessarily resolved in a single response, but require interacting with an environment to acquire information. In these scenarios, L...
cs.LG Feb 18
Shruti Joshi, Aaron Mueller, David Klindt +3
TL;DR: TL;DR: 大規模言語モデルの解釈可能性研究は重要な知見を提供するが、因果推論が必要であり、因果関係を明確にすることで、モデルの振る舞いと内部構成要素の関連を理解し、一般化可能な結果を得るための診断フレームワークを提案している。
Interpretability research on large language models (LLMs) has yielded important insights into model behaviour, yet recurring pitfalls persist: findings that do not generalise, and causal interpretatio...
cs.LG cs.DS Feb 18
Aloni Cohen, Refael Kohen, Kobbi Nissim +1
TL;DR: 機械的な忘却(Machine Unlearning)は特定のデータポイントを削除することを目指すが、残されたデータに対するプライバシーリスクが存在することを示す再構築攻撃を提案し、新たなセキュリティ定義を提案して、削除による漏洩から未削除データを保護する方法を示した。
Machine unlearning aims to remove specific data points from a trained model, often striving to emulate "perfect retraining", i.e., producing the model that would have been obtained had the deleted dat...
q-bio.GN cs.LG q-bio.QM Feb 18
Huan Souza, Pankaj Mehta
TL;DR: パラメータフリーの表現が、計算負荷の高い深層学習モデルを用いた単一細胞基盤モデルを上回る性能を示し、細胞のアイデンティティを単純な線形表現で捉えられる可能性を示唆しています。
Single-cell RNA sequencing (scRNA-seq) data exhibit strong and reproducible statistical structure. This has motivated the development of large-scale foundation models, such as TranscriptFormer, that u...
stat.ME cs.LG stat.ML Feb 18
Yonghoon Lee, Meshi Bashari, Edgar Dobriban +1
TL;DR: TL;DR: SynthBHは、合成データを活用した多重仮説検定手法で、FDR制御を保証し、合成データの質に応じてサンプル効率を向上させることができる。実験結果では、異常検出や薬剤-癌感受性の解析においてその性能が示された。
Multiple hypothesis testing with false discovery rate (FDR) control is a fundamental problem in statistical inference, with broad applications in genomics, drug screening, and outlier detection. In ma...