🔭 AI Research Dashboard

AI Research Dashboard

Latest papers, trending models, repositories, and news — updated every hour

💹 AI Stocks

Updated Apr 20, 07:00 PM

AI Semiconductors

Ticker Name Price Change
NVDA NVIDIA $201.68 +201.68 (+0.0%)
AMD AMD $278.39 +278.39 (+0.0%)
INTC Intel $68.50 +68.50 (+0.0%)
QCOM Qualcomm $136.20 +136.20 (+0.0%)
AVGO Broadcom $406.54 +406.54 (+0.0%)
TSM TSMC $370.50 +7.15 (+2.0%)
ARM Arm Holdings $166.73 +166.73 (+0.0%)

Big Tech

Ticker Name Price Change
MSFT Microsoft $422.79 +422.79 (+0.0%)
GOOGL Alphabet $341.68 +341.68 (+0.0%)
META Meta $688.55 +688.55 (+0.0%)
AMZN Amazon $250.56 +250.56 (+0.0%)
AAPL Apple $270.23 +270.23 (+0.0%)

AI Pure-Play

Ticker Name Price Change
PLTR Palantir $146.39 +146.39 (+0.0%)
AI C3.ai $9.24 -0.08 (-0.9%)
SNOW Snowflake $143.98 +0.43 (+0.3%)
PATH UiPath $10.41 -0.20 (-1.9%)
DDOG Datadog $126.61 +126.61 (+0.0%)

🌍 Global AI & Tech

Updated Apr 20, 07:00 PM
TechCrunch AI OpenAI’s existential questions TL;DR: Equityの最新エピソードでは、OpenAIの最近の買収が同社の「2つの大きな存在的問題」に対処しているかどうかについて議論しています。 Apr 19 The Verge AI Cloud development platform Vercel was hacked Vercelがハッキングされ、ハッカーは盗まれたデータを販売しようとしている。ShinyHuntersのメンバーを名乗る人物が、従業員の名前やメールアドレスを含むデータをオンラインに投稿した。 Apr 19 TechCrunch AI The 12-month window 多くのAIスタートアップは、基盤モデルがまだそのカテゴリに広がっていないために存在しているが、その状況は永遠には続かないと多くの人が冗談交じりに認識している。 Apr 19 TechCrunch AI Palantir posts mini-manifesto denouncing inclusivity and ‘regressive’ cultures Palantirは、ICEとの協力や「西洋の擁護者」としての立場を強調する中で、包括性や「退行的」文化を否定するミニマニフェストを発表し、そのイデオロギーがより注目を集めている。 Apr 19 TechCrunch AI TechCrunch Mobility: Uber enters its assetmaxxing era TL;DR: Uberは資産最大化の時代に突入し、AIが交通の未来において重要な役割を果たすことが強調されています。 Apr 19 Towards DS Proxy-Pointer RAG: Structure Meets Scale at 100% Accuracy with Smarter Retrieval Proxy-Pointer RAGは、スマートなリトリーバルを用いて100%の精度を達成し、オープンソースで簡単にセットアップできるベクターRAGの新しいアプローチを紹介しています。 Apr 19 Towards DS Dreaming in Cubes VQ-VAEとTransformersを用いて、Minecraftの世界を生成する手法について解説しています。 Apr 19 Towards DS KV Cache Is Eating Your VRAM. Here’s How Google Fixed It With TurboQuant. TL;DR: GoogleのTurboQuantは、KVキャッシュの量子化フレームワークを用いて、PolarQuantとQJL残差を通じてほぼ損失のないストレージを実現し、大規模なコンテキストウィンドウを最小限のメモリオーバーヘッドで可能にする。 Apr 19 TechCrunch AI Tesla brings its robotaxi service to Dallas and Houston テスラはダラスとヒューストンでロボタクシーサービスを開始し、現在テキサス州の3都市で提供中である。 Apr 18 The Verge AI The RAM shortage could last years RAMの供給不足は2027年末までに需要の60%しか満たされず、2030年まで続く可能性があると報じられています。 Apr 18 TechCrunch AI AI chip startup Cerebras files for IPO AIチップスタートアップのCerebrasがIPOを申請し、最近ではAmazon Web Servicesとの契約やOpenAIとの100億ドル以上の取引を発表した。 Apr 18 Towards DS Your RAG System Retrieves the Right Data — But Still Produces Wrong Answers. Here’s Why (and How to Fix It). RAGシステムが正しい文書を取得しても、同じ取得ウィンドウ内に矛盾する文書が存在することで誤った回答を返す問題があることが示されており、その解決策が提案されています。 Apr 18 TechCrunch AI Anthropic’s relationship with the Trump administration seems to be thawing TL;DR: アンスロピックは、ペンタゴンから供給チェーンリスクとして指定されながらも、トランプ政権の高官との対話を続けている。 Apr 18 TechCrunch AI The App Store is booming again, and AI may be why TL;DR: Appfiguresのデータによると、2026年に新しいアプリの立ち上げが増加しており、AIツールがモバイルソフトウェアのブームを促進している可能性がある。 Apr 18 Towards DS AI Agents Need Their Own Desk, and Git Worktrees Give Them One AIエージェントには独自の作業環境が必要であり、Gitワークツリーを利用することで並行してエージェントのコーディングセッションを管理できることが解説されています。 Apr 18

🇯🇵 Japan AI & Tech

Updated Apr 20, 07:00 PM
note LLM 灯台はまだ見えない(3章・4章) TL;DR: 紗月は出勤後、前日に借りた絵本を返却ワゴンから取り出す。 Apr 20 note LLM AIを使ってみよう:総括 この章はAIに関する解説がほとんどなく、筆者の個人的な感想やボヤキが中心の内容です。興味がある方は続きをご覧ください。 Apr 20 note LLM AIをつかてみよう:検証実験編 肯定的なプロンプト AIを活用した検証実験に関する章で、肯定的なプロンプトの使用について説明しています。興味のある読者向けに、内容を深く掘り下げることが推奨されています。 Apr 20 note LLM AIをつかてみよう:検証実験編 否定的なプロンプト AIを使った検証実験において、否定的なプロンプトの効果を探る特殊な章であり、興味のある読者向けに内容が提供されています。 Apr 20 note LLM AIを使ってみよう:変態編 この記事では、AIの活用方法を「変態編」として紹介しており、実践的なアプローチやユニークな利用例が提案されています。 Apr 20 note LLM AIを使ってみよう:熟練編 この記事では、AIを活用するための熟練者向けのテクニックや応用方法について解説しています。上級編を先に読むことを推奨しています。 Apr 20 note LLM 情報の対称化社会における「意志の非対称性」の再構築――ポスト情報時代におけるエージェンシーの経済学的考察 生成AIやIoT、分散型台帳技術の進展により情報の対称化が進む中、個人の主体性がどのように影響を受けるかを分析し、情報の非対称性が自由意志を制約するパラドックスを提示するとともに、内発的動機に基づく「意志の非対称性」を新たな戦略的資産として定義することを目指している。 Apr 20 note LLM AIを使ってみよう:上級編 この記事では、AIの上級利用法について解説しており、中級編を前提にした具体的な応用やテクニックが紹介されています。 Apr 20 note LLM AIを使ってみよう:中級編 この記事では、中級者向けにAIの活用方法を紹介し、初級編を読んでからのステップアップを促しています。 Apr 20 Qiita ML SAM TL;DR: SAMは使いやすい機械学習ツールである。 Apr 20 note LLM AIを使ってみよう:初級編 AIの実際の使い方や挙動を比喩的に整理した初級者向けの記事であり、厳密な技術解説ではないため、正確な仕組みを理解したい人には適していない。 Apr 20 Qiita LLM 「新人プログラマが100億円を稼ぐには、どのプログラム言語を学べばいいか」を、ClaudeとChatGPTとGeminiがディベートするプログラムを作って議論させてみた 新人プログラマが100億円を稼ぐためには、特定のプログラム言語を学ぶだけでは不十分であり、成長市場を狙った事業やサービスの立ち上げが重要であるとAIたちが議論した。必要な言語としてはPythonとTypeScriptが挙げられた。 Apr 20 Qiita LLM 推論では余裕の8GBが、ファインチューニングでは即死する — 学習が推論の8倍のVRAMを食う理由 推論ではRTX 4060の8GB VRAMで7Bモデルを動作させることができるが、ファインチューニングには推論の8倍のVRAMが必要で、学習時のリソース消費が非常に高いことが示されている。 Apr 20 Qiita ML 推論では余裕の8GBが、ファインチューニングでは即死する — 学習が推論の8倍のVRAMを食う理由 推論ではRTX 4060の8GB VRAMで7Bモデルを動かせるが、ファインチューニングでは学習に必要なVRAMが推論の8倍となり、即死する可能性がある。 Apr 20 Qiita LLM 北京ヒューマノイドロボットハーフマラソンで優勝記録更新、CursorがバリュエーションUS$50Bでの調達協議など:2026-04-20 AI動向まとめ 北京で開催された第2回ヒューマノイドロボット・ハーフマラソンで新たな優勝記録が樹立され、同時にCursorがバリュエーション50億ドルでの資金調達協議を行っている。 Apr 20

🔧 AI Hardware

Updated Apr 20, 07:00 PM
Tom's Hardware Gaming laptop brought to repair shop for overheating problem, decorative stickers found to be the problem — tech fixes problem in under 10 seconds after removing the stickers covering its fans ゲーミングラップトップのオーバーヒート問題は、ファンを覆っていたデコレーションステッカーを取り除くことで、修理店が10秒以内に解決しました。 Apr 20 Wccftech Nioh 3 Doubles Down on Punishment With April 27 Update Adding High-Difficulty Missions and Combat Overhaul Nioh 3は、4月27日に高難易度ミッションと戦闘のオーバーホールを追加する無料アップデートを実施することを発表しました。 Apr 20 Wccftech AMD Taps GlobalFoundries for MI500’s Co-Packaged Optics as the Silicon Photonics Race With NVIDIA Heats Up AMDは次世代Instinct MI500 AIアクセラレーター向けのMRM Co-packaged Opticソリューションの開発にGlobalFoundriesを活用し、NVIDIAとのシリコンフォトニクス競争を加速させる。 Apr 20 Wccftech AMD 3D V-Cache Turns Ryzen Into a Surprise RAG AI Weapon, With An 88% Boost Over Non-X3D CPUs AMDの3D V-Cache CPUは、非X3Dモデルに対してAIベンチマークで88%の性能向上を示し、RAGパイプラインに最適であることを証明しています。 Apr 20 NVIDIA NVIDIA and Partners Showcase the Future of AI-Driven Manufacturing at Hannover Messe 2026 NVIDIAとパートナーは、2026年のハノーバーメッセでAI駆動の製造の未来を紹介し、製造業がAI導入を進める重要な転換点にあることを強調しています。 Apr 20 Wccftech CAPCOM’s PRAGMATA Sells More Than 1 Million Units in 48 Hours CAPCOMの新作SFタイトル「PRAGMATA」が発売から48時間で100万ユニット以上を販売し、好調なスタートを切ったことを発表しました。 Apr 20 Wccftech MSI’s New 32″ QD-OLED Gaming Monitors Kill the Purple Tint Problem, Boost Black Levels by 40% & Prevent OLED Burn-In MSIは新しい32インチQD-OLEDゲーミングモニターを発表し、紫色の色合いの問題を解消し、黒のレベルを40%向上させ、OLEDの焼き付き防止機能を搭載しました。 Apr 20 Wccftech Google Splits TPUv8 Strategy Into Two Chips, Handing Broadcom Training and MediaTek Inference Duties GoogleはTPUv8戦略を2つのチップに分割し、1つはAIトレーニング用、もう1つは推論用としてBroadcomとMediaTekにそれぞれの役割を割り当てる準備を進めています。 Apr 20 Wccftech SK Hynix Begins Mass Production of 192 GB SOCAMM2 Memory With 2x Bandwidth, A Vital Piece For NVIDIA’ Vera Rubin SK Hynixは、NVIDIAのVera Rubinおよび次世代AIデータセンター向けに、最大192 GBのSOCAMM2メモリの量産を開始しました。これにより、帯域幅が2倍になる重要な技術が提供されます。 Apr 20 Wccftech Samsung Galaxy S27 Will “Most Likely” Ship With A Silicon-Carbon Battery With A Much Higher Lifespan Samsung Galaxy S27は、より長寿命のシリコン-カーボンバッテリーを搭載する可能性が高いと報じられている。 Apr 20 Wccftech Apple Will Make You Wait To Upgrade To Its Redesigned M6 MacBook Pro Lineup, As DRAM & SSD Shortage Could Delay Launch To 2027 AppleのM6 MacBook Proラインアップの発売が、DRAMおよびSSDの不足により2026年から2027年に延期される可能性があり、M5シリーズがより長く現役であり続ける見込みです。 Apr 19 Wccftech Enjoy A Free Copy Of Capcom’s PRAGMATA With MSI’s Vector 16 HX AI Gaming Laptop; 12GB RTX 5070 Ti Configuration Currently Going For $180 Off On Amazon MSIのVector 16 HX AIゲーミングノートパソコンを購入すると、CapcomのPRAGMATAの無料コピーがもらえ、現在12GB RTX 5070 Ti構成がAmazonで180ドルオフで販売中です。 Apr 19 ServeTheHome AOC 16T20 Portable Monitor Mini Review AOCの16T20は、15.6インチの1080p IPSパネルを搭載したエントリーレベルのポータブルモニターで、現在Amazonで49ドルと非常に手頃な価格で提供されています。 Apr 19 Tom's Hardware Russian-made Shahed drones are ‘disintegrating in the air before reaching their targets’ due to shoddy manufacturing, video shows — commentators call Russian clones of Iran's drones 'flying garbage' ロシア製のShahedドローンは、製造の不良により目標に到達する前に空中で崩壊しているとされ、ウクライナのStingインターセプタードローンによってその様子が捉えられた。 Apr 19 Tom's Hardware Bambu Lab overtakes Creality as the world's top-selling budget 3D printer brand — resurgence in 3D printer market fueled by budget options Bambu Labが2025年にエントリーレベルの3Dプリンター出荷でCrealityを抜き、世界のトップブランドとなった。予算に優しい選択肢が3Dプリンター市場の復活を促進している。 Apr 19

🔒 Security

Updated Apr 20, 07:00 PM
BleepingComputer Microsoft pulls service update causing Teams launch failures Microsoftは、Microsoft Teamsデスクトップクライアントの起動を妨げていた最近のサービス更新を取り消しました。 Apr 20 BleepingComputer Microsoft releases emergency updates to fix Windows Server issues Microsoftは、2026年4月のセキュリティ更新プログラムをインストールした後に発生したWindows Serverの問題を修正するため、緊急のアウトオブバンド(OOB)更新をリリースしました。 Apr 20 The Hacker News Researchers Detect ZionSiphon Malware Targeting Israeli Water, Desalination OT Systems TL;DR: サイバーセキュリティ研究者が、イスラエルの水処理および淡水化システムを狙った新しいマルウェア「ZionSiphon」を発見しました。 Apr 20 The Hacker News Vercel Breach Tied to Context AI Hack Exposes Limited Customer Credentials Vercelは、Context.aiという第三者のAIツールの侵害により、内部システムへの不正アクセスを許すセキュリティ侵害を発表しました。 Apr 20 BleepingComputer Vercel confirms breach as hackers claim to be selling stolen data Vercelは、ハッカーがシステムに侵入し、盗まれたデータを販売しようとしていると主張した後、セキュリティインシデントを公表しました。 Apr 19 BleepingComputer Apple account change alerts abused to send phishing emails Appleのアカウント変更通知が悪用され、正規のメールから送信された偽のiPhone購入フィッシング詐欺が増加しており、信頼性が高まることでスパムフィルターを回避する可能性がある。 Apr 19 BleepingComputer NIST to stop rating non-priority flaws due to volume increase NISTは、提出件数の増加に伴う作業負担のため、低優先度の脆弱性に対する深刻度スコアの付与を停止することを発表しました。 Apr 19 BleepingComputer Critical flaw in Protobuf library enables JavaScript code execution protobuf.jsにおける重大なリモートコード実行の脆弱性に対する概念実証のエクスプロイトコードが公開され、広く使用されているこのライブラリに影響を与える可能性がある。 Apr 18 BleepingComputer Microsoft Teams right-click paste broken by Edge update bug Microsoftは、最近のMicrosoft Edgeのアップデートにより、Microsoft Teamsのデスクトップクライアントでの右クリックペースト機能が壊れるバグが発生したことを警告しています。 Apr 18 BleepingComputer NAKIVO v11.2: Ransomware Defense, Faster Replication, vSphere 9, and Proxmox VE 9.0 Support NAKIVO Backup & Replication v11.2が一般提供を開始し、ランサムウェア防御、迅速なレプリケーション、vSphere 9およびProxmox VE 9.0のサポートを強化しました。 Apr 18 The Hacker News [Webinar] Eliminate Ghost Identities Before They Expose Your Enterprise Data TL;DR: 2024年には、クラウド侵害の68%が管理されていないサービスアカウントやAPIキーによるものであり、これらのゴーストアイデンティティを排除することが企業データを守る鍵となる。 Apr 18 The Hacker News $13.74M Hack Shuts Down Sanctioned Grinex Exchange After Intelligence Claims グリネックス取引所は、$13.74Mのハッキング被害を受け、英国と米国から制裁を受けた後に運営を停止すると発表した。取引所はこのサイバー攻撃を西側の情報機関の仕業と非難している。 Apr 18 The Hacker News Mirai Variant Nexcorium Exploits CVE-2024-3721 to Hijack TBK DVRs for DDoS Botnet MiraiのバリアントであるNexcoriumが、CVE-2024-3721の脆弱性を利用してTBK DVRをハイジャックし、DDoSボットネットを展開していることがFortinetとPalo Alto Networksの調査で明らかになった。 Apr 18 Schneier on Security Friday Squid Blogging: New Giant Squid Video 日本の巨大イカが別のイカを食べる様子を捉えた素晴らしい動画が公開されました。この投稿では、未報道のセキュリティ関連ニュースについても話し合うことができます。 Apr 17 Dark Reading How NIST's Cutback of CVE Handling Impacts Cyber Teams NISTがCVEデータの強化を縮小したことで、業界やアドホック連合がそのギャップを埋める準備を進めている。 Apr 17
For Researchers

📄 Latest Papers

Updated Apr 20, 07:00 PM
cs.CV Apr 17

Repurposing 3D Generative Model for Autoregressive Layout Generation

Haoran Feng, Yifan Niu, Zehuan Huang +4

TL;DR: LaviGenは、3D生成モデルを再利用して3Dレイアウト生成を行うフレームワークで、オートリグレッシブプロセスを用いて物体間の幾何学的関係と物理的制約をモデル化し、物理的に妥当な3Dシーンを生成します。実験結果では、従来の手法に比べて物理的妥当性が19%向上し、計算速度が65%向上したことが示されています。

We introduce LaviGen, a framework that repurposes 3D generative models for 3D layout generation. Unlike previous methods that infer object layouts from textual descriptions, LaviGen operates directly ...

cs.CV cs.RO Apr 17

FineCog-Nav: Integrating Fine-grained Cognitive Modules for Zero-shot Multimodal UAV Navigation

Dian Shao, Zhengzheng Xu, Peiyang Wang +4

TL;DR: FineCog-Navは、UAVの視覚と言語によるナビゲーションを人間の認知に基づいて細分化されたモジュールで組織し、ゼロショットでのナビゲーション性能を向上させる新しいフレームワークを提案します。実験結果は、指示遵守や長期計画、未見環境への一般化において、従来のゼロショット手法を上回ることを示しています。

UAV vision-language navigation (VLN) requires an agent to navigate complex 3D environments from an egocentric perspective while following ambiguous multi-step instructions over long horizons. Existing...

math.AP cond-mat.stat-mech math-ph Apr 17

Phase transitions in Doi-Onsager, Noisy Transformer, and other multimodal models

Kyunghoo Mun, Matthew Rosenzweig

TL;DR: Doi-Onsagerモデルやノイジートランスフォーマーなどの多モーダルモデルにおける相転移を研究し、特定の条件下で臨界結合強度$K_c$が均一分布の線形安定性閾値$K_\#$と一致し、相転移が連続であることを証明した。特に、Doi-Onsagerモデルでは$K_c=K_\#=3π/4$で連続相転移が確認され、ノイジートランスフォーマーでは$β_*$を境に相転移の性質が変わることを示

We study phase transitions for repulsive-attractive mean-field free energies on the circle. For a $\frac{1}{n+1}$-periodic interaction whose Fourier coefficients satisfy a certain decay condition, we ...

cs.AI Apr 17

ASMR-Bench: Auditing for Sabotage in ML Research

Eric Gan, Aryan Bhatt, Buck Shlegeris +2

TL;DR: ASMR-Benchは、ML研究におけるサボタージュを検出する監査能力を評価するためのベンチマークであり、9つのML研究コードベースにサボタージュされたバリアントを含んでいます。評価の結果、最先端のLLMや人間の監査者はサボタージュを信頼性高く検出するのに苦労し、最良のパフォーマンスはAUROC 0.77とトップ1修正率42%でした。

As AI systems are increasingly used to conduct research autonomously, misaligned systems could introduce subtle flaws that produce misleading results while evading detection. We introduce ASMR-Bench (...

cs.CV Apr 17

Enhancing Hazy Wildlife Imagery: AnimalHaze3k and IncepDehazeGan

Shivarth Rai, Tejeswar Pokuri

TL;DR: 動物の検出や行動分析における大気の霞の影響を軽減するため、3,477枚の合成画像からなるAnimalHaze3kデータセットと、IncepDehazeGanアーキテクチャを提案し、最先端の性能を達成しました。これにより、YOLOv11の検出精度が大幅に向上し、野生動物保護のための信頼性の高いツールが提供される可能性があります。

Atmospheric haze significantly degrades wildlife imagery, impeding computer vision applications critical for conservation, such as animal detection, tracking, and behavior analysis. To address this ch...

cs.LG math.DS math.PR Apr 17

Geometric regularization of autoencoders via observed stochastic dynamics

Sean Hill, Felix X. -F. Ye

TL;DR: TL;DR: 本研究では、観測された確率的ダイナミクスに基づいて、オートエンコーダの幾何学的正則化手法を提案し、低次元多様体の学習を改善するためのペナルティを導入。実験により、従来の手法に比べてエラーを50~70%削減し、メタスタブルなダイナミクス下でのパフォーマンスを向上させた。

Stochastic dynamical systems with slow or metastable behavior evolve, on long time scales, on an unknown low-dimensional manifold in high-dimensional ambient space. Building a reduced simulator from s...

cs.AI Apr 17

Using Large Language Models and Knowledge Graphs to Improve the Interpretability of Machine Learning Models in Manufacturing

Thomas Bayer, Alexander Lohr, Sarah Weiß +2

TL;DR: 大規模言語モデル(LLM)と知識グラフ(KG)を活用して、製造業における機械学習モデルの解釈可能性を向上させる手法を提案し、実際の製造環境での適用を評価した結果、ユーザーにとって理解しやすい説明を生成できることを示しました。

Explaining Machine Learning (ML) results in a transparent and user-friendly manner remains a challenging task of Explainable Artificial Intelligence (XAI). In this paper, we present a method to enhanc...

cs.LG physics.chem-ph Apr 17

Evaluating the Progression of Large Language Model Capabilities for Small-Molecule Drug Design

Shriram Chennakesavalu, Kirill Shmilovich, Hayley Weir +5

TL;DR: TL;DR: 大規模言語モデル(LLMs)は小分子薬物設計において有望だが、実用性は不明であり、化学に基づいたタスクを強化学習環境として評価することで、モデルの能力を向上させることができることが示された。特に、ポストトレーニングにより小型モデルが最先端モデルに匹敵する性能を発揮する可能性がある。

Large Language Models (LLMs) have the potential to accelerate small molecule drug design due to their ability to reason about information from diverse sources and formats. However, their practical uti...

cs.AI cs.CL cs.LG Apr 17

Learning to Reason with Insight for Informal Theorem Proving

Yunhe Li, Hao Shi, Bowen Deng +8

TL;DR: TL;DR: 本研究では、非形式的定理証明における洞察の欠如を解決するために、$\mathtt{DeepInsightTheorem}$という階層的データセットを提案し、モデルが基本的な証明から洞察的思考へと進化できるようにするProgressive Multi-Stage SFT戦略を設計しました。このアプローチは、数学的推論の向上に寄与することが実験で示されました。

Although most of the automated theorem-proving approaches depend on formal proof systems, informal theorem proving can align better with large language models' (LLMs) strength in natural language proc...

cs.CL Apr 17

No Universal Courtesy: A Cross-Linguistic, Multi-Model Study of Politeness Effects on LLMs Using the PLUM Corpus

Hitesh Mehta, Arjit Saxena, Garima Chhikara +1

TL;DR: この研究は、異なる礼儀正しさの度合いが大規模言語モデル(LLMs)の応答に与える影響を調査し、英語、ヒンディー語、スペイン語の三言語で実験を行った結果、礼儀正しいプロンプトは応答の質を最大約11%向上させる一方で、その効果は言語やモデルによって異なることを示しています。また、PLUMコーパスを公開し、今後の研究を支援するためのデータセットを提供しています。

This paper explores the response of Large Language Models (LLMs) to user prompts with different degrees of politeness and impoliteness. The Politeness Theory by Brown and Levinson and the Impoliteness...

cs.CV cs.AI cs.CL Apr 17

VEFX-Bench: A Holistic Benchmark for Generic Video Editing and Visual Effects

Xiangbo Gao, Sicong Jiang, Bangya Liu +13

TL;DR: VEFX-Benchは、AI支援のビデオ編集と視覚効果のための包括的なベンチマークであり、5,049の人間注釈付きビデオ編集例を含むVEFX-Datasetを基に、ビデオ編集品質評価のためのVEFX-Rewardモデルを提案しています。この新しい評価システムは、商業およびオープンソースのビデオ編集システムを比較し、視覚的妥当性や指示遵守におけるギャップを明らかにしました。

As AI-assisted video creation becomes increasingly practical, instruction-guided video editing has become essential for refining generated or captured footage to meet professional requirements. Yet th...

cs.CL cs.AI Apr 17

From Benchmarking to Reasoning: A Dual-Aspect, Large-Scale Evaluation of LLMs on Vietnamese Legal Text

Van-Truong Le

TL;DR: ベトナムの法律文書の複雑さに対処するため、最新の大規模言語モデル(LLMs)の性能を評価するための二重側面評価フレームワークを提案し、精度、可読性、一貫性の3つの次元での性能を比較した結果、モデルごとに異なる強みと弱みが明らかになった。特に、現在のLLMsの主な課題は要約ではなく、制御された正確な法律的推論であることが確認された。

The complexity of Vietnam's legal texts presents a significant barrier to public access to justice. While Large Language Models offer a promising solution for legal text simplification, evaluating the...

🤗 Trending Models

Updated Apr 20, 07:00 PM

📊 Trending Datasets

Trending Repositories

Updated Apr 20, 07:00 PM

baidu/ERNIE-Image

TL;DR: ERNIE-Imageは、BaiduのERNIE-Imageチームによって開発されたオープンなテキストから画像生成モデルで、8Bのパラメータを持つDiffusion Transformer(DiT)を基にしており、オープンウェイトのテキストから画像生成モデルの中で最先端の性能を達成しています。

ERNIE-Image is an open text-to-image generation model developed by the ERNIE-Image team at Baidu. It is built on a singl...

★ 290 🍴 19 Python

said-ohamouddou/LIDARLearn

TL;DR: LIDARLearnは、3Dポイントクラウドの分類、セグメンテーション、自己教師あり表現学習のための統一された深層学習ライブラリです。

LIDARLearn: A Unified Deep Learning Library for 3D Point Cloud Classification, Segmentation, and Self-Supervised Represe...

★ 141 🍴 14 Python

verl-project/bumblebee

TL;DR: Bumblebeeは、大規模言語モデルのための軽量分散トレーニングライブラリで、オーケストレーション用のランタイムAPIや実装作業のためのコンポーザブルプライミティブ、アーキテクチャをシステムに取り込むためのモデル構成および登録フックを提供します。

A lightweight distributed training library for large language models. Bumblebee exposes a runtime API for orchestration,...

★ 61 🍴 5 Python

soumili-here/Crime-Analysis-Against-Children-in-India

このプロジェクトは、2017年以降のインドにおける子供に対する犯罪に関するデータ分析を機械学習アプローチを用いて行っています。

This project deals with data analysis using a Machine Learning approach on the topic "Crimes Against Children in India 2...

★ 23 🍴 0 Jupyter Notebook

Tianyu-Zhou1964/PIE-Handmaking_LLM

環境工学の学生が難解な教科書にうんざりし、教育に値する大規模言語モデルをゼロから構築することを決意した。

An environmental engineering student, fed up with impenetrable textbooks, decided to build a large language model from s...

★ 23 🍴 1 Python

Bishanka-prog/crop_yield_prediction

農業生産性に対する降雨の影響を分析し、機械学習モデルを用いて作物の収穫量を予測するプロジェクトを構築しました。主な内容には、探索的データ分析(EDA)、可視化、前処理、線形回帰およびランダムフォレストの回帰モデルの構築が含まれます。

Crop Yield Prediction using Machine Learning I built a data-driven project that analyzes the impact of rainfall on agri...

★ 19 🍴 0 Jupyter Notebook

anknpolley123/BTCDump

BTC Dumpは、テクニカル指標を用いたアンサンブル機械学習(XGBoost、Random Forest、Gradient Boosting)を活用したプロフェッショナルなビットコイン価格予測ツールで、リアルタイムデータをBinanceから取得し、複数の時間枠に対応したライブ自動予測モードを備えています。

BTC Dump is a professional Bitcoin price prediction tool that uses ensemble machine learning (XGBoost, Random Forest, Gr...

★ 18 🍴 0 Python

BennettSchwartz/theobench

TL;DR: BennettSchwartz/theobenchは、大規模言語モデルがTheo Browneについてどれだけ知識を持っているかを測定するためのベンチマークです。

Benchmark for measuring how well large language models know Theo Browne

★ 16 🍴 0 TypeScript

CURT1S03/quadruped-drl-platform

Unitree Go2四足ロボットをNVIDIA Isaac Labで深層強化学習(PPO)を用いて訓練するためのフルスタックプラットフォーム。

A full-stack platform for training a Unitree Go2 quadruped robot via Deep Reinforcement Learning (PPO) in NVIDIA Isaac L...

★ 11 🍴 4 Python

AmphionTeam/TARS

TL;DR: 論文「Closing the Modality Reasoning Gap for Speech Large Language Models」では、音声大規模言語モデルにおけるモダリティ推論のギャップを解消する方法を提案しています。

[ACL 2026] Closing the Modality Reasoning Gap for Speech Large Language Models

★ 10 🍴 0 Jupyter Notebook

ZHUWEI-hub/GUARD

大規模言語モデルの推論における失敗ダイナミクスを分析した研究が発表され、ACL 2026での発表が予定されています。

[ACL 2026] Dissecting Failure Dynamics in Large Language Model Reasoning

★ 10 🍴 0 Python

AnubhawRai/crime-analysis---INDIA

インドの犯罪データを用いた空間的・時間的分析と機械学習に基づく犯罪パターンの予測に関する計算研究。

Spatiotemporal Analysis and Machine Learning-Based Prediction of Crime Patterns: A Computational Study of Indian Crime D...

★ 9 🍴 0 Jupyter Notebook