logoAIStage

PaperBanana はじめに

PaperBananaはAI研究者向けに学術図版の作成を自動化し、テキストや参考文献から手法 diagram と統計プロットを生成します。

ウェブサイトを訪問する

PaperBananaとは何ですか

PaperBananaは、AI研究者向けの学術図版作成を自動化するためのエージェントフレームワークです。本システムは、Retriever、Planner、Renderer、Criticからなるマルチエージェントワークフローを採用し、テキスト説明やラフスケッチを、学会発表に適した手法図表や統計プロットへ変換します。ユーザーは、文脈とキャプションを入力して図版を最初から生成したり、手描きスケッチをアップロードしてデジタル加工したりできます。このフレームワークは学術的な正確性を重視し、反復的な自己評価を通じて、図版の忠実性、簡潔性、美観を向上させます。NeurIPSなどトップカンファレンスの標準とベンチマークを比較することで、PaperBananaは図版生成に要する時間の削減を目指しています。オープンソースプロジェクトとして、コード、データセット、およびベンチマーク(PaperBananaBench)を提供し、研究コミュニティを支援します。

PaperBanana はどのように機能しますか

PaperBanana は、研究者向けに学術図版の作成を自動化するエージェント指向フレームワークとして機能します。そのワークフローは、専門エージェントを調整します:Retriever はソースの文脈を収集し、Planner はレイアウトを設計し、Renderer は視覚-言語モデルを使用して初期画像を生成し、Critic は反復的な自己批評を実行して出力を洗練させます。本システムは、テキスト記述または粗いスケッチを受け入れ、そのまま出版可能な方法論図や統計プロットを生成します。このプロセスは、トップクラスの会議に適した忠実性、簡潔性、美的基準を重視します。図版作成のボトルネックを自動化することで、PaperBanana は研究者がコンテンツに集中できるようにし、ベクター品質で標準化されたビジュアルアセットを保証します。

PaperBanana の利点

PaperBananaは、AI研究者向けに学術図版の作成を自動化するために設計されたエージェントベースのフレームワークです。テキスト説明やラフスケッチから直接、出版可能な方法論図や統計プロットを生成します。このシステムは、多エージェントワークフロー——Retriever、Planner、Renderer、Critic——を採用し、出力を反復的に洗練させ、高忠実度、簡潔性、会議標準への準拠を保証します。テキストから図表への生成とスケッチの磨き上げの両方を処理することで、PaperBananaは図表制作における時間のかかるボトルネックに対処します。オープンソースであり、PaperBananaBenchベンチマーク(292のNeurIPS 2025テストケース)を含み、信頼性の高いベクター品質の視覚効果のための最先端の視覚-言語モデルを統合しています。

PaperBanana の長所と短所

長所

  • 学術図版の作成を効率的に自動化します。
  • エージェント型フレームワークにより、図の信頼性が向上します。
  • テキスト入力とスケッチ入力をサポートします。
  • 出版基準に基づくベンチマーク評価を実施しています。

短所

  • クレジットベースの料金体系により、コストが増加する可能性があります。
  • 設定パラメータにはユーザーの専門知識が必要です。
  • 出力の精度は入力の品質に依存します。
  • 方法論図とプロットに限定されます。
特徴*

PaperBanana 代替案