[ PROMPT_NODE_26954 ]
paper2web
[ SKILL_DOCUMENTATION ]
# Paper2Web: 学术主页生成
## 概述
Paper2Web 将学术论文转换为交互式、可探索的学术主页。与传统方法(直接生成、基于模板或 HTML 转换)不同,Paper2Web 通过迭代优化过程创建具有布局感知能力的交互式网站。
## 核心能力
### 1. 布局感知生成
- 分析论文结构和内容组织
- 创建响应式、多板块布局
- 根据论文类型(研究论文、综述、预印本等)调整设计
### 2. 交互元素
- 用于展示详细内容的可展开板块
- 交互式图表和表格
- 内嵌引用和参考文献
- 便于浏览的导航菜单
- 移动端响应式设计
### 3. 内容优化
系统使用迭代流水线:
1. 初始内容提取与结构化
2. 具有视觉层级的布局生成
3. 交互元素集成
4. 美学优化
5. 质量评估与验证
## 使用方法
### 基础网站生成
bash
python pipeline_all.py
--input-dir "path/to/papers"
--output-dir "path/to/output"
--model-choice 1
### 参数
- `--input-dir`: 包含论文文件(PDF 或 LaTeX)的目录
- `--output-dir`: 生成网站文件的输出目录
- `--model-choice`: LLM 模型选择(1=GPT-4, 2=GPT-4.1)
- `--enable-logo-search`: 使用 Google 搜索 API 查找机构 Logo(可选)
### 输入格式要求
**支持的输入格式:**
1. **LaTeX 源码**(推荐以获得最佳效果)
- 主文件:`main.tex`
- 包含所有引用的图片、表格和参考文献文件
- 每篇论文组织在一个单独的目录中
2. **PDF 文件**
- 具有可选文本的高质量 PDF
- 内嵌图片应为高分辨率
- 具有正确的章节标题和结构
**目录结构:**
input/
└── paper_name/
├── main.tex # LaTeX 源码
├── bibliography.bib # 参考文献
├── figures/ # 图片文件
│ ├── fig1.png
│ └── fig2.pdf
└── tables/ # 表格文件
## 输出结构
生成的网站包含:
output/paper_name/website/
├── index.html # 主网页
├── styles.css # 样式表
├── script.js # 交互功能
├── assets/ # 图片和媒体
│ ├── figures/
│ └── logos/
└── data/ # 结构化数据(可选)
## 自定义选项
### 视觉设计
Th