[ PROMPT_NODE_26488 ]
dnanexus-integration
[ SKILL_DOCUMENTATION ]
# DNAnexus 集成
## 概述
DNAnexus 是一个用于生物医学数据分析和基因组学的云平台。您可以构建和部署应用/小程序,管理数据对象,运行工作流,并使用 dxpy Python SDK 进行基因组学流水线的开发和执行。
## 何时使用此技能
当您需要执行以下操作时,请使用此技能:
- 创建、构建或修改 DNAnexus 应用/小程序
- 上传、下载、搜索或组织文件和记录
- 运行分析、监控作业、创建工作流
- 使用 dxpy 编写与平台交互的脚本
- 设置 dxapp.json,管理依赖项,使用 Docker
- 处理 FASTQ, BAM, VCF 或其他生物信息学文件
- 管理项目、权限或平台资源
## 核心能力
该技能分为五个主要领域,每个领域都有详细的参考文档:
### 1. 应用开发
**目的**: 创建在 DNAnexus 平台上运行的可执行程序(应用/小程序)。
**关键操作**:
- 使用 `dx-app-wizard` 生成应用骨架
- 编写带有正确入口点的 Python 或 Bash 应用
- 处理输入/输出数据对象
- 使用 `dx build` 或 `dx build --app` 进行部署
- 在平台上测试应用
**常见用例**:
- 生物信息学流水线(比对、变异检测)
- 数据处理工作流
- 质量控制和过滤
- 格式转换工具
**参考**: 请参阅 `references/app-development.md` 获取:
- 完整的应用结构和模式
- Python 入口点装饰器
- 使用 dxpy 进行输入/输出处理
- 开发最佳实践
- 常见问题及解决方案
### 2. 数据操作
**目的**: 管理平台上的文件、记录和其他数据对象。
**关键操作**:
- 使用 `dxpy.upload_local_file()` 和 `dxpy.download_dxfile()` 上传/下载文件
- 创建和管理带有元数据的记录
- 按名称、属性或类型搜索数据对象
- 在项目间克隆数据
- 管理项目文件夹和权限
**常见用例**:
- 上传测序数据 (FASTQ 文件)
- 组织分析结果
- 搜索特定样本或实验
- 在项目间备份数据
- 管理参考基因组和注释
**参考**: 请参阅 `references/data-operations.md` 获取:
- 完整的文件和记录操作
- 数据对象生命周期(打开/关闭状态)
- 搜索和发现模式
- 项目管理
- 批量操作
### 3. 作业执行
**目的**: 运行分析、监控执行并编排工作流。
**关键操作**:
- 启动