2020-02-08 13:11 已编辑北京航空航天大学 Java

关注

NextFlow-基本概念

1 基本概念

Nextflow是一个反应式工作流框架和一个编程DSL ，可简化数据密集型计算管道的编写。

它是基于Linux平台是数据科学的通用语言这一思想而设计的。Linux提供了许多简单但功能强大的命令行和脚本工具，将它们链接在一起时，便可以简化复杂的数据操作。

Nextflow扩展了这种方法，增加了基于数据流编程模型定义复杂程序交互和高级并行计算环境的能力。

2 Processes (进程)和 channels （通道）

在实践中，通过将不同的进程结合在一起来制作Nextflow管道脚本。可以用Linux平台可以执行的任何脚本语言（Bash，Perl，Ruby，Python等）编写每个进程。

进程是独立执行的并且彼此隔离，即它们不共享公共（可写）状态。他们唯一可以通信的方法是通过异步FIFO队列，在Nextflow中称为通道。

任何进程都可以将一个或多个通道定义为输入和输出。这些进程之间的交互以及最终的管道执行流本身，都是由这些输入和输出声明隐式定义的。

Nextflow脚本如下所示：

// Script parameters
params.query = "/some/data/sample.fa"
params.db = "/some/path/pdb"

db = file(params.db)
query_ch = Channel.fromPath(params.query)

process blastSearch {
    input:
    file query from query_ch

    output:
    file "top_hits.txt" into top_hits_ch

    """ blastp -db $db -query $query -outfmt 6 > blast_result cat blast_result | head -n 10 | cut -f 2 > top_hits.txt """
}

process extractTopHits {
    input:
    file top_hits from top_hits_ch

    output:
    file "sequences.txt" into sequences_ch

    """ blastdbcmd -db $db -entry_batch $top_hits > sequences.txt """
}

上面的示例定义了两个过程。它们的执行顺序不是由blastSearch进程先于脚本中的extractTopHits这一事实决定的(也可以反过来写)。

相反，因为第一个进程top_hits_ch在其输出声明中extractTopHits定义了通道，并且该进程在其输入声明中定义了通道，所以建立了通信链接。

通过通道进行的链接意味着extractTopHits正在等待blastSearch的输出，然后在通道具有内容时进行反应式运行。

3 执行抽象

虽然流程定义必须执行什么命令或脚本，但执行程序确定脚本在目标系统上的实际运行方式。

如果未另行指定，则在本地计算机上执行处理。本地执行程序对于管道开发和测试目的非常有用，但是对于现实世界的计算管道，通常需要HPC或云平台。

换句话说，Nextflow在管道的功能逻辑和底层执行系统之间提供了一种抽象。因此，只需在配置文件中定义目标执行平台，就可以一次编写管道并在您的计算机，网格平台或云上无缝运行它，而无需对其进行修改。

支持以下批处理调度程序：

Open grid engine
Univa grid engine
Platform LSF
Linux SLURM
PBS Works
Torque
HTCondor

4 脚本语言

Nextflow被设计为具有最小的学习曲线，而无需学习新的编程语言。在大多数情况下，用户可以利用他们当前的技能来开发Nextflow工作流。但是，它也提供了功能强大的脚本DSL。

Nextflow脚本是Groovy编程语言的扩展，而后者又是Java编程语言的超集。Groovy可以被视为Java的Python，因为它简化了代码编写，并且更加易于使用。

阅读Nextflow脚本部分，以了解Nextflow脚本语言。

5 配置选项

管道配置属性nextflow.config在管道执行目录中命名的文件中定义。

该文件可用于定义要使用的执行程序，流程的环境变量，管道参数等。

基本配置文件可能如下所示：

process {
  executor='sge'
  queue = 'cn-el6'
}

全部评论

推荐最新楼层

04-02 17:18

科大讯飞_教育BG_后端开发(准入职员工)

AI Coding实战技巧

提示词首先是提示词编写，可以套用模板1. 基础代码生成模板 请用【语言/框架】编写【功能名称】 要求： 1. 输入：【明确输入参数/数据】 2. 输出：【明确输出格式/结果】 3. 约束：【简洁/注释完整/无冗余/兼容XX版本】 4. 额外：【添加测试用例/错误处理/日志】 2. 代码修复 / 排查模板 这是我的【语言】代码，运行时报错【错误信息】 代码： 【粘贴代码】 请： 1. 定位错误原因 2. 给出完整可运行的修复代码 3. 解释修改点和原理 3. 代码优化 / 重构模板 请优化这段【语言】代码，目标： 1. 提升可读性/性能/可维护性 2. 符合行业最佳实践 3. 保留原有所有功能 ...

点赞评论收藏

03-30 14:45

福州大学 Java

字节飞书二面凉经......

面试内容：1.使用过飞书吗，都是在哪些场景2.介绍一下TCP三次握手3.对DDoS了解吗？（根本没听过，然后我反问他让他介绍一下是什么（分布式的拒绝服务的攻击），我说有点像中间人攻击）4.中间人攻击是什么？根据我的介绍，你觉得DDoS和中间人攻击的区别在于什么？5.针对中间人攻击的怎么进行防御（我讲了https的加密握手）6.又绕回来了这个DDos攻击，怎么实现比较高效呢。（根本不会我就一直瞎扯）7.然后说这个DDos是想让服务拒绝提供正常的服务，怎么让服务端拒绝提供服务呢？（我回答了而已刷接口流量之类的，然后他觉得一直没get到他的点，就pass这个问题了，然后我反问才得知要从内存、计算资源...

纳斯卡可：这算法题太经典了

查看12道真题和解析

点赞评论收藏

03-16 22:49

武汉轻工大学人工智能

双非垃圾简历求提意见

0实习，春招能拿到offer吗，  孩子要哭了🥹🥹

今天你投了哪些公司？

点赞评论收藏

03-31 18:29

中央美术学院附属中等美术学校 Java

3月总结-AI时代我们该咋办

2.28 考研分数出来就感觉有点悬进复试有点难 于是开始准备春招，寒假其实也在学一点开发的东西和准备简历。但欠缺的东西还是很多。3.6 经过几天的思考和情况观测，感觉在复试线边缘准备开始投递春招和准备复试开始也是很焦虑吧，不知道未来在哪里，到底要去干啥，一直背八股了解项目。中间过程最难受的就是做测评吧，非常消耗时间而且好多家都是一样的题目，感觉像吃了shi一样。到目前为止投了大概500+，实际简历到hr手中的可能100左右，面试6家企业，这周还有四家，已经oc 2个外包。具体面筋可以看我主页，我也是第一次面试吧从3月中旬收到第一家开始，感觉也是非常紧张，最后反问面试官也说我有点紧张，加强一下表...

26届求职交流

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 面试被问到不会的问题，你怎么应对？ #

# 你都用vibe coding做过什么？ #

# 如果人生可以debug你会改哪一行? #

10387次浏览 145人参与

# Claude Code泄露源码 #

13712次浏览 188人参与

# Vibe Coding 会干掉初级岗位吗？ #

20424次浏览 213人参与

# 恒生电子笔试 #

20229次浏览 156人参与

# 大厂实习和小厂实习最大的区别是什么？ #