叶子多下载站:安全、绿色、免费的软件下载站!

叶子多首页|新闻资讯|软件分类|下载排行|最近更新

软件
软件
文章
当前位置:首页行业软件其他行业 → PiFlow(大数据流水线系统) v0.9官方版
PiFlow(大数据流水线系统)下载 v0.9官方版

PiFlow(大数据流水线系统) v0.9官方版

评分:6.9
下载地址
  • 软件介绍
  • 软件截图
  • 猜你喜欢
  • 同类推荐
  • 相关文章

PiFlow是一个简单易用,功能强大的大数据流水线系统,混合型科学大数据流水线系统,包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能!

软件特色

  简单易用

  可视化配置流水线

  监控流水线

  查看流水线日志

  检查点功能

  扩展性强:

  支持自定义开发数据处理组件

  性能优越:

  基于分布式计算引擎Spark开发

  功能强大:

  提供100+的数据处理组件

  包括Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等

  集成了微生物领域的相关算法

使用方法

  解压piflow-server-v0.9.tar.gz:

  tar -zxvf piflow-server-v0.9.tar.gz

  编辑配置文件config.properties

  运行、停止、重启PiFlow Server

  start.sh、stop.sh、 restart.sh、 status.sh

  测试 PiFlow Server

  设置环境变量 PIFLOW_HOME

  vim /etc/profile

  export PIFLOW_HOME=/yourPiflowPath/bin

  export PATH=PATH:PIFLOW_HOME/bin

  运行如下命令

  piflow flow start example/mockDataFlow.json

  piflow flow stop appID

  piflow flow info appID

  piflow flow log appID

  piflow flowGroup start example/mockDataGroup.json

  piflow flowGroup stop groupId

  piflow flowGroup info groupId

  如何配置config.properties

  #spark and yarn config

  spark.master=yarn

  spark.deploy.mode=cluster

  #hdfs default file system

  fs.defaultFS=hdfs://10.0.86.191:9000

  #yarn resourcemanager.hostname

  yarn.resourcemanager.hostname=10.0.86.191

  #if you want to use hive, set hive metastore uris

  #hive.metastore.uris=thrift://10.0.88.71:9083

  #show data in log, set 0 if you do not want to show data in logs

  data.show=10

  #server port

  server.port=8002

  #h2db port

  h2.port=50002

展开内容

软件截图

下载地址

  • PC版

推荐文章

用户评论

本类排行

  • 周排行
  • 月排行

关于本站 | 联系方式 | 发展历程 | 版权声明 | 下载帮助(?) | 广告联系 | 网站地图 | 友情链接

Copyright 2023 yeziduo.com 【叶子多下载站】 版权所有 蜀ICP备2022004054号

声明: 本站所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告