YSU大数据第二阶段:第1周周测

感谢您能抽出几分钟时间来参加本次答题,现在我们就马上开始吧!当然,如果你不做,也是可以。我也能给你满分,不行你可以试试吧。当然,你要记得最后要输入你的学号和姓名!

Q1:下述述flume作业配置文件实现的功能是:[图片]

使用Flume监听一个文件夹,收集文件夹的新增文件,并输出文件的内容到控制台。
使用Flume监听一个端口,收集该端口数据,并打印到控制台。
使用Flume监听一个可执行程序的运行结果,收集该程序的输出,并将输出复制到文件中。
使用Flume监听一个可执行程序的运行结果,收集该程序的输出,并将输出打印到控制台。

Q2:下述述flume作业配置文件实现的功能是:[图片]

使用Flume监听整个目录中的文件,并输出内容到控制台。
使用Flume监听目录实时追加文件,并保存到本地文件目录中。
使用Flume监听整个目录的实时追加文件,并上传至HDFS。
使用Flume监听指定端口接收的实时文件,并上传至HDFS。

Q3:下述述flume作业配置文件实现的功能是:[图片]

使用Flume-1监控文件变动,将结果分别传给master01的6666端口、slave01的8888端口。
使用Flume-1监控master01的6666、slave01的8888的端口,并将获取的数据传给监控的文件。
使用Flume-1监控文件变动,将结果通过指定的tail_dir.json文件分别传给master01的6666端口、slave01的8888端口。
使用Flume-1监控master01的6666、slave01的8888的端口,借助文件tail_dir.json将获取的数据传给指定的通道c1和c2。

Q4:Robots主要包括

Spider
robots.txt
The DataBases
HttpClient
HTML
Crawler
Indexer
Table
HDFS
HBase
Search Engine Results Engine

Q5:下述Hadoop生态组件中,实时数据分析中可能涉及的工具有:

Spider
Flume
Kafka
HDFS
Hive
HBase
Spark
Flinks
Storm
ECharts
MapReduce
Google Bigtable

Q6:请简述 Flume 使用场景。

填空

Q7:简述 Flume 与 Kafka 的选用依据?

填空

Q8:Flume的基础架构有哪些组件,简述各自的作用。

填空

Q9:ExecSource、Spooldir Source的区别?

填空

Q10:什么是 Channel 的复制和多路复用?

填空

Q11:请输入你的学号和姓名

填空
问卷网
YSU大数据第二阶段:第1周周测
关于
1年前
更新
0
频次
11
题目数
分享