以下关于网络爬虫的描述中,错误的一项是-2021年微考职业资职考试题库及答案测试考试参考答案

题目出自:公需课题库网站(gongxuke.net

以下关于网络爬虫的描述中,错误的一项是

A、在爬虫开始的时候,需要给爬虫输送一个URL列表,作为爬虫的起始位置

B、根据某种抓取策略爬行新发现的URL,如此重复下去

C、爬虫程序会抓取所有网页,以保证搜索正确性

D、对于商业搜索引擎来说,分布式爬虫是必须采用的技术

正确答案:C

在向量模型中,不可以通过()来衡量文档和查询之间的相似度。

A、向量间距离

B、向量内积

C、向量间夹角大小

D、向量间正切值

正确答案:D,考试帮手薇xin[go2learn]

T1,T2,T3表示特征项,D1,D2,D3,D4为文档向量,Q为查询向量,其中,D1=4T1+2T2+3T3,D2=T1+4T2+2T3,D3=5T1+2T3,D4=T2+3T3,Q=T1+0T2+2T3。以上文档中和Q最大可能相关的是

A、1

B、2

C、3

D、4

正确答案:A

以下选项中属于概率模型的优点的是

A、模型具有内在的相关反馈机制,将文档根据相关概率按递减顺序排列

B、模型最初将文档分成相关的集合和不相关的集合

C、模型中所有的权值都是二值的

D、模型假设标引词相互独立

正确答案:A

假设一种基因同时导致两件事:(1)使人喜欢酗酒,(2)使这个人和肝癌就是()关系,而酗酒和肝癌是

A、因果相关

B、相关因果

C、并列相关

D、相关并列

正确答案:A,专业课助手weixin【go2learn_net】

医疗健康领域中大数据应用产业不包括

A、临床决策支持

B、个性化医疗

C、社保资金安全

D、用户行为分析

正确答案:D,华医网助手Weixin:《xzs9519》

智能健康手环的应用开发,体现了()的数据采集技术应用

A、PI接口

B、网络爬虫

C、传感器

D、PI接口

正确答案:C,小助理weixin:xzs9523

在实际的搜索引擎系统中,通过存储()来存储文档信息

A、文档地址

B、文档简化序号

C、文档编号

D、文档编号差值

正确答案:D

信息检索模型中,神经网络模型属于

A、布尔模型

B、向量模型

C、概率模型

D、结构化模型

正确答案:B

所有检索策略都包含三个要素,以下选项中不属于三要素的一项是

A、匹配函数

B、排序函数

C、文档表示

D、查询表示

正确答案:B