单选题 在使用XPath解析HTML代码时,若要获取所有class属性值中包含 “item”的div节点中的文本信息,以下正确的表达式是()

A、 //div[@class="item"]/text()
B、 //div[contains(@class,"item")]/text()
C、 //div[@class~="item"]/text()
D、 //div[class="item"]/text()
下载APP答题
由4l***fx提供 分享 举报 纠错

相关试题

单选题 在使用Lxml库解析HTML文档时,将HTML字符串解析为可用于

XPath查询的对象的方法是()。

A、

etree.parse()

B、

etree.HTML

C、

etree.fromstring()

D、

etree.tostring()

单选题 在网络爬虫抓取网页的流程中,将IP地址和网页相对路径名称交给哪个组 件负责网页内容的下载?()

A、DNS服务器
B、网页下载器
C、待抓取URL队列
D、已抓取URL队列

单选题 政府或企业通过网络爬虫技术采集数据进行舆情分析与监测,以下哪个不 属于其常用的数据采集来源?()

A、电商平台商品评论
B、在线博客
C、新闻媒体
D、搜索引擎索引数据

单选题 urllib的哪个模块用于解析URL参数?

A、

urllib.request

B、

urllib.parse

C、

urllib.error

D、

urllib.robotparser

单选题 以下哪种爬虫主要用于将互联网中的网页下载到本地,形成互联网内容的 镜像备份?()

A、聚焦网络爬虫
B、通用网络爬虫
C、增量式网络爬虫
D、DeepWeb爬虫

单选题 以下XPath表达式中,能选取所有带有class属性的div节点的是()。

A、//div[@class]
B、//div[class]
C、//div/@class
D、//div[contains(@class,"")]

单选题 在编写爬虫代码时,为模拟请求发自浏览器而非爬虫,通常会在请求头中 加入()。

A、Cookie信息
B、User-Agent信息
C、Referer信息
D、Accept-Encoding信息

单选题 在使用BeautifulSoup库解析HTML页面时,若想获取页面中的注释内 容,应使用()对象。

A、Tag
B、NavigableString
C、Comment
D、Noneoftheabove