多选题以下哪些方法可以用于解析HTML网页？（）

A、（正则表达式）

B、（XPat

C、（CSS选择器）

D、（Beautiful Soup）

E、（requests）

由4l***9c提供分享举报纠错

相关试题

单选题 Beautiful Soup中，查找第一个class为"title"的span标签，正确的方法是：（）

A、（soup.find('span', class_='title')）

B、（soup.find_all('span', class='title')）

C、（soup.select('span.title')）

D、（soup.get('span', 'title')）

单选题使用Requests库发送GET请求时，携带查询参数应该使用哪个参数？（）

A、（dat

B、（json）

C、（params）

D、（headers）

单选题爬虫在访问网站时，应该首先查看什么文件来了解网站的爬取规则？（）

A、（index.html）

B、（robots.txt）

C、（sitemap.xml）

D、（confi

E、 ini）

单选题 HTTP状态码500表示什么？（）

A、（请求成功）

B、（资源不存在）

C、（服务器内部错误）

D、（权限不足）

单选题 XPath中，选择当前节点下所有div子元素的表达式是：（）

A、（//div）

B、（./div）

C、（div）

D、（/div）

单选题以下哪个不是常见的反爬虫手段？（）

A、（User-Agent验证）

B、（IP限制）

C、（Cookie验证）

D、（压缩传输数据）

单选题使用正则表达式匹配HTML标签时，以下哪个模式最合适？（）

A、（<.>）

B、（<.?>）

C、（<\w+>）

D、（<[^>]+>）

单选题以下哪个HTTP头部信息常用于标识客户端浏览器类型？（）

A、（Referer）

B、（User-Agent）

C、（Content-Typ

D、（Accept-Languag