单选题 属于Python爬虫框架的是( )。
A、lxml
B、Scrapy
C、Requests
D、Beautiful Soup
单选题 有关Cookie机制的描述,错误的是( )。
A、服务器可通过Cookie识别用户身份
B、通过Cookie验证后无需重新提交表单
C、Cookie分为内存式和硬盘式两种存储方式
D、Cookie没有时效性限制
单选题 Scrapy框架中,负责接收start_urls中的请求并生成初始Request对象的组件是( )。
A、Downloader
B、Spider
C、Scheduler
D、Item Pipeline
单选题 在Beautiful Soup中,可通过CSS选择器语法查找节点的方法是( )。
A、find()
B、get()
C、select()
D、find_all()
单选题 下列不属于代理IP作用的是( )。
A、隐藏爬虫真实IP地址
B、避免爬虫IP被网站封禁
C、提高爬虫的请求速度
D、突破网站的IP访问限制
单选题 HTTP状态码中,提示请求资源不存在的是( )。
单选题 下列符合爬虫合规要求的行为是( )。
A、爬取用户隐私数据用于商业用途
B、无视Robots协议抓取网站数据
C、高频大量请求导致网站服务器瘫痪
D、遵守Robots协议并控制请求频率
单选题 关于MongoDB集合的说法,正确的是( )。
A、集合相当于关系数据库中的"表"
B、集合中的文档结构必须完全一致
C、集合不支持索引操作
D、集合无法存储嵌套结构的数据