单选题 您的金融服务公司正在转向云技术,并希望在云中存储 50 TB 的金融时间序列数据。该数据经常更新,新数据将一直流入。您的公司还希望将其现有的 Apache Hadoop 作业迁移到云中以深入了解这些数据。
他们应该使用哪种产品来存储数据?

A、 云大表
B、 谷歌大查询
C、 谷歌云存储
D、 谷歌云数据存储
下载APP答题
由4l***8q提供 分享 举报 纠错

相关试题

单选题 您在 Google Data Studio 360 中为您的大型团队创建了一份重要报告。该报告使用 Google BigQuery 作为其数据源。您注意到可视化不显示小于 1 小时的数据。你该怎么办?

A、 通过编辑报告设置禁用缓存。
B、 通过编辑表详细信息禁用 BigQuery 中的缓存。
C、 刷新显示可视化效果的浏览器选项卡。
D、 清除过去一小时的浏览器历史记录,然后重新加载显示虚拟化的选项卡。

单选题 您的天气应用程序每 15 分钟查询一次数据库以获取当前温度。前端由 Google App Engine 提供支持,并为数百万用户提供服务。您应该如何设计前端以响应数据库故障?

A、 发出重新启动数据库服务器的命令。
B、 使用指数退避重试查询,最多 15 分钟。
C、 每秒重试一次查询,直到它重新联机,以最大限度地减少数据的陈旧性。
D、 将查询频率降低到每小时一次,直到数据库重新联机。

单选题 你正在创建一个模型来预测房价。由于预算限制,您必须在单个资源受限的虚拟机上运行它。你应该使用哪种学习算法?

A、 线性回归
B、物流分类
C、 递归神经网络
D、 前馈神经网络

单选题 贵公司构建了一个具有大量神经元和层的TensorFlow中性网络模型。该模型非常适合训练数据。然而,当针对新数据进行测试时,它表现不佳。你可以采用什么方法来解决这个问题?

A、线程
B、连载
C、 Dropout 方法
D、 降维

单选题 .您设计了一个患者记录数据库作为试点项目,以覆盖三个诊所的数百名患者。您的设计使用单个数据库表来表示所有患者及其就诊,并且您使用自连接来生成报告。服务器资源利用率为 50%。从那时起,该项目的范围不断扩大。数据库现在必须存储 100 倍以上的患者记录。您无法再运行这些报告,因为它们要么花费太长时间,要么遇到计算资源不足的错误。您应该如何调整数据库设计?

A、 按 200 的数量级向数据库服务器添加容量(内存和磁盘空间)。
B、 根据日期范围将表分成更小的表,并且仅生成具有预先指定的日期范围的报告。
C、 将主病历表规范化为患者表和访问表,并创建其他必要的表以避免自连接。
D、 将表格分成较小的表格,每个诊所一张。针对较小的表对运行查询,并使用合并报告的联合。

单选题 外部客户向您提供他们数据库中的每日数据转储。数据以逗号分隔值的形式流入 Google Cloud Storage GCS
(CSV) 文件。您想要在 Google BigQuery 中分析此数据,但数据可能包含格式不正确或已损坏的行。您应该如何构建此管道?

A、 使用联合数据源,并在 SQL 查询中检查数据。
B、 在 Google Stackdriver 中启用 BigQuery 监控并创建警报。
C、 使用 gcloud CLI 将数据导入 BigQuery 并将 max_bad_records 设置为 0。
D、 运行 Google Cloud Dataflow 批处理管道将数据导入 BigQuery,并将错误推送到另一个死信表进行分析。

单选题 你正在建立一个模型来推荐服装。您知道用户的时尚偏好可能会随着时间而改变,因此您构建了一个数据管道,以便在新数据可用时将其流回模型。你应该如何使用这些数据来训练模型?

A、 只在新数据上不断地重新训练模型。
B、 在现有数据和新数据的组合上不断地重新训练模型。
C、 在现有数据上训练,同时使用新数据作为测试集。
D、 在使用现有数据作为测试集的同时对新数据进行训练。

单选题 您正在为您的公司构建新的实时数据仓库,并将使用 Google BigQuery 流式插入。不能保证数据只会发送一次,但您确实为每行数据和事件时间戳提供了唯一的 ID。您希望确保在交互式查询数据时不包含重复项。您应该使用哪种查询类型?

A、 在时间戳列上包括 ORDER BY DESK 和 LIMIT 到 1。
B、 在唯一 ID 列和时间戳列上使用 GROUP BY,在值上使用 SUM。
C、 通过唯一 ID 和 WHERE LAG IS NOT NULL 将 LAG 窗口函数与 PARTITION 一起使用。
D、 通过唯一 ID 以及 WHERE 行等于 1,将 ROW_NUMBER 窗口函数与 PARTITION 一起使用。