云计算henu雨课堂题库及部分课后答案
题库1
选择
-
Bigtable中,为了使主服务负载大大降低,客户端主要与 ()通信。
-
-
2.下列不属G o o g l e 云计算产 品的是()。 GFS MapReduce Bigtable SQL Azure √
-
3.弹性云计算服务EC2,是由 ()公司率先在全球范围内提 供服务。 Amazon
-
Paxos算法是为了解决 分布式系统的()问题。 —致性
-
-
Dynamo是 Amazon 的存储系统,该系统采用()方式存储数据。 键/值
-
-
6.将资源的抽象层次更进一 步,给用户提供应用程序的运行 环境,平台即服务是() PaaS
-
20.将硬件设备等基础资源封 装成服务提供给用户使用,基础 设施及服务的是() IaaS
-
7.云计算技术体系结构分为 ()、资源池层、管理中间件层和SOA构建层。 物理资源层
-
8.以下()文件系统采用廉价的商用机器构建,对硬件设施要求不高。 GFS(Google FS)
-
D y n a m o 中存储的是数据 值的原始形式,即按()存储,并 不解析数据的具体内容。 位
-
-
Google文件系统GFS中, 数据以()的形式存在于 Chunk Server上。 文 件
-
-
Map Reduce 中,Map 的输出结果是()。 键值对
-
-
Chubby是一种()锁 粗粒度建议性
-
-
Megastore的基本架构中, 最底层的数据存储在()中。 Bigtable
-
-
14.云计算是在2006年8月,由 ()公司首席执行官提出。 Google
-
Paxos算法中有三种类型 的节点,其中()节点负责提出 决议。 proposers
-
-
GFS使用()来实现对GFS Master服务器的选取。 Chubby
-
-
17.以下条件中,满足()三个条件可以保证 Paxos算法中数据的一致性。 ① 决议只有在被proposers提出后才能批准 ② 必须由acceptors节点批准决议 ③ 只有决议确定被批准后learners才能获取 这个决议 ④ 每次只批准一个决议 ①③④
-
Paxos算法中,负责批准 决议的节点是()。 acceptors
-
-
Bigtable是Google开发 的基于() 和Chubby的分布式 存储系统。 GFS
-
填空
-
1.云计算按照服务类型可以 分为[IaaS]、[PaaS]和[SaaS]三类。
-
MapReduce 中,Map 的输出结果是[键 值对]。
-
-
GFS的默认Chunk大小是[64MB].
-
-
Paxos算法中有三种类型 的节点,其中[proposers]节点提出 决议,[acceptors]节点批准决议,[learners]节点获取并使用已经通过 的决议。
-
-
5.云计算技术体系结构分为 (物理资源层 )、资源池层、管理中间件层和SO A构建层。
-
Bigtable 是 Google 开发的 基于[GFS]和[Chubby]的分布式存储系统
-
-
WAS的存储域包括[文件流层]、[分区层]和[前端]三层结 构。
-
-
BigTable是一个分布式多 维映射表,表中数据通过行关键 字,[列关键字],[时间戳]来进行索引。
-
-
SSTable是Google为 B i g t a b Ie设计的内部数据存储 格式,所有的SSTabl e文件都存 储在[GFS]上
-
-
Bigtable中的SSTable的 数量对读/写操作会有影响,如 果S STa b I e数量过多,将会显 著影响[读]操作的速度。
-
-
12.在用Map Reduce框架进 行编程的时候,我们使用[Map]函数来进行映射,使用[Reduce] 函数进行归并化简。
-
Megastore中,所有的表 分为两类,分別是:[实体组根表]和 [字表]
-
-
G F S 的设计实现了控制流 和[数据流]的分离。
-
-
Megastore事务中的写操 作采用了 [预写式日志],只有当所有 的操作都在日志中记录下后,写 操作才会对数据执行修改。
-
题库2
选择
-
Master是GFS的管理节点 它保存系统的(),负责整个文 件系统的管理。 元数据
-
-
Bigtable中,数据划分和负 载均衡的基本单位是()。 子表
-
-
3.以下描述中,B i g t a b l e 中 Chubby的主要作用不包括 (D)。 A.选取并保证同一时间内只有 —个主服务器 B.获取子表的位置信息 C.保存Bigtable的模式信息及访问控制列表 D.创建访问控制列表
-
4.在Dynamo中,可能出现一 个数据被多个节点同时更新的 情况,因无法保证数据的更新顺 序而导致数据冲突,这时采用了 ()解决该问题。 向量时钟技术
-
Bigtable中,实际的数据都 是以子表的形式保存在()中。 子表服务器
-
-
6.()决定了 Google文件系 统GFS的规模。 Chunk Server的数目
-
Bigtable 中SSTable 数量 过多,将会显著影响()的速度。 读操作
-
-
Megastore有三种读,其 中需要确保已提交的写操作已 经全部生效的读操作是()。 current
-
-
Bigtable通过()保存日志 和数据文件 GFS
-
-
Megastore中,在一次 C u r re n t读之前,要保证至少有 一 个副本上的数据是最新的,所 有之前提交到日志中的更新必 须复制到该副本上并确保在该 副本上生效,这个操作称为()。 追赶
-
-
Google云计算系统中的 监控基础架构称为()。 Dapper
-
-
12.以下不能为B i g t a b l e 表中 的数据进行索引的是()。 行关键字 列关键字 时间戳 锚点√
-
G o o g l e 的监控基础架构 中,为了尽可能地减少开销,采 用的方案是()。 二次抽样
-
-
1 4 . 为了保证稳定性, A m a z o n 的系统采用()的架构。 完全的分布式、去中心化
-
Dynamo采用(),解决数 据均衡分布的问题。 改进后的一致性哈希算法
-
-
Paxos算法中有三种类型 的节点,其中()节点负责批准 决议。 acceptors
-
-
B i g t a b l e 表中的数据是根 据()进行排序的,排序使用的 是词典序。 行关键字
-
-
Dynamo采用(),解决数 据冲突的问题。 向量时钟技术
-
-
Bigtable中数据划分和负载均衡的基本单位是()。 子表
-
-
20.以下描述正确的是()。 Amazon限制了用户在S3中创建桶的数量,没有限制每个桶中对象的数量
填空
-
WAS的存储域中,进行域内复制的是:[文件流层]。
-
-
Google云计算系统中的监 控基础架构称为[Dapper]。
-
-
Bigtable中,数据划分和负载均衡的基本单位是[子表]。
-
-
Megastore中,所有的子 表必须有一个通过[ENTITY GROUP KEY]声 明的、参照根表的[外键]。
-
-
Google云计算的监控系统 有三个设计目标,分别是[低开销]、[对应用层透明]和[可扩展性]
-
-
Google的监控基础架构中, 为了尽可能地减少开销,采用的方案是[二次抽样技术]
-
-
Windows Azure应用程序 包括Web Role Worker Role和VM Role三种实例,应 用通过:Web Role]与用户相互作用, 用[Worker Role]进行任务处理。
-
-
D y n a m o 中存储的是数据 值的原始形式,即按:[位]存 储,并不解析数据的具体内容。
-
-
Megasto re中,每个实体 有三种属性,分别是[必需的],[可选的],[可重复的]。
-
-
EC2中的实例由[AMI]启 动,可以像传统的主机一样提供 服务
-
-
SimpleDB和DynamoDB 中,限制了每张表的大小适合 小规模负载工作的是[SimpleDB]。
-
-
Windows Azure平台包括四个组成部分,其中云计算操作系统是[Windows Azure]
-
-
SQS的消息由四部分组成, 分别是:[消息ID]、[接收句柄]、[消息体]和[消息体MD5摘要]。
-
-
Bigtable中,访问控制的基本单位是[族]。
-
-
WAS的存储名空间中,负 责将访问请求定位到集群的是 [账户名],负责将访问请求定位 到存储节点的是[分区名]。
-
-
Dynamo采用[改进后的一致性哈希算法],解 决数据均衡分布的问题。
-
题库3
选择
-
GFS使用Chubby主要用 来() 选取一个GFS主服务器
-
-
2.关于 SimpleDB 和 DynamoDB,以下描述正确的 是()。 SimpleDB限制了每张表的大小,DynamoDB不限制每张表的大小
-
Megastore有三种读,其 中允许读的时彳矣还有部分事务 提交了但还未生效的是()。 snapshot
-
-
WAS的存储名空间中,负责 将访问请求定位到集群的是()。 账户名
-
-
A m a z o n 为解决云计算平 台之间不同组件的通信专门设 计开发的服务是()。 SQS
-
-
7.当虚拟机中的操作系统通 过特权指令访问关键系统资源 时,每条特权指令的执行都要产 生(),Hypervisior才能接管其请求。 自陷
-
Bigtable中访问控制的基 本单位是()。 族
-
-
9.关于寄居虚拟化,以下描述 正确的是()。 没有独立的Hypervisior层,需 要宿主操作系统
-
10.虚拟机的迁移过程中,最有 难度和挑战性的是()的迁移。 内存
-
11.虚拟机的迁移过程中,以共 享的方式共享数据和文件系统, 而非真正迁移的是()。 磁盘
-
Windows Azure平台包 括四个组成部分,其中为在云中或本地系统中的应用提供基于云的基础架构服务的是() AppFabric
-
-
WAS的存储名空间中,负 责将访问请求定位到存储节点 的是()。 分 区 名
-
-
AppFabric提供的服务 不包括() 服务总线 访问控制 高速缓存 报表服务√
-
-
15.关于WAS的文件流层, 以下说法正确的是() 流可以追加写,但不能修改现有的数据
填空
-
1.用户未接收到数据或者收到数据没有执行删除操作时,SQS将在队列中保留该消息, 为了保证其他组件不会看到用户的消息,采用的方法是[可见性超时值]
-
CDN中,DNS在对域名进行解析时不再向用户返回网站服务器的IP,而是返回了由智能 CDN负载均衡系统选定的某个 [边缘节点]的IP。
-
-
Windows Azure有四种主要的数据存储结构,分别是 [Table]、[Blob]、[Queue]和 [File]
-
-
4.数据中心的虚拟化包括[服务器虚拟化]、[存储虚拟化]和[网络虚拟化 ]。
-
VMM安装在宿主操作系统上的虚拟化技术是[寄居虚拟化]。
-
-
6.服务器中,有独立的 Hypervisior层,不需要宿主 操作系统的是[裸机虚拟化]。
-
7.解决某些x86特权指令在 低特权级上下文执行时不能产 生自陷的方案主要有[完全虚拟化技术] 和[半虚拟化技术]。
-
Megastore中共有三种副 本,分別是[完整副本]、[见证者副本]和 [只读副本]。
-
-
9.当虚拟机中的操作系统通 过特权指令访问关键系统资源时,每条特权指令的执行都要产生[自陷],Hypervisior才能接管其请求。
-
10.存储虚拟化是指将存储网 络中的各个分散且异构的存储 设备按照一定的策略映射成一 个统一的连续编址的逻辑存储 空间,称为[虚拟存储池]
-
11.实现存储虚拟化的方式主 要有三种,分别是基于[主机]、 [存储设备]和[网络]的存储虚拟 化。
-
Bigtable中,实际的数据都 是以子表的形式保存在[子表服务器] 中。
-
-
WAS的存储域中,专门为 硬件失效而设计的是[文件流层], 在大规模系统内这类失效比较 普遍;提供跨地域冗余来防止地域灾难的是:[分区层]
-
-
Windows Azure CDN 中,BI o b存放容器都被标记为 Private 或 Public READ,Windows Azure CDN 只能标记为[Public READ]容器上的 Blobs起作用。个
-
-
15.Megastore中在一次Current读之前要保证至少有一个副本上的数据是最新的,所有之前提交到日志中的更新必须复制到该副本上并确保在该副本上生效这个操作称为[追赶]。
-
SQL Azure数据库同步服务使用:[轮辐式]模型,所有的变 化首先被复制到SQL Azure数据库h u b上,然后再传送到其他 spoke上。
-
第二章
1.Google云计算技术包括哪些内容? 答题要点:(P13)要答出有关技术的分类和名称。
答: Google云计算技术包括:Goge分布式文件系统GFS,分布式计算编程模型 MapReduce, 分布式锁服务 Chubby,分布式结构化数据表 Bigtable,分布式存储系统 Megastore,分布式 监控系统 Dapper,数据交互分析工具 Dremel和 PowerDril,等等。
2.当前主流分布式文件系统有哪些?各有什么优缺点? 答题要点:(P13)此题的问法有些不完整,题义应该是问传统分布式文件系统的实现方法与 Google的分布式文件系统GFS的区别
答: Redhat、IBM、Sun等公司都有分布式文件系统的解决方案,这些解决方案依靠RAD技术、SAN存储区域网来容错(是基于硬件的容错),对构建分布式文件系统的硬件有较高的 要求,存储成本高。 Google的GFS是使用软件的方式,在文件系统上实现容错,可以使用廉价的机器构建,存储成本低。相对于传统的分布式文件系统, Google的GFS分布式文件系统的容错性能在可靠性和存储成本上都具有优势。
3.GFS采用了哪些容错措施来确保整个系统的可靠性? 答题要点:(P16-17)除了要把容错技术的名称答出来以外,还要简单说明机理。
答: Google的GFS采用的容错机制可以分为: (1) Master容错。 Master上保存着GFS的元数据(包括命名空间(Name)和 Chunk映射表等),这些元数据 及 Master的操作日志保存在磁盘中, Master出错时而磁盘数据完好时,可以通过磁盘数据 恢复 Master GFS对 Master进行远程实时备份,如果 Master彻底死机,另外一台 Master可以迅速接替其 工作。 (2) Chunk Server容错。 Chunk是GFS的数据块,一个 Chunk默认存储3个位于不同 Chunk Server的副本, Master 会检查 Chunk的副本数,在出现 Chunk副本丢失或不可恢复时, Master自动将该副本复制 到其他 Chunk Server。 另外, Chunk以文件的形式保存在 Chunk server, Chunk文件以Bock(64K)来划分,每一 个 Block对应一个32位的校验和, Chunk Server会检査数据和检验和,如果不匹配就返回错误。
4.MapReduce与传统的分布式程序设计相比有何优点? 答题要点:(P18)
答: MapReduce封装了并行处理、容错处理、本地化计算、负载均衡等细节,还提供了个简单而强大的接口。通过这个接口,可以把大尺度的计算自动地并发和分布执行,使编程变得非常容易。另外,MapReduce也具有较好的通用性,大量不同的问题都可以简单地通过MapReduce来解决。
5.Chubby的设计目标是什么? Paxos算法在 Chubby中起什么作用? 答题要点:(P24-27)
答: Chubby的设计目标主要有:(1)高可用性和高可靠性。(2)高扩展性。(3)支持粗粒 度的建议性锁服务。(4)服务信息的直接存储。(5)支持通报机制。(6)支持缓存机制。 Paxos算法在 Chubby中起到保证副本之间数据一致的作用( Chubby cel(单元)中的所有副本都要保持完全一致)
6.阐述 Bigtable的数据模型和系统架构。 答题要点:(P33-39)
Bigtable的数据模型是一个多维映射表,通过行关键字、列关键字和时间戳进行索引(定 位数据): (1)行。行关键字用于标识Bigtable中不同的行,可以是任意字符串,大小不能超过64KB。Bigtable中的数据是通过行关键字按字典序进行排序的。 (2)列。Bigtable中的 列,以列族进行组织,一个列关键字以“族名:列名”的形式表示,每个列族中的列属于同 种数据类型,并且访问控制( Access Control)是在列族上进行定义的。 (3)时间戳。用于在区别 Bigtable中数据的版本,同一个行、列定位的数据,可以根据设置保存具有不同时间戳的数据值。 Bigtable主要由三个部分组成:主服务器 Master server、子表服务器 Tablet Server和客户端 程序库( Client Library)。主服务器主要进行一些元数据操作以及子表服务器之间的负载调度 问题,子表服务器则以子表的形式(通过GFS以 SSTable类型文件)保存 Bigtable的数据, 个子表服务器负责存储若干个(通常100个左右)子表。访问 Bigtable服务需要使用 Bigtable 的客户端。
7.分布式存储系统 Megastore的核心技术是什么? 答题要点:(P47)
答: Megastore最核心的技术是复制。
8.大规模分布式系统的监控基础架构 Dapper关键技术是什么? 答题要点:(P56)
答: Dapper关键技术主要有两个方面:(1)轻量级的核心功能库。 Dapper的监控过程基本 对应用层透明。(2)二次抽样技术。利用二次抽样技术成功解决了低开销及广泛可部署性的 问题。
9.相比于行存储,列存储有哪些优点? 答题要点:(P62)
答:相对于行存储,列存储以属性为单位,每次存储一个属性。列存储的主要好处在于处理时只需要使用涉及的列数据,且列存储更有利于数据的压缩。
10.为什么 MapReduce不适合实时数据处理? 答题要点:(P61)
答: MapReduce是一种面向批处理的框架,在编写完成代码后,要提交到集群运行后才能 验证代码的正确性。如果代码有误需要修改,则需要返利修改一一运行—一验证。这种数据 探索( Data Exploration)的方式比较耗时。而传统的SQL查询则是交互式的,用户提交完自 己的请求后就可以在相对可以接受的时间内得到返回结果。
11.简单阐述 Dremel如何实现数据的无损表示。 答题要点:(P64)原理较复杂,简单说明一下就好。
答: Dreme采用嵌套模型,采用列存储,因此需要把存储的数据进行重组才能还原为记录 的形式。 Dreme的每一列会被存储为块的集合,每个块又包含重复深度和定义深度,根据 重复深度和定义深度确定相应块的字段值属于哪条记录的哪个字段。
第三章
1.在 Dynamo中添加一个新的节点时,原告各节点保存的数据是否需要改变?如果改变, 应该如何变化? 答案要点:(P92)
答:在 Dynamo中添加一个新的节点时,会使新节点的前驱节点保存的数据发生改变,原存 储在前驱节点上的部分数据会迁移到新节点上。而其他节点保存的数据不变。 同样,在删除节点时,被删除节点的数据会迁移到其前驱节点上,而对其他节点没有影响。
2.Merkle哈希树的创建需要较大的时间开销。频繁地重建 Merkle树会对系统造成很大的负担。假设 Merkle树的叶子节点表示的是数据分区的Hash值,请设计一个 Merkle树重建方 案,尽量减少 Merkle树的重建工作。 答案要点:(P9798)就是回答 Dynamo中永久性故障处理,如磁盘损坏等情况,需要重建 节点数据时,如何加快检测和减少数据传输量的机制。
答:把Merkle哈希树设计为二叉树或多叉树,其中每个节点叶子节点的值为单个数据文件的哈希值,非叶子节点的值为该节点所有子节点组合后的哈希值。当采用 Merkle哈希树检测数据是否一致时,可先比较根节点的值,如果值相同则说明所有数据一致,否则需要继续比较,直到哈希值不同的叶子节点。这种方法可以快速地进行数据对比,检测数据的一致性, 并大大减少了需要传输的数据量,提高了系统效率。
3.私有IP、公有IP和弹性IP的区别在哪里? 答案要点:(P101-103)
答:EC2的IP地址包括三大类:私有IP、公有IP和弹性P。EC2的实例一旦被创建,就会 动态地分配两个IP地址,即私有护P和公有IP。私有IP地址与实例相对应,由动态主机配置 协议(DHCP)分配产生。公有IP地址和私有IP地址之间通过网络地址转换(NAT)技术实 现相互之间的转换,实例通过这个公有IP地址和外界通信,实例每次启动时,公有IP都会 发生变化。弹性IP则是与用户账号绑定,使用时可以代替公有IP通过NAT的方式实现与私有IP转换,从而连接到EC2实例
4.地理区域和可用区域有哪些区别? 答案要点:(P100-101)
答:AWS中采用了两种区域(Zone),地理区域( Region Zone)和可用区域( Availability Zone) 地理区域是按实际的地理位置划分的。可用区域是根据是否有独立的供电系统和冷却系统划 分,通常将每个数据中心看作一个可用区域。EC2系统中包含多个地理区域,而每个地理区 域又包含多个可用区域。
5.简单存储服务S3与传统的文件系统有哪些区别? 答案要点:(P103-105)教材上没有直接给出答案,应该对比传统的文件系统的原理和特点来说明其区别
答:简单存储服务S3与传统的文件系统的区别有以下几个方面:(1)S3构架在 Dynamo上, 本身就具有分布式的特点,是容错的存储系统;(2)S3存储内容的分层结构与传统文件系 统不同,是以桶( Bucket)和对象( Object)作为其基本结构;(3)S3对数据内容的附加描 述信息可以是系统默认的元数据,也可以是用户指定的自定义元数据,而传统的文件系统则不具有这种灵活性。
6.简单阐述SQS在Amazon云计算中的作用。 答案要点:(P113)
答:由于想要构建一个灵活且可扩展的系统,低耦合度是很必要的。AWS中的各个组件就 是这样的一个低耦合度的系统,系统中的各个组件关联度很低,可以根据系统需要随时从系 统中增加或删除某些组件。组件之间的通信,就是由SQS解决的。SQS实现了AWS组件之 间安全、高效的通信,是云计算平台各个组件之间沟通的桥梁。
7.如何理解传统数据库在可扩展性方面的能力较弱? 答案要点:(P108)教材上没有直接给出答案,但可以根据基于分布式结构的数据库与传统数据库的区别进行分析
答:数据库的扩展,可以从存储能力和处理能力两个方面考虑。传统数据库系统如果需要扩 展存储能力,则需要迁移到空间更大的物理存储设备上(如更换更大的磁盘,等等);如需 要扩展处理能力,则需要把系统迁移到计算能力、数据吞吐能力更强的计算机上。这些迁移 工作,对于分布式系统的扩展只需要把服务器增加到集群中而言,是困难得多的工作。因此, 相比分布式系统,传统数据库在可扩展性方面的能力较弱。
8.非关系数据库是如何解决可扩展性问题的? 答案要点:(P108)应该要答出分布式系统的基本原理和特点
答:非关系数据库是建立在分布式文件系统(如GFS、 Dynamo等)的基础上的,而分布式 文件系统本身就是可扩展、容错的,因此,非关系数据库也具备这样的特性。另外,非关系 数据库还可以把表格划分成更小的部分(如:域),并通过散列把这些更小的部分分配到不同的元数据服务器进行管理,同时实现了负载均衡和横向可扩展性。
9.简述 Share- Nothing架构的特点。 答案要点:(P111)AWS关系数据库服务的架构特点。
答: Share- Nothing架构,即每台数据库服务器都是完全独立的计算机系统,通过网络相连, 不共享任何资源。当数据库处理能力不足时,可以通过增加服务器数量来提高处理能力,同 时也可以增加数据库的并发访问能力。把一张大表按归业务特点的需要,划分成多个小表, 分别存储到互不共享的独立服务器上。这个划分工作是要由人来开展的,对设计人员的要求 很高。
第四章
1.微软云计算平台包含几部分?每部分的作用是什么? 答案要点:(P136-137)
答:微软云计算平台包含4个部分:(1) Windows Azure。位于云计算平台的最底层,提供 一个在微软数据中心服务器上运行应用程序和存储数据的 Windows环境。(2) SQL Azure 云关系数据库,提供类似于 SQL Serer的云关系型数据库。(3) Windows Azure AppFabric。 为云中或本地系统中的应用程序提供基于云的基础架构服务。部署和管理云基础架构。(4) Windows Azure Marketplace。为购买云计算环境下的数据和应用提供在线服务。
2.Windows Azure存储服务提供了几种类型的存储方式?阐述每种存储方式主要的存储对象 答案要点:(P140)
答: Windows azure存储服务提供了4种主要的数据存储结构:(1)Blob数据类型存储二进 制数据,可以存储大型的无结构数据,容量巨大,能够满足海量数据存储需求;(2) Table 数据类型能够提供更加结构化的数据存储,但是它不同于关系数据库管理系统中的二维关系表,査询语言也不是SQL;(3)queue类型与微软消息队列(MSMQ)相近,用来支持在 Windows azure应用程序组件之间进行通信;(4)File类型使用标准SMB21(服务器信息 块协议,是一种IBM协议,用于在计算机间共享文件、打印机、串口等)协议提供文件共 享,可以在应用程序和虚拟机之间共享文件。
3.阐述 Web role实例和 Worker role实例之间的通信机制。 答案要点:(P139)先答两种实例的特点,再答通信机制。
答:(1)每个 Web Role实例都提前在内部安装了ⅢS7,可以很方便地创建Web应用程序。 (2) Worker role实例内部没有安装ⅢS7, Worker role设计用来运行各种各样的基于 Windows 的代码,比如运行一个模拟、进行视频处理等。(3)应用通过 Web role实例与用户进行交 互,然后利用 Worker role实例进行任务处理。
4.SQL Azure数据同步技术主要有几种?分别如何实现? 答案要点:(P152-153)先回答SQL Azure数据同步的涵义与作用,再回答 SQL Azure数据同步技术的种类和实现
答:为了提高存储数据的访问性能,同时确保网络发生故障时应用仍能够访问数据库,需要 在本地拥有SQL Azure的数据库副本,因此需要使用 SQL Azure数据同步技术。 SQL Azure数据同步技术主要包括两种:(1) SQL AZure数据库与 SQL Server数据库之间的数据同步;(2) SQL Azure数据库之间的同步,可以在全球的不同数据中心进行同步。 SQL Azure数据同步使 用“轮幅式(hub-and- spoke)”模式,所有的变化将会首先被复制到“hub”(必须是 SQL AZure 数据库)上,然后再传送到其他“ spoke”(可以是 SQL Azure数据库,也可以是本了 SQL Server 数据库)上。 SQL Azure数据同步的过程可以同步整个数据库,也可以只同步有更新的数据库表格。
5.阐述 SQL Azure和 SQL Server的相同点和不同点 答案要点:(P153-154)着重在于不同点,要简单说明一下各不同点。
答:相同点:都是关系数据库,都支持 Transact-SQL。不同点:(1)物理管理方面。 SQL AZure 的物理资源是自行管理的, SQL AZure不能使用 SQL Server的备份机制。(2)服务提供方面 SQL Server在使用时需要准备软件和硬件,并要进行安装和配置; SQL Azure的这些工作都由 SQL Azure服务程序来完成。(3) Transact-SQL支持方面。 SQL Server可以支持 Transact-SQL 的关于指定文件组或物理文件路径的参数,而 SQL AZure并不支持这些参数。(4)特征和数据类型方面。 SQL Azure不能支持 SQL Server所有的特征和数据类型。
6.AppFabric高速缓存技术是如何实现的? 答案要点:(P155-158)先答高速缓存的涵义,再简述其实现
答:应用程序在很多情况下需要重复访问存取同一个数据,为提升数据的访问效率,可以缓 存这些经常被访问的信息,减少查询数据库的次数。 AppFabric高速缓存提供了一种服务, 实现了这样的功能。 AppFabric高速缓存为 Windows azure应用程序提供了一个分布式缓存, 如果Windows azure应用程序需求的数据不在本地缓存中,则会连接高速缓存服务,从高速 缓存读取数据并更新本地缓存。