什么是集群?
集群是使用某些互连网络连接的独立计算机的集合。集群中的每个节点都可以是工作站、个人计算机,甚至是多处理器系统。
节点是一台自主计算机,它可以从事其私有活动,同时在某些计算任务的上下文中与其他单元合作。每个节点都有其输入/输出系统和操作系统。
当集群中的所有节点具有相同的架构并运行相同的操作系统时,该集群称为同构集群,否则称为异构集群。互连网络可以是快速LAN或交换机。
为了实现高性能计算,互连网络必须提供高带宽和低延迟的通信。集群的节点可能一直专用于集群;因此可以在整个集群上进行计算。专用集群通常紧凑地封装在一个房间内。
专用集群通常使用高速网络,例如快速以太网和Myrinet。或者,互联网上不同个人拥有的节点只能在部分时间参与集群。在这种情况下,如果获得所有者的许可,集群可以利用每个参与节点的空闲CPU周期。
架构中的中间件层使集群在用户面前表现为一个单一的并行机器,称为单系统映像(SSI)。SSI基础设施通过支持多种功能提供对系统资源的统一访问,包括-
单入口点-用户可以连接到集群而不是特定节点。.
单一文件系统-用户看到目录和文件的单一层次结构。
用于管理的单个图像-从单个窗口管理整个集群。
协调资源管理-作业可以透明地竞争整个集群中的资源。
集群的主要目标是高可用性,中间件还将支持使集群服务能够在集群的所有节点之间从故障中恢复和容错的功能。
例如,中间件应该为检查点提供必要的基础设施。检查点方案确保定期保存进程状态。在节点故障的情况下,故障节点上的进程可以在另一个工作节点上重新启动。
评论列表